簡(jiǎn)體: 簡(jiǎn)體中文 English

尚品與山東真諾智能設(shè)備有限公司簽署網(wǎng)站改版合作協(xié)議

類型：尚品動(dòng)態(tài) 了解更多

首頁(yè)/ 新聞/ 網(wǎng)站建設(shè) /正文

搜索引擎支持哪些Robots Meta標(biāo)簽

來(lái)源：尚品中國(guó)| 類型：網(wǎng)站百科| 時(shí)間：2019-10-18

搜索引擎支持nofollow和noarchive。

　　禁止搜索引擎收錄的方法

　　1. 什么是robots.txt文件?搜索引擎使用spider程序自動(dòng)訪問(wèn)互聯(lián)網(wǎng)上的網(wǎng)頁(yè)并獲取網(wǎng)頁(yè)信息。spider在訪問(wèn)一個(gè)網(wǎng)站時(shí)，會(huì)首先會(huì)檢查該網(wǎng)站的根域下是否有一個(gè)叫做 robots.txt的純文本文件，這個(gè)文件用于指定spider在您網(wǎng)站上的抓取范圍。您可以在您的網(wǎng)站中創(chuàng)建一個(gè)robots.txt，在文件中聲明該網(wǎng)站中不想被搜索引擎收錄的部分或者指定搜索引擎只收錄特定的部分。

　　請(qǐng)注意，僅當(dāng)您的網(wǎng)站包含不希望被搜索引擎收錄的內(nèi)容時(shí)，才需要使用robots.txt文件。如果您希望搜索引擎收錄網(wǎng)站上所有內(nèi)容，請(qǐng)勿建立robots.txt文件。

　　2. robots.txt文件放在哪里?robots.txt文件應(yīng)該放置在網(wǎng)站根目錄下。舉例來(lái)說(shuō)，當(dāng)spider訪問(wèn)一個(gè)網(wǎng)站(比如 http://www.abc.com)時(shí)，首先會(huì)檢查該網(wǎng)站中是否存在http://www.abc.com/robots.txt這個(gè)文件，如果 Spider找到這個(gè)文件，它就會(huì)根據(jù)這個(gè)文件的內(nèi)容，來(lái)確定它訪問(wèn)權(quán)限的范圍。

　　網(wǎng)站 URL 相應(yīng)的 robots.txt的 URL

　　http://www.w3.org/ http://www.w3.org/robots.txt

　　http://www.w3.org:80/ http://www.w3.org:80/robots.txt

　　http://www.w3.org:1234/ http://www.w3.org:1234/robots.txt

　　http://w3.org/ http://w3.org/robots.txt

　　3. 我在robots.txt中設(shè)置了禁止搜索引擎跟收錄我網(wǎng)站的內(nèi)容，為何還出現(xiàn)在搜索引擎跟搜索結(jié)果中?如果其他網(wǎng)站鏈接了您robots.txt文件中設(shè)置的禁止收錄的網(wǎng)頁(yè)，那么這些網(wǎng)頁(yè)仍然可能會(huì)出現(xiàn)在搜索引擎跟的搜索結(jié)果中，但您的網(wǎng)頁(yè)上的內(nèi)容不會(huì)被抓取、建入索引和顯示，搜索引擎跟搜索結(jié)果中展示的僅是其他網(wǎng)站對(duì)您相關(guān)網(wǎng)頁(yè)的描述。

　　4. 禁止搜索引擎跟蹤網(wǎng)頁(yè)的鏈接，而只對(duì)網(wǎng)頁(yè)建索引如果您不想搜索引擎追蹤此網(wǎng)頁(yè)上的鏈接，且不傳遞鏈接的權(quán)重，請(qǐng)將此元標(biāo)記置入網(wǎng)頁(yè)的部分：

　　如果您不想搜索引擎跟追蹤某一條特定鏈接，搜索引擎跟還支持更精確的控制，請(qǐng)將此標(biāo)記直接寫(xiě)在某條鏈接上：sign in

　　要允許其他搜索引擎跟蹤，但僅防止搜索引擎跟跟蹤您網(wǎng)頁(yè)的鏈接，請(qǐng)將此元標(biāo)記置入網(wǎng)頁(yè)的部分：

　　5. 禁止搜索引擎在搜索結(jié)果中顯示網(wǎng)頁(yè)快照，而只對(duì)網(wǎng)頁(yè)建索引要防止所有搜索引擎顯示您網(wǎng)站的快照，請(qǐng)將此元標(biāo)記置入網(wǎng)頁(yè)的部分：

　　要允許其他搜索引擎顯示快照，但僅防止搜索引擎跟顯示，請(qǐng)使用以下標(biāo)記：

　　注：此標(biāo)記只是禁止搜索引擎跟顯示該網(wǎng)頁(yè)的快照，搜索引擎跟會(huì)繼續(xù)為網(wǎng)頁(yè)建索引，并在搜索結(jié)果中顯示網(wǎng)頁(yè)摘要。

　　6. 我想禁止百度圖片搜索收錄某些圖片，該如何設(shè)置?禁止Baiduspider抓取網(wǎng)站上所有圖片、禁止或允許Baiduspider抓取網(wǎng)站上的某種特定格式的圖片文件可以通過(guò)設(shè)置robots實(shí)現(xiàn)，請(qǐng)參考“robots.txt文件用法舉例”中的例10、11、12。

　　7. robots.txt文件的格式"robots.txt"文件包含一條或更多的記錄，這些記錄通過(guò)空行分開(kāi)(以CR,CR/NL, or NL作為結(jié)束符)，每一條記錄的格式如下所示：":"

　　在該文件中可以使用#進(jìn)行注解，具體使用方法和UNIX中的慣例一樣。該文件中的記錄通常以一行或多行User-agent開(kāi)始，后面加上若干Disallow和Allow行,詳細(xì)情況如下：

　　User-agent:

　　該項(xiàng)的值用于描述搜索引擎robot的名字。在"robots.txt"文件中，如果有多條User-agent記錄說(shuō)明有多個(gè)robot會(huì)受到"robots.txt"的限制，對(duì)該文件來(lái)說(shuō)，至少要有一條User-agent記錄。如果該項(xiàng)的值設(shè)為*，則對(duì)任何robot均有效，在"robots.txt"文件中，"User-agent:*"這樣的記錄只能有一條。如果在"robots.txt"文件中，加入"User- agent:SomeBot"和若干Disallow、Allow行，那么名為"SomeBot"只受到"User-agent:SomeBot"后面的 Disallow和Allow行的限制。

　　Disallow:

　　該項(xiàng)的值用于描述不希望被訪問(wèn)的一組URL，這個(gè)值可以是一條完整的路徑，也可以是路徑的非空前綴，以Disallow項(xiàng)的值開(kāi)頭的URL不會(huì)被 robot訪問(wèn)。例如"Disallow:/help"禁止robot訪問(wèn)/help.html、/helpabc.html、/help /index.html，而"Disallow:/help/"則允許robot訪問(wèn)/help.html、/helpabc.html，不能訪問(wèn) /help/index.html。"Disallow:"說(shuō)明允許robot訪問(wèn)該網(wǎng)站的所有url，在"/robots.txt"文件中，至少要有一條Disallow記錄。如果"/robots.txt"不存在或者為空文件，則對(duì)于所有的搜索引擎robot，該網(wǎng)站都是開(kāi)放的。

　　Allow:

　　該項(xiàng)的值用于描述希望被訪問(wèn)的一組URL，與Disallow項(xiàng)相似，這個(gè)值可以是一條完整的路徑，也可以是路徑的前綴，以Allow項(xiàng)的值開(kāi)頭的URL 是允許robot訪問(wèn)的。例如"Allow:/hibaidu"允許robot訪問(wèn)/hibaidu.htm、/hibaiducom.html、 /hibaidu/com.html。一個(gè)網(wǎng)站的所有URL默認(rèn)是Allow的，所以Allow通常與Disallow搭配使用，實(shí)現(xiàn)允許訪問(wèn)一部分網(wǎng)頁(yè) 同時(shí)禁止訪問(wèn)其它所有URL的功能。

　　使用"*"and"$"：

　　Baiduspider支持使用通配符"*"和"$"來(lái)模糊匹配url。

　　"$" 匹配行結(jié)束符。

　　"*" 匹配0或多個(gè)任意字符。

　　8. URL匹配舉例Allow或Disallow的值 URL 匹配結(jié)果

　　/tmp /tmp yes

　　/tmp /tmp.html yes

　　/tmp /tmp/a.html yes

　　/tmp /tmp no

　　/tmp /tmphoho no

　　/Hello* /Hello.html yes

　　/He*lo /Hello,lolo yes

　　/Heap*lo /Hello,lolo no

　　html$ /tmpa.html yes

　　/a.html$ /a.html yes

　　htm$ /a.html no

　　9. robots.txt文件用法舉例例1. 禁止所有搜索引擎訪問(wèn)網(wǎng)站的任何部分

　　下載該robots.txt文件 User-agent: *

　　Disallow: /

　　例2. 允許所有的robot訪問(wèn)

　　(或者也可以建一個(gè)空文件 "/robots.txt") User-agent: *

　　Allow: /

　　例3. 僅禁止Baiduspider訪問(wèn)您的網(wǎng)站 User-agent: Baiduspider

　　Disallow: /

　　例4. 僅允許Baiduspider訪問(wèn)您的網(wǎng)站 User-agent: Baiduspider

　　Allow: /

　　User-agent: *

　　Disallow: /

　　例5. 僅允許Baiduspider以及Googlebot訪問(wèn) User-agent: Baiduspider

　　Allow: /

　　User-agent: Googlebot

　　Allow: /

　　User-agent: *

　　Disallow: /

　　例6. 禁止spider訪問(wèn)特定目錄

　　在這個(gè)例子中，該網(wǎng)站有三個(gè)目錄對(duì)搜索引擎的訪問(wèn)做了限制，即robot不會(huì)訪問(wèn)這三個(gè)目錄。需要注意的是對(duì)每一個(gè)目錄必須分開(kāi)聲明，而不能寫(xiě)成 "Disallow: /cgi-bin/ /tmp/"。 User-agent: *

　　Disallow: /cgi-bin/

　　Disallow: /tmp/

　　Disallow: /~joe/

　　例7. 允許訪問(wèn)特定目錄中的部分url User-agent: *

　　Allow: /cgi-bin/see

　　Allow: /tmp/hi

　　Allow: /~joe/look

　　Disallow: /cgi-bin/

　　Disallow: /tmp/

　　Disallow: /~joe/

　　例8. 使用"*"限制訪問(wèn)url

　　禁止訪問(wèn)/cgi-bin/目錄下的所有以".htm"為后綴的URL(包含子目錄)。 User-agent: *

　　Disallow: /cgi-bin/*.htm

　　例9. 使用"$"限制訪問(wèn)url

　　僅允許訪問(wèn)以".htm"為后綴的URL。 User-agent: *

　　Allow: /*.htm$

　　Disallow: /

　　例10. 禁止訪問(wèn)網(wǎng)站中所有的動(dòng)態(tài)頁(yè)面 User-agent: *

　　Disallow: /*?*

　　例11. 禁止Baiduspider抓取網(wǎng)站上所有圖片

　　僅允許抓取網(wǎng)頁(yè)，禁止抓取任何圖片。 User-agent: Baiduspider

　　Disallow: /*.jpg$

　　Disallow: /*.jpeg$

　　Disallow: /*.gif$

　　Disallow: /*.png$

　　Disallow: /*.bmp$

　　例12. 僅允許Baiduspider抓取網(wǎng)頁(yè)和.gif格式圖片

　　允許抓取網(wǎng)頁(yè)和gif格式圖片，不允許抓取其他格式圖片 User-agent: Baiduspider

　　Allow: /*.gif$

　　Disallow: /*.jpg$

　　Disallow: /*.jpeg$

　　Disallow: /*.png$

　　Disallow: /*.bmp$

　　例13. 僅禁止Baiduspider抓取.jpg格式圖片 User-agent: Baiduspider

　　Disallow: /*.jpg$

來(lái)源聲明：本文章系尚品中國(guó)編輯原創(chuàng)或采編整理，如需轉(zhuǎn)載請(qǐng)注明來(lái)自尚品中國(guó)。以上內(nèi)容部分(包含圖片、文字)來(lái)源于網(wǎng)絡(luò)，如有侵權(quán)，請(qǐng)及時(shí)與本站聯(lián)系（010-60259772）。

上一篇：網(wǎng)站建設(shè)中需要避免的幾條建議下一篇：網(wǎng)頁(yè)設(shè)計(jì)是創(chuàng)建網(wǎng)站的過(guò)程

TAG標(biāo)簽：

建站流程

網(wǎng)站需求
網(wǎng)站策劃方案
頁(yè)面設(shè)計(jì)風(fēng)格
確認(rèn)交付使用
資料錄入優(yōu)化
程序設(shè)計(jì)開(kāi)發(fā)
后續(xù)跟蹤服務(wù)
聯(lián)系電話
010-60259772

預(yù)約專業(yè)咨詢顧問(wèn)溝通！

免責(zé)聲明

非常感謝您訪問(wèn)我們的網(wǎng)站。在您使用本網(wǎng)站之前，請(qǐng)您仔細(xì)閱讀本聲明的所有條款。

1、本站部分內(nèi)容來(lái)源自網(wǎng)絡(luò)，涉及到的部分文章和圖片版權(quán)屬于原作者，本站轉(zhuǎn)載僅供大家學(xué)習(xí)和交流，切勿用于任何商業(yè)活動(dòng)。

2、本站不承擔(dān)用戶因使用這些資源對(duì)自己和他人造成任何形式的損失或傷害。

3、本聲明未涉及的問(wèn)題參見(jiàn)國(guó)家有關(guān)法律法規(guī)，當(dāng)本聲明與國(guó)家法律法規(guī)沖突時(shí)，以國(guó)家法律法規(guī)為準(zhǔn)。

4、如果侵害了您的合法權(quán)益，請(qǐng)您及時(shí)與我們,我們會(huì)在第一時(shí)間刪除相關(guān)內(nèi)容!

聯(lián)系方式：010-60259772
電子郵件：394588593@qq.com

高校集群解決方案

強(qiáng)軍網(wǎng)建設(shè)解決方案

政府事業(yè)解決方案

智慧會(huì)展解決方案

科研領(lǐng)域解決方案

智慧景區(qū)解決方案

海外房產(chǎn)解決方案

網(wǎng)站建設(shè)

小程序

移動(dòng)互聯(lián)網(wǎng)

網(wǎng)絡(luò)營(yíng)銷

VI設(shè)計(jì)

尚品與山東真諾智能設(shè)備有限公司簽署網(wǎng)站改版合作協(xié)議

搜索引擎支持哪些Robots Meta標(biāo)簽

建站流程

網(wǎng)站需求

網(wǎng)站策劃方案

頁(yè)面設(shè)計(jì)風(fēng)格

確認(rèn)交付使用

資料錄入優(yōu)化

程序設(shè)計(jì)開(kāi)發(fā)

后續(xù)跟蹤服務(wù)

熱門(mén)標(biāo)簽

最新文章

企業(yè)如何做好外貿(mào)網(wǎng)站建設(shè)的規(guī)劃？

外貿(mào)網(wǎng)站建設(shè)的知識(shí)點(diǎn)

如何做好出海網(wǎng)站規(guī)劃

推薦新聞

網(wǎng)站設(shè)計(jì)公司為什么值得信賴？服務(wù)專業(yè)嗎？

電子政務(wù)網(wǎng)站運(yùn)營(yíng)及管理

怎樣做網(wǎng)站設(shè)計(jì)才更有時(shí)代感？

信息技術(shù)對(duì)醫(yī)療保障體系起著至關(guān)重要的作用

程序的三種基本結(jié)構(gòu)

可以繼續(xù)使用HTML來(lái)設(shè)計(jì)網(wǎng)頁(yè)嗎

預(yù)約專業(yè)咨詢顧問(wèn)溝通！

免責(zé)聲明

電話咨詢

在線咨詢

微信咨詢

現(xiàn)在就與專業(yè)咨詢顧問(wèn)溝通！

免責(zé)聲明

網(wǎng)站設(shè)計(jì)公司為什么值得信賴？服務(wù)專業(yè)嗎？

怎樣做網(wǎng)站設(shè)計(jì)才更有時(shí)代感？

預(yù)約專業(yè)咨詢顧問(wèn)溝通！