例1. 禁止所有搜索引擎訪問(wèn)網(wǎng)站的任何部分
下載該robots.txt文件 |
User-agent: *
Disallow: / |
例2. 允許所有的robot訪問(wèn)
(或者也可以建一個(gè)空文件 "/robots.txt")
|
User-agent: *
Disallow:
或者
User-agent: *
Allow: / |
例3. 僅禁止baiduspider訪問(wèn)您的網(wǎng)站 |
User-agent: baiduspider
Disallow: / |
例4. 僅允許baiduspider訪問(wèn)您的網(wǎng)站 |
User-agent: baiduspider
Disallow:
User-agent: *
Disallow: / |
例5.禁止spider訪問(wèn)特定目錄
在這個(gè)例子中,該網(wǎng)站有三個(gè)目錄對(duì)搜索引擎的訪問(wèn)做了限制,即robot不會(huì)訪問(wèn)這三個(gè)目錄。需要注意的是對(duì)每一個(gè)目錄必須分開聲明,而不能寫成 "Disallow: /cgi-bin/ /tmp/"。 |
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~joe/ |
例6. 允許訪問(wèn)特定目錄中的部分url |
User-agent: *
Allow: /cgi-bin/see
Allow: /tmp/hi
Allow: /~joe/look
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~joe/ |
例7. 使用"*"限制訪問(wèn)url
禁止訪問(wèn)/cgi-bin/目錄下的所有以".htm"為后綴的URL(包含子目錄)。 |
User-agent: *
Disallow: /cgi-bin/*.htm
|
例8. 使用"$"限制訪問(wèn)url
僅允許訪問(wèn)以".htm"為后綴的URL。 |
User-agent: *
Allow: .htm$
Disallow: / |
例9. 禁止訪問(wèn)網(wǎng)站中所有的動(dòng)態(tài)頁(yè)面 |
User-agent: *
Disallow: /*?* |