欢迎访问王牌网络(WPOK.CN)- 更多精彩内容请关注公众号:王牌客栈,合作/交流微信:860056696!
大流量卡免费领
当前位置:首页>网站建设>推荐的WordPress网站Robots.txt设置

推荐的WordPress网站Robots.txt设置

第一部分:

User-agent:
Disallow:/wp-admin/
Disallow:/readme.html
Disallow:/wp-login.php
Disallow:/wp-register.php
Disallow:/trackback/
Allow:/wp-admin/admin-ajax.php
Allow:*.jsAllow:*.CSS
Disallow:/wp-content/cache/
Disallow:*/feed/
Disallow:/*?s=
Disallow:/search/
Disallow:*?ver=*

解释:

User-agent: - 这行后面应该有一个值,但这里是空的。通常,它指定了适用的搜索引擎爬虫。空值意味着以下规则适用于所有爬虫。

Disallow:/wp-admin/ - 禁止爬虫访问 /wp-admin/ 目录及其子目录。

Disallow:/readme.html - 禁止爬虫访问 readme.html 文件。

Disallow:/wp-login.php - 禁止爬虫访问 WordPress 登录页面。

Disallow:/wp-register.php - 禁止爬虫访问 WordPress 注册页面。

Disallow:/trackback/ - 禁止爬虫访问 trackback 功能相关页面。

Allow:/wp-admin/admin-ajax.php - 允许爬虫访问 admin-ajax.php 文件。

Allow:*.js - 允许爬虫访问所有 JavaScript 文件。

Allow:*.CSS - 允许爬虫访问所有 CSS 文件。

Disallow:/wp-content/cache/ - 禁止爬虫访问缓存目录。

Disallow:*/feed/ - 禁止爬虫访问所有 feed 页面

Disallow:/*?s= - 禁止爬虫访问搜索结果页面。

Disallow:/search/ - 禁止爬虫访问搜索页面。

Disallow:*?ver=* - 禁止爬虫访问包含版本参数的 URL。

这些设置主要是为了保护网站的敏感区域,如管理后台、登录页面等,同时允许爬虫访问一些必要的资源文件(如 JS 和 CSS)。

第二部分:

User-agent: ChatGPT-UserDisallow: /
User-agent: GPTBotDisallow: /
User-agent: Google-ExtendedDisallow: /
User-agent: Applebot-Extended Disallow: /User-agent: anthropic-aiDisallow: /
User-agent: ClaudeBot Disallow: /User-agent: OmgilibotDisallow: /
User-agent: OmgiliDisallow: /
User-agent: FacebookBotDisallow: /
User-agent: DiffbotDisallow: /
User-agent: BytespiderDisallow: /
User-agent: ImagesiftBot Disallow: /
User-agent: PerplexityBotDisallow: /
User-agent: cohere-aiDisallow: /

解释:

这些屏蔽规则专门针对特定的AI爬虫或机器人:

CCBot: 用于 Common Crawl 项目的爬虫。

ChatGPT-User: 可能是 ChatGPT 用户的爬虫。

GPTBot: OpenAI 的 GPT 模型爬虫。

Google-Extended: Google 的扩展爬虫。

Applebot-Extended: Apple 的扩展爬虫。

anthropic-ai: Anthropic 公司的 AI 爬虫。

ClaudeBot: 可能是 Anthropic 的 Claude AI 模型爬虫。

Omgilibot 和 Omgili: Omgili 搜索引擎的爬虫。

FacebookBot: Facebook 的爬虫。

Diffbot: 用于网页内容提取的爬虫。

Bytespider: 字节跳动(TikTok 母公司)的爬虫。

ImagesiftBot: 图像搜索爬虫。

PerplexityBot: Perplexity AI 的爬虫。

cohere-ai: Cohere AI 公司的爬虫。

上面这些就是常见的AI内容生成工具, 它们会抓取我们网站的内容来做训练素材, 或者直接在内容生产的时候调用我们的数据或进行总结, 有时候不想被"偷"内容, 可以直接屏蔽它们的爬虫.

简单总结, That's it.

王牌网络公众号

微信公众号『王牌客栈

第一时间了解最新网络动态
扫码关注不迷路~

给TA打赏
共{{data.count}}人
人已打赏
副业网

免责声明:部分文章来自网络转载及用户投稿,仅做信息分享之用,如有侵权请联系我们,邮箱:admin#wpok.cn(#换成@)

本站实操重点推荐的网赚项目:

社交电商:0元购

零撸项目:手机免费挖Pi币

任务赚钱:趣闲赚

增值服务:做一个年赚百万的网站

网站联盟:首码项目网 · 副业网 · 网赚营

跟Q哥做项目,可免费获赠本站VIP会员,更多扶持福利请咨询微信:860056696

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索