特定文章反爬虫测试

有的文章, 很适合给爬虫们爬走转载. 爬走了外链多, 搜索引擎权重大, 相当好.

但是有的文章不想被他爬走, 比如我写了一篇爱情吐槽文章, 吐槽我对ex的遗忘速度太慢太慢, 那如果这个文章也被以前的老客户技术站爬虫爬走登载一堆技术文章当中, 那就相当不好了.

最后我决定试试 robots.txt 的效果, 只要url里面含有 nobot- 关键字的, 都属于disallow系列. 为了避免本文搜不到, 在nobot-前又加了一个no-.

User-agent: *
Disallow: /wp-admin/
Disallow: /*/nobot-*

效果如图所示:

tmp