特定文章反爬虫测试
有的文章, 很适合给爬虫们爬走转载. 爬走了外链多, 搜索引擎权重大, 相当好.
但是有的文章不想被他爬走, 比如我写了一篇爱情吐槽文章, 吐槽我对ex的遗忘速度太慢太慢, 那如果这个文章也被以前的老客户技术站爬虫爬走登载一堆技术文章当中, 那就相当不好了.
最后我决定试试 robots.txt 的效果, 只要url里面含有 nobot- 关键字的, 都属于disallow系列. 本文就是一个样例.
User-agent: * Disallow: /wp-admin/ Disallow: /*/nobot-*
效果如图所示:
爬虫是不管robots的吧,只有道德的爬虫才会
恩. 我做这个不是为了防转载, 只是想善意的提醒这篇不是技术文章, 最好不要转到你们的技术区去了..他的爬虫不听劝也没办法