博客园文章防盗措施
- 2022 年 6 月 3 日
- 筆記
博客园文章防盗措施
之前在博客园写了几篇文章,同时投递了博客园首页,今天无意在浏览器搜了一下那些文章的标题,发现自己的文章竟然被爬了!
(这里本来想放一张图的,想想还是算了)
要说他们盗走就盗走了,至少还能给我引点流,但是他们还把原文中的链接全部转换了,他们以此来引流,部分网站还顺便做一些自家的广告;
这我就不能忍了,于是决定做一点什么来防止这些行为:
禁止随意复制
- 这个只能防止简单的全文复制粘贴玩家
- 代码块还是可以复制的
- 我认为这可以满足大多数读者的需求
#cnblogs_post_body {
moz-user-select: -moz-none;
-moz-user-select: none;
-moz-user-select: none;
-khtml-user-select: none;
-webkit-user-select: none;
-ms-user-select: none;
user-select: none;
}
#cnblogs_post_body code-box {
moz-user-select: -moz-text;
-moz-user-select: text;
-moz-user-select: text;
-khtml-user-select: text;
-webkit-user-select: text;
-ms-user-select: text;
user-select: text;
}
自动生成防盗信息
这个主要是面对用户的,可以让用户自己辨认文章本身的来源
这里要注意,爬虫程序会把链接替换成自己的链接,所以我们用 <code>
代码块进行一个包裹
这里有一个小技巧,爬虫只会爬取内容,而不会爬取样式,所以我们可以把某些内容(比如星号)做一个 repeat(1000)
操作,然后在自己的网站上对这个结构进行 overflow:hidden
设置,而其他网站没有这个样式,自然就无法正常阅读了!这样:
最后:
- 我可以接收别人转载我的文章,只要留下原文的地址就可以
- 个人虽然全篇摘抄了文章,但是我们可以看出来他认真阅读了文章,我也可以接受
- 不能接受的是那些为了流量而用爬虫进行无脑抄袭的玩家