部落格園文章防盜措施
- 2022 年 6 月 3 日
- 筆記
部落格園文章防盜措施
之前在部落格園寫了幾篇文章,同時投遞了部落格園首頁,今天無意在瀏覽器搜了一下那些文章的標題,發現自己的文章竟然被爬了!
(這裡本來想放一張圖的,想想還是算了)
要說他們盜走就盜走了,至少還能給我引點流,但是他們還把原文中的鏈接全部轉換了,他們以此來引流,部分網站還順便做一些自家的廣告;
這我就不能忍了,於是決定做一點什麼來防止這些行為:
禁止隨意複製
- 這個只能防止簡單的全文複製粘貼玩家
- 程式碼塊還是可以複製的
- 我認為這可以滿足大多數讀者的需求
#cnblogs_post_body {
moz-user-select: -moz-none;
-moz-user-select: none;
-moz-user-select: none;
-khtml-user-select: none;
-webkit-user-select: none;
-ms-user-select: none;
user-select: none;
}
#cnblogs_post_body code-box {
moz-user-select: -moz-text;
-moz-user-select: text;
-moz-user-select: text;
-khtml-user-select: text;
-webkit-user-select: text;
-ms-user-select: text;
user-select: text;
}
自動生成防盜資訊
這個主要是面對用戶的,可以讓用戶自己辨認文章本身的來源
這裡要注意,爬蟲程式會把鏈接替換成自己的鏈接,所以我們用 <code>
程式碼塊進行一個包裹
這裡有一個小技巧,爬蟲只會爬取內容,而不會爬取樣式,所以我們可以把某些內容(比如星號)做一個 repeat(1000)
操作,然後在自己的網站上對這個結構進行 overflow:hidden
設置,而其他網站沒有這個樣式,自然就無法正常閱讀了!這樣:
最後:
- 我可以接收別人轉載我的文章,只要留下原文的地址就可以
- 個人雖然全篇摘抄了文章,但是我們可以看出來他認真閱讀了文章,我也可以接受
- 不能接受的是那些為了流量而用爬蟲進行無腦抄襲的玩家