部落格園文章防盜措施

部落格園文章防盜措施

之前在部落格園寫了幾篇文章,同時投遞了部落格園首頁,今天無意在瀏覽器搜了一下那些文章的標題,發現自己的文章竟然被爬了!

(這裡本來想放一張圖的,想想還是算了)

要說他們盜走就盜走了,至少還能給我引點流,但是他們還把原文中的鏈接全部轉換了,他們以此來引流,部分網站還順便做一些自家的廣告;

這我就不能忍了,於是決定做一點什麼來防止這些行為:

禁止隨意複製

  • 這個只能防止簡單的全文複製粘貼玩家
  • 程式碼塊還是可以複製的
  • 我認為這可以滿足大多數讀者的需求
#cnblogs_post_body {
  moz-user-select: -moz-none;
  -moz-user-select: none;
  -moz-user-select: none;
  -khtml-user-select: none;
  -webkit-user-select: none;
  -ms-user-select: none;
  user-select: none;
}

#cnblogs_post_body code-box {
    moz-user-select: -moz-text;
  -moz-user-select: text;
  -moz-user-select: text;
  -khtml-user-select: text;
  -webkit-user-select: text;
  -ms-user-select: text;
  user-select: text;
}

自動生成防盜資訊

這個主要是面對用戶的,可以讓用戶自己辨認文章本身的來源

這裡要注意,爬蟲程式會把鏈接替換成自己的鏈接,所以我們用 <code> 程式碼塊進行一個包裹

這裡有一個小技巧,爬蟲只會爬取內容,而不會爬取樣式,所以我們可以把某些內容(比如星號)做一個 repeat(1000) 操作,然後在自己的網站上對這個結構進行 overflow:hidden 設置,而其他網站沒有這個樣式,自然就無法正常閱讀了!這樣:

最後:

  • 我可以接收別人轉載我的文章,只要留下原文的地址就可以
  • 個人雖然全篇摘抄了文章,但是我們可以看出來他認真閱讀了文章,我也可以接受
  • 不能接受的是那些為了流量而用爬蟲進行無腦抄襲的玩家