關於Google詞向量模型(googlenews-vectors-negative300.bin)的導入問題
- 2022 年 8 月 2 日
- 筆記
起因
項目中有如下代碼:
word2vec = KeyedVectors.load_word2vec_format('./GoogleNews-vectors-negative300.bin', binary=True)
於是我去網上想下載一個Google訓練的詞向量模型,於是找到了這個鏈接://s3.amazonaws.com/dl4j-distribution/GoogleNews-vectors-negative300.bin.gz
下載,導入,運行,報錯,行雲流水,報錯信息如下:
摸不着頭腦,去google查了下也沒有查到,然後經過長時間的無效百度和亂七八糟的博文後,突然發現下載的這個詞向量模型文件有點問題:
這玩意怎麼只有 1kb,這不扯淡嗎,然後看到別的大哥說似乎是因為國內網絡的原因,下載不下來google你別給我顯示下載成功啊,惱火。
解決
網上找到真正的詞向量模型資源,下載大概有3G多大,下載,導入,運行,成功。下面是googlenews-vectors-negative300.bin的網盤連接,有需要的可以下載,希望可以幫助到大家!
鏈接://pan.baidu.com/s/1wy2DnaG0tKB6STZyhSetBQ
提取碼:jack