關於Google詞向量模型(googlenews-vectors-negative300.bin)的導入問題

起因

項目中有如下代碼:

word2vec = KeyedVectors.load_word2vec_format('./GoogleNews-vectors-negative300.bin', binary=True)

於是我去網上想下載一個Google訓練的詞向量模型,於是找到了這個鏈接://s3.amazonaws.com/dl4j-distribution/GoogleNews-vectors-negative300.bin.gz

下載,導入,運行,報錯,行雲流水,報錯信息如下:

googel_vector

摸不着頭腦,去google查了下也沒有查到,然後經過長時間的無效百度和亂七八糟的博文後,突然發現下載的這個詞向量模型文件有點問題:

image-20220802123703178

這玩意怎麼只有 1kb,這不扯淡嗎,然後看到別的大哥說似乎是因為國內網絡的原因,下載不下來google你別給我顯示下載成功啊,惱火。

解決

網上找到真正的詞向量模型資源,下載大概有3G多大,下載,導入,運行,成功。下面是googlenews-vectors-negative300.bin的網盤連接,有需要的可以下載,希望可以幫助到大家!

鏈接://pan.baidu.com/s/1wy2DnaG0tKB6STZyhSetBQ
提取碼:jack