AI分析《賽博朋克2077》玩家評價後:真愛粉的趣味暴露了
CDPR三度延期《賽博朋克 2077》,可把玩家憋壞了。
12月10日上線當天,網上一夜間流行起各種賽博朋克的梗:
前期預售800萬份,上線首日就收回成本,3天時間就有17萬留言評價…..
儘管CDPR不給遊戲加密,默許盜版,但絕大部分玩家毫不介意為《2077》掏錢。
從來沒有哪家廠商能像「波蘭蠢驢」這樣被玩家擁戴。
但是,《賽博朋克 2077》剛上線,按照Steam的評分規則,得到了「多半好評」。
好評率僅有73%,今天也只達到79%。
分數不低,但對於有《巫師》系列在前的CDPR來說,這個成績還是有些意外。
誰在給《賽博朋克 2077》差評?大家在吐槽什麼?
一位最硬核玩家Kamil Czarnogórski,用AI分析了Steam上的評價,看看大家在討論《賽博朋克2077》的時候,都在說什麼。
《賽博朋克 2077》,你還好嗎?
Kamil使用Transformer,對抓取的Steam評論頁有效資訊進行向量化,並使用UAMP來對數據進行可視化,最後用k均值演算法對關鍵詞進行聚類分析,得出了下面的結果。
先看吐槽部分。《賽博朋克 2077》,對於玩家吐槽最多、給出差評最集中的兩個點,一是配置要求高、二是遊戲優化差、bug多。
在配置方面,出現頻率最高的辭彙是遊戲硬體配置相關,比如RTX、1080P、DLSS等等。
一波高配置玩家,秀了一把流暢運行的配置清單:
RTX2060、i7 8700、16GB記憶體 ,感覺畫面就像一部電影。
45-65幀,RTX 2080、i9-9900K與32GB的記憶體,光線追蹤效果全開,運行流暢。
2080ti和9700k沒有問題,可以開最高畫質,幀率穩定60幀。
3080 FE和5800X,可以達到到80-100幀率,解析度1440p,其他設置都是最高。
可以看出,要想較為流暢地運行《賽博朋克2077》,一塊2060或更好的N卡是必須的。
目前,2060中國電商售價在2500-3000左右,而2060隻能算將將滿足最高畫質要求,要想玩的「從容」,還得更高配置。
加上i7 8700處理器,要開最高畫質玩《賽博朋克2077》,整套設備至少8000-10000元起步。
原來第一時間阻止我們玩《賽博朋克2077》的不是工作\學業,而是錢。
有了真金白銀,攢起了高配置電腦,但遊戲的bug和崩潰情況還是令人頭疼。
吐槽出現頻率最多的詞是崩潰(crashes),且玩家反映,崩潰情況多數出現在啟動時、角色創建,以及鏡頭轉場,比如過場動畫和玩家視角的銜接。
其它小bug也頻頻出現。一位名叫staigerd89的玩家分享說,他的角色一直被一個特定NPC不明原因尾隨:
崩潰和各種小bug,是目前這款遊戲被吐槽最多的情況。
此外,有大量玩家反映,主機平台優化太差,遠不如PC。
甚至有真愛粉先買了主機版,發現效果不好後,又花錢買了PC版。
在遊戲性方面,玩家也提到打擊和射擊感比較生澀和遲滯,子彈打在物體上力量不突出,像是打海綿一樣。
不可避免的,負面評價中另一個高頻詞是退款。
儘管被大量吐槽,但電競筆電身精良的畫面,和用心的製作細節還是讓大家對它充滿了期待。
給出差評的玩家,大部分認為目前的問題不影響整體品質,未來隨著版本更新、bug修復,優化會越來越好。
這一類評價中,出現最多的詞是wait、patch、better。
「波蘭蠢驢」向來不在意盜版傳播,也不給遊戲加密,因為總有真愛粉支援正版。大家對CDPR的耐心和期待,也遠超其它遊戲廠商。
而且,遊戲上線一天後,NVIDIA 方面也立刻更新460.79版驅動,針對《賽博朋克 2077》做了全方位的支援和優化,幾天下來,好評率從73%上升到79%。
好評最多:擼貓
「配置要求高」、「前期bug多」、「感謝Steam給我退款」……《賽博朋克 2077》,你還好嗎?
其實,仍然有多數玩家給出了好評。
好評中出現最多辭彙,竟然是擼貓(petting the cats)。
大家紛紛表示,這是年度最佳擼貓遊戲。
此外,玩家讚譽的點集中在畫面效果好、遊戲世界細節到位、夜城沉浸感強。
所以總的來說,《賽博朋克 2077》細節還不完善,前期bug較多,會出現崩潰。
但總體製作精良,未來更新令人期待。
3步走,用AI解析Steam評論
那麼,從「優化」、「退款」到「擼貓」,這些精準的關鍵詞分析結果,Kamil是怎麼得出的呢?
數據處理
首先,獲取上面這些(吐槽、擼貓等)評論的文本數據。
Steam有一套遊戲的配置工具包Steamworks,其中一項功能是獲取Steam遊戲的評測,可以篩選時間、語言、正負面評價等,每次獲取20條。
只需要寫個Python腳本,就能迭代獲取《賽博朋克2077》的所有英文評論。
這些評論是一組組句子,接下來要將它們切分成token(字,包括單詞和標點符號),用NLP的Python工具包NLTK,通過sent_tokenlize對所有句子進行字詞分割。
在那之後,再對輸入進行向量化 (embedding),這裡用到的框架是Sentence Transformers(BERT和XLNet結合的多語言句子向量框架)。
分析數據的目的,是為了尋找句子的語義相似度,因此採用了框架中的預訓練模型roberta-large-nli-stsb-mean-tokens。
這裡的語義相似度,就是將相似的句子聚集在一起的關鍵,例如這些吸貓評論:
用這種模型對數據進行處理後,就能將輸入的評論轉換為高維向量(便於聚類分析)。
數據可視化
接下來,是將這些向量可視化,更好地看清評論的分布。
但經過Transformer獲得的高維向量,還不能直接可視化。
因此,需要將這些1024維向量(轉換出來的高維向量,是將語義編碼成1024個數字的序列),先降維成二維向量。
這裡會用到一種名為UMAP (統一流形逼近和投影)的技術,能將高維向量轉變成二維向量。
在二維向量的可視化圖中,彼此接近的點表示具有相似含義的句子,如果發生簇分離,則代表評價的內容並不相同。
如下圖,經過處理後的可視化評論中,綠色代表正面評價,紅色代表負面評價,顏色越深,表示負面評價的佔比越大。(例如上面那些有關退款的評價,就可以組成一個退款群了)
而在離集群很遠的左上角,有一小撮人在「自說自話」,這群人給出的140條評價,全都是好評。
沒錯,這就是剛剛那群沉迷吸貓的玩家……(畢竟,連水下也能吸貓)
當然,快樂吸貓只是遊戲中的一個細節。
為了更全面地搜集有關遊戲的整體評價,還需要對這些數據進行聚類分析。
聚類分析
聚類分析,是對評價進行整體分類的方法,也就是對這些處理後的二維向量進行分組。
例如被分到「遊戲會更好」的評價組裡,就會看到大量的wait、patch、better,這些詞共同組成了這個評價。
這裡的聚類分析,採用的是k均值演算法 (k-means)。
k均值演算法唯一需要的參數是簇數(將這些二維向量分成多少組),這裡盲猜75。
簇數越大,分類就越細,反之則越普遍。運用k均值演算法後的75個分類如下:
其中,每一簇都會有一個質心 (centroid),是一句最能代表集群的「虛構」的話。
為了做出像上面評價那樣的可視化關鍵詞,會在簇中選取與質心最接近的句子,並分析句子作者的遊玩時間:
在那之後,會將分析後的字詞進行可視化:
至此,就完成了對《賽博朋克2077》Steam上評論的分析。
這次篩選出來的的評論,主要是作者精選的15類評論,包括5個討論最多的話題、5個評價最高的話題和5個評價最低的話題。
如果你還有更好的分類方法的話,可以自己上手操作起來了~
作者介紹
Kamil Czarnogórski,畢業於格但斯克大學(University of Gdańsk)電腦科學系,這是一個位於波蘭的大學。
《賽博朋克2077》的開發商CDPR也來自波蘭。
Kamil Czarnogórski表示,這次做的評論分析,只針對發行後的24小時內的遊戲評價。
在他進行分析的這段時間裡,Steam上對於《2077》的評價已經上漲到了80%,截至12月14日,有關《2077》的評價已經達到了81%。
當然,遊戲具體如何,還得親自一試。
目前這位小哥已經上手了這款遊戲,打算給出自己的見解。
你已經玩了《賽博朋克2077》嗎?
「波蘭蠢驢」的新作品滿足你的期待嗎?
歡迎留言告訴我們~