現象級的「復聯 4」,被預測票房三十億美金創影史紀錄
- 2019 年 11 月 29 日
- 筆記
By 超神經
場景描述:用數據挖掘、機器學習、自然語言處理等方法,對電影票房進行預測,為製片方、發行商、投資者以及影院提供參考與指導作用。
關鍵詞:數據挖掘 機器學習 自然語言處理 票房預測
復仇者聯盟迎來了最終之戰。
此次最先在中國上映的舉動也讓不少歐美粉絲掩面哭泣,而周三凌晨的首映更是經歷了一票難求,甚至是重金難求。還有鐵粉花數百元頂著要早起的壓力購買了周三早晨 7 點的票……
預售火爆,人肉預測最終票房30 億美元
據貓眼電影統計,《復仇者聯盟 4:終局之戰》預售到今日已經突破 6 億,首日觀影人數近 300 萬,刷新了影史預售紀錄。
萬眾矚目的《復聯 4 》被預測最終票房會達到 30 億美元。漫威迷們已經迫不及待地加入火熱探討:

知乎網友普遍人工預測《復聯 4》最終全球票房會達到 30 億
之前《復聯 3 》最終的全球票房驚人,超過了 20 億美元,排行影史第四。如今復聯的結局看起來勢頭很猛,甚至會超過上一部。
目前根據國外專業票房預測網站的數據顯示,《復聯 4》的首周末票房將會高達 2.5 億至 2.9 億美元,如果達到平均值 2.65 億美元的話,就會超越前作(2.577 億美元)成為北美影史首周末票房冠軍。
國外網友也紛紛人工預測上映前三天會達 10 億美元,最終全球票房會超過目前排行榜第一名《阿凡達》(最終全球票房 27.87 億美元)。
機器學習會看劇本預測票房
若要論其票房預測,估計最資深的人士,也難以準確預測,畢竟涉及的因素眾多,但交給人工智慧來做,也許就有意想不到的結果。
一家總部位於以色列的 AI 公司 Vault ,是使用分析和演算法預測票房的最新參與者之一。從 2015 年起,他們就致力於通過神經網路演算法,花了兩年時間,對過去 30 年的票房數據、近 40 萬件劇本,電影預算、整體觀眾數量以及演員資訊等進行數據分析,用於估算新電影上映首周的票房。

Vault 的產品包括 4CAST 平台以及深度觀眾分析
其創始人兼 CEO David Stiff 介紹說,公司的 4CAST 平台能夠只從原始劇本或電影預告片中,收集到的「核心故事 DNA」來分析電影的票房潛力。
他還表示,如今他們的 AI 系統在電影票房預測上,準確率能達到 75% 左右,非常接近實際票房。在公司成立之初該程式在預測電影票房方面的準確度達到 65%~70% 。
根據 Box Office Mojo 的說法,該公司預測科幻驚悚片 《異星覺醒》的首映票房為 1,610 萬美元,實際上為 1,250 萬美元。
另一家叫做 ScriptBook 的 AI 公司, 準確地「預測」出了 2015-2017 年間索尼家出的 32 部「票房毒藥」中的 22 部。

ScriptBook 的依據是,將劇本的 PDF 文件上傳到系統中,幾分鐘後對項目進行詳細分析,其中包括:
預測 MPAA 評級,分析其特徵,檢測主角和對手; 評估每個角色的情緒; 預測目標受眾,包括性別和種族; 而且,最重要的是,作出票房預測。

這種評測背後基於快速發展的機器學習,軟體首先由人類指導,然後接管學習過程,並構建以驚人速度開採的大型資料庫。Ruelens 說,ScriptBook 的軟體已在 6,500 個現有腳本的大型數據集上「受過訓練」。
票房預測準確與否,對誰影響最大
話說回來,AI 對票房的預測會靠譜嗎?
總的來說,票房預測系統大多基於大數據。仔細研究,會發現機器學習預測票房的行為,依賴的是數據,消費者行為,劇本消息等行為的分析整合。

ScriptBook 官網給出的其預測依據為數據挖掘+機器學習+自然語言處理+特色工程
所以對於意外的因素,比如「我不是葯神」的火爆,以及「銀翼殺手 2019 」的慘淡,都是難以把控的。
這麼說來,對於劇情保密工作做得嚴實的「復聯 4 」,想要準確預測估計有些難度。不知道計算的時候,會不會計量中國漫威粉絲的信仰充值。
即便如此,票房預測對於電影市場來說,還是有很大的參考價值。

某電影票房預測平台已對明天上映的《復聯 4》作出預測
對於電影創作起到指導作用。比如,某主演對該電影的票房貢獻大小,有無必要拍成3D,觀眾期待的結局等。
片方通過對電影預算成本、製作過程、影片內容、上映檔期等作相應調整,將投資風險控制到最小。
此外,對發行方而言,能對電影發行、營銷等各個環節進行合理優化,規避電影運作過程中的各種不利因素。而對影院來說,則能依據預測合理部署排片情況。
猜一猜,《復聯 4》 最終全球票房會是多少?我賭 30 億美元,你呢?
超神經百科
α-β 剪枝 Alpha-beta pruning
α-β 剪枝是一種搜索演算法,用以減少極小化極大演算法(Minimax 演算法)搜索樹的節點數。
常用來裁剪搜索樹中沒有意義的不需要搜索的樹枝,以提高運算速度。
Alpha-beta 剪枝是一種對抗性搜索演算法,當演算法評估出某策略的後續發展比之前策略的差時,就會停止計算該策略的後續發展。
該演算法和極小化極大演算法所得結論相同,但剪去了不影響最終決定的分枝,進而提高了效率,減少了計算量。