迄今為止,《哪吒之魔童降世》已上映54天,這部連續打破上映期間單日票房、單日綜合票房破億天數等多項記錄的電影,已成為國產動畫電影的新興代表。
早在影片上映后一周,貓眼專業版就發布預測《哪吒》總票房能到41億。此預測結果一出,眾多網友直呼“瘋了”,而從現實情況來看,基本與預測方向一致。貓眼8月7日預測《哪吒》總票房達到46.8億,超過《流浪地球》,最終也都實現了。
貓眼是如何做到如此精準的票房數據預測?近日,貓眼數據專家揭秘了票房精準預測背后的“基石”何在。
常量+變量 打造精準無誤的數據
國外有一些票房預測系統顯示,票房預測的原始數據來自于研究人員、投融資社區、市場分析。根據這些數據,系統會判斷什么樣的電影更容易得到票房青睞。
但這些數據會隨著類型、評分、檔期、票房體量、近期走勢的變化而受到影響,最終結果也會差強人意。
當互聯網技術介入后,電影票房預測也迎來優化。以《哪吒》為例,貓眼在上映約一周之后發布了超過40億的預測結果,在前期參考其類型、評分因素,以《大圣歸來》為參考影片;后期《哪吒》的票房走勢出來后,發現他與《戰狼2》的走勢相像,參考《戰狼2》的走勢調整接下來的票房預測;在《哪吒》上映期間,根據多部上映影片的表現情況實時調整其預測票房,從而使得總票房預測能夠在較早的時間調整至合理結果。
簡單而言,算法的基本邏輯,是根據相似電影的票房規律預測新電影的票房。相似電影的選取會有若干條件(如類型、評分、所處檔期、票房體量、近期走勢等),然后基于這些相似電影,構建預測天級票房或總票房的機器學習模型。而機器學習模型用到的特征工程,背后也有一套比較復雜的方法。
經過多年的積累,貓眼有一套比較完整的票房預測工具,包括天級票房預測(未來3天每日大盤票房預測)和單影片總票房預測等算法。例如在天級票房預測上,因為貓眼有著準確的實時票房(及未來預售)數據作為支撐,每日預售票房的漲跌幅都會對次日或者近幾日的票房預測提供重要依據。因此,貓眼可以利用大數據優勢,選取歷史相似樣本并構建機器學習模型,可以非常準確地預測未來某日的票房。
由于貓眼龐大的實時票房詳細數據、電影天級票房和總票房樣本、以及貓眼平臺的交易數據等優勢,這些算法可以達到更為精準的預測效果,實時票房準確度可以達到99%以上,次日天級票房預測準確度可以達到90%左右。
但周五的天級票房預測是個考驗,因為大部分影片會選擇在周五上映,新片的影響具有很大的不確定性。目前貓眼的算法是實時訓練和預測的,可針對一個新的待預測電影,實時選取相似電影,并訓練模型以及預測。這套算法的精度隨著樣本的積累或越來越好,當新樣本積累到一定程度,貓眼會對模型重新優化。
進化迭代的學習能力 造就對中國電影市場的影響力
此前,貓眼成功預測《速度與激情8》,當年在映前1日,對外發布了首日票房和總票房的預測,首日票房和總票房誤差都在5%以內,獲得了非常理想的結果。
眾所周知,在電影上映前就已準確預測出首日票房和總票房數據難度非常大,在貓眼發布《哪吒》預測結果候很多人都說貓眼瘋了,但等到電影票房持續走高,眾多網友直呼“神了”,同時也驗證了貓眼在票房預測方面擔任了“預言家”般的角色。
隨著機器學習能力、樣本數據和經驗的積累,貓眼預測的準確性將越來越高。制片方、發行公司和院線,都可以根據已知的票房影響的數據統計和分析,得到正確的決策傾向,讓影片更受市場歡迎,實現效率最大化。
貓眼票房預測模型不僅對票房預測或市場評估產生重要意義,在中國電影的發展與動態方面,也將提供新的研究方向,成為適應中國市場的模型量表。