大卖还是扑街？仅凭情节概要，AI便可预估一部电影能否成功-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读大卖还是扑街？仅凭情节概要，AI便可预估一部电影能否成功

大卖还是扑街？仅凭情节概要，AI便可预估一部电影能否成功

2019-09-03

作者 | 秦泽宇、曹培信

来源 | 大数据文摘

不知道大家有没有去看鹿晗和舒淇主演的科幻片《上海堡垒》，整体讲述的是外星人入侵地球的故事，上海成为最后的根据地，而黄浦江里的上海大炮成为翻盘的唯一希望，当然了，还有鹿晗和舒淇的爱情故事。

不过上映以来，这部电影就被各种骂，导演、编剧都接连出来道歉。不过这一切的一切都已经无力回天，《上海堡垒》3.6亿的投资成本，最终票房只攀登到1.2亿多，可以说是亏得血本无归啊！

尽管豆瓣评分目前只剩下3.2分，但是评价中还是有人试图客观的分析电影失败的原因，其中一个就是故事太过烂俗。

然而随着自然语言处理（Natural Language Processing，简称NLP）的不断发展，是否在电影拍摄前就根据电影的脚本摘要预测这部电影会不会受到大众喜爱呢？

来自韩国的几名研究人员就尝试了这个方法。

四万多部电影数据，训练可预测电影好坏的AI

研究人员试图训练出一个机器学习模型，可以通过电影摘要，分辨哪些哪些电影会成功或者失败。如果人们可以进一步完善这个模型，有朝一日，制片人可以在电影制作前就能预测出这部电影在票房上是会大卖或者扑街。

为了训练这个模型，研究员使用了来自世界各地，总共42306个电影情节作为数据集，大部分来自CMU电影摘要语料库。

数据集

模型先将摘要划分成句子，并用情感分析来分析每个句子。模型将认为是“积极”的句子，譬如“Thor喜欢他的锤子”，打分更接近1。模型将认为是“消极”的句子，譬如“Thor打架了”，打分更接近-1。

最后综合两个输出进行分类，从而得出一个电影是否会成功。

模型分类架构

情节越起伏，观众越买账

通常，成功的电影，比如1951年的《爱丽丝梦游仙境》，在Rotten Tomatoes电影评价网上获得了80%的分数，情绪波动频繁；不成功的电影，比如2009年的《控制限制》情绪波动较小。研究员说，电影开头或结尾是否皆大欢喜并不重要。重要的是情绪变化频繁。

电影中的“波动性”衡量标准是将每个摘要的情绪打分压缩成一个分数，来反映情绪的变化。研究人员测试了三种不同获得最终分数的方法。这三个方法都可以准确地预测一部电影是否会受欢迎。

上面两张图中，第一张里面的电影《爱丽丝梦游仙境（Alice in Wonderland）》的开头和结尾都很积极，电影《靴子（Das Boot）》和《一个男人（A Man for All Seasons）》每一季的开头和结尾都是消极的。电影《葛底斯堡（Gettysburg）》展示了命运的逆转，开始时是消极的，结束时是积极的。人们普遍注意到，这些成功的电影有频繁的情绪波动。

而第二张则是不成功的电影的情感分析，它表现出较少的情感波动。电影《控制的极限（The Limits of Control）》和《迷失的刀锋战士（Lost Bladesman）》都有消极的开头和结尾。电影《大锅（Tai-Pan）》以消极的开头，以积极的结尾。电影《蓝舌和尚（Bluetproof Monk）》的开头和结尾都是正面的，但是在故事发展的过程中，大多数人的情绪得分都是负面的。因此，这表明情绪变化的频率可能预示着电影的成功。然而，情绪的两极对预测一部电影的成功影响甚微。

现在只能分好坏，希望将来能预测票房

研究人员在8月1日意大利佛罗伦萨举办的2019Storytelling Workshop上指出：尽管这些方法在猜测电影是否成功上表现并不出色，但是它们依旧比随机预测更加准确。