
大数据助推大电影迎来全民娱乐时代
近两年,大数据越来越成为一个时髦的名词,但是,互联网公司到底能为电影行业提供什么样的有效数据,电影人该如何最有效地使用大数据?
昨日,是上海电影节正式开幕第一天,由淘宝电影、娱乐宝、新浪三方联合主办的“大数据助推大电影”论坛上,来自互联网各领域资深人士以及演员徐峥,一同探讨了互联网生产的大数据如何更好地为传统电影行业和电影人服务。
你刷微博吐槽电影时
制片人可能因为你修改剧本
微博CEO王高飞表示,微博两亿月活跃用户里,电影最受关注。每个月微博上有8000万用户讨论电影,另外还有200多位粉丝过千万的明星大V,他们都是电影大数据的来源。未来微博将通过跟蚂蚁金服、娱乐宝的合作,做电影和粉丝之间的连接器。
而现在电影公司拍电影,很大一部分也都会运用预测系统,通过对票房的预估来决定片子做不做。爱奇艺高级副总裁杨向华指出,爱奇艺的数据和系统磨合需要一段时间,目前能达到约80%的准确度,剩余20%要依靠人工调整。从制作层面,可以用大数据分析什么题材、什么阵容的演员会被用户喜欢;在项目阶段,可以进行票房预测;在销售阶段,可以调查应该针对什么人群做什么样的营销;最后在发行阶段,也可以通过检测微博搜索量来测试观众期待值,为影城经理排片提供依据。
优酷土豆集团高级副总裁、合一影业CEO朱辉龙表示,去年《后会无期》和《小时代3》同期竞争,两部电影的物料都在网上引起很大反响。优酷土豆通过对后台会员数据的分析,决定深入内陆城市重点宣传,收获了很好的效果。同理,分析《老男孩》的用户关键词,排在第一的是音乐,所以《小苹果》应运而生,没想到最后歌比电影还火。
徐峥以导演创作角度发言,他认为在拍摄前,制片方可以通过大数据评估改进剧本,甚至对电影票房有所预估。电影定剪之前,也可以请专业人士来提前观影并进行完善。
蚂蚁金融服务集团国内事业群总裁樊治铭畅想,支付宝的消费数据,加上新浪微博的行为数据将为电影排片带来指导。未来淘宝和支付宝将利用LBS定位系统,打通数据和电影院,将最新观影信息即时发给观众,充分利用比如白天人流较少的上班时间,降低电影票价,为消费者提供实惠。
UTA亚太区负责人Max Michael则介绍了好莱坞的大数据分析体系,称美国有尼尔森这样的评级公司,有UTA研发的专业软件,各个公司自己也普遍对社交媒体进行追踪,会及时根据用户反馈作出调整。
《港囧》定档中秋节
大数据已经做好票房预估
在活动现场,嘉宾们以过去的微博和淘宝电影的大数据统计结果,对即将上映的《港囧》来了一次实战分析:《港囧》定档9月25日,今年中秋加国庆档票房大盘预计将达17到20亿,《港囧》能分到多少成为关注焦点。
大数据分析,喜剧是国庆档最受欢迎的类型,今年也没有同类型其他影片竞争,《港囧》票房前景可期。现场数据显示,射手、狮子、水平、天蝎、白羊都会去电影院捧场,处女座和摩羯座则是最有可能不去的人。对此,徐峥也大笑道:“那完了,宁浩和黄渤都是处女座,陶虹是摩羯座,他们都没机会看了。”
当谈到受众群在城市分布的问题时,徐峥表示,“其实我觉得如果中国的电影的定位准确的话,真的有可能战胜好莱坞的。我们在做《心花路放》的时候,认为这部电影在三四线城市一定会非常受欢迎,因为里面讲到了小城青年的元素,离他们的距离是很近的,现实感是很强的。”
而徐峥在拍摄上一部作品《泰囧》时,大数据还不像今天那么流行,但是在看过数据分析后,徐峥认为,在今年即使上映的《港囧》中,可以借鉴许多此次大数据的分析结论,对大数据显示的票房增量大的城市展开重点宣传。
同时,他表示,这次会拉上赵薇一块为《港囧》多跑跑三线城市。徐峥自认为目前还无法预测《港囧》的票房数字,原因是“国庆档还有很多其他的电影,《心花路放》时是一枝独大,但《港囧》就不知道了”。
大数据
不能完全代替人为决策
不过,大数据也是一把双刃剑。嘉宾们表示,大数据说到底只是一种分析工具和手段,不能完全代替人为决策,更何况电影作为一门艺术本来就应该保留一定的直觉和坚持。
那么运用大数据需注意什么?王高飞表示,微博在社交媒体中起到的是放大器的作用,但如果你电影本身的价值是0,后面再加多少个0都没有用;只有前面的数字有价值,后面0的放大才有用。
同样,朱辉龙表示:“数据是理性的,但决策是感性的,大数据不是万能的,即便用也要用真正场景化的数据,不能只看孤零零的数字。”杨向华则称,想让大数据完全代替人工分析,还有很长一段路要走。
然而现场也有观众提出疑问,现在选择电影存在随机性,这种情况下大数据是不是就无用武之地了?樊治铭对此回答:现在冲动消费已经越来越少了,因为现在微博等移动互联网的信息很方便获得,而且现在看电影的主要人群是“70后”、“80后”和“90后”,这些人大多对网络非常依赖,基本都会提前对热门影片有了解。这也是微博、淘宝电影、娱乐宝合作的一大优势。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23