京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据创新:要借船出海也要自造航母
本月初,人民网连续刊发两篇评论,指出游戏《王者荣耀》的危害性并呼吁政府和游戏制作方加强监管。于是,《王者荣耀》于日前开启专为未成年人健康游戏而实施的“史上最严防沉迷系统”。在该系统实施之后,根据大数据显示,在玩家最集中的晚间时段,一个小时内共有34万个玩家账号被保护,成长守护平台一天新增绑定45万个账号。
这是未来网总编辑万兴亚在第十二届中国传媒年会的分论坛上,向与会嘉宾分享的一组大数据。“这些数据说明什么?说明大数据能最直观清晰地反映青少年成长问题,我们也可以利用大数据作出反应,未雨绸缪,防微杜渐,从而让孩子们健康地成长。”万兴亚说道。
事实上,大数据在各行各业已经开始突显出其未雨绸缪的重要作用。在传媒领域,搭建大数据平台,有效挖掘大数据,实现大数据创新,是近两年来媒体的思考题,也是行业的必考题。
在大数据建设以及应用方面,灵活的互联网公司已经走在了传统媒体的前面。在技术服务流程上,杭州凡闻科技有限公司实现了全网数据实时覆盖,一家媒体生产的一篇稿子在全网发布之后,被哪些媒体转载了、全网的传播路径是怎样的,都会记录并反馈到大数据平台,平台再将反馈信息对接每一家媒体的后台,媒体就能准确了解所生产的这篇稿件在哪些领域和地方更受关注。
这让不少传统媒体的负责人感到震惊和紧迫。“作为专注于内容大数据分析的公司,凡闻科技有限公司已经拥有凡闻大数据服务平台、易闻版权交易平台、智闻可视化大数据输出服务平台和力闻传播影响力平台。”杭州凡闻科技有限公司董事长王鸣说道。那么,传统媒体又该怎样自建数据库呢?
观媒首席执行官薛陈子给传统媒体指出了几条前行路。首先,传统媒体要获取足够多的资源,建立起自身用户体系。比如,人民日报社的“中央厨房”不是一个封闭的系统,而是一个充分连接用户、连接其他行业的“内容+”平台。这样一个平台,将来一定会产生大量数据。
其次,通过收购、股权合作等方式获得目标数据。比如,浙江日报报业集团用31.9亿元收购边锋和浩方,获得了数以亿计的互联网用户,有效建立了用户连接。目前,这项业务已经占到浙报传媒营业收入30%以上、净利润一半以上。
再次,通过与比较成熟的互联网商业机构合作,如BTA等。这些商业机构已经掌握了绝大多数市场,对数据也有处理能力,他们的数据库对传统媒体来说可以有四项服务:为传统媒体进行受众画像、监控传统媒体的传播效果、分析传统媒体的流量走向和用户兴趣、为传统媒体定制精准投放的分发渠道。
此外,还可以通过政府挖掘数据。在国家大数据工程的推动下,各地政府正在大力推进智慧城市建设、政府数据开放工程等,其中已经有大量的数据被用来服务受众的线上生活,如交通数据中的地图、路况,居民消费数据,金融数据等。由于这部分数据存在一定的安全风险,所以各地政府在数据开放的过程中会选择具有公信力的传统媒体作为合作方。这种情况下,传统媒体就可以积极参与。
最后,党媒数十年来积累的历史数据也值得挖掘。宝贵的历史资料要尽快数字化,并且还要对相似问题进行分析,形成数据库。
“媒体除了做好信息传播之外,还要专注于社会解读和分析预测。而大数据恰恰可以提供对社会全面而深刻的洞察。”万兴亚认为,在数据为王观念的指导下,媒体要有强烈的数据意识,要善于挖掘数据、分析数据和使用数据。
王鸣在主题演讲中也提醒传统媒体要挖掘自身的两大金矿。一是数据金矿,二是渠道金矿。其中,所谓的数据金矿,不但包括现在和今后产生的,还要挖掘过去已经存在的海量内容数据,把历史内容数据唤醒,为传播提供参照和依据十分必要。他认为,当前媒体发展已经从内容为王阶段向内容数据为王阶段发展。可以说,内容数据是今后发展的基础。
借船出海并非放弃原有的海
今年1月—3月,《人民日报》综合发稿7.39万篇,原创占比36.91%;新华社发稿7.3万余篇,原创占比49.37%;央视以视频为主,原创占比达90.94%;腾讯网发稿达46万篇,是主流媒体的10倍,原创占比达19.42%;新浪网发稿41万篇,被转载总数293万次……
“为什么要罗列这些数据?是希望通过数据的收集、聚合、分析、运用来告诉媒体,用户真正想看的东西是什么。”王鸣说,“在大数据产业高速发展的今天,技术问题已经得到基本保障,但更重要的是媒体的内容。再先进的技术也离不开媒体生产力和创造力。”
“优质的内容永远不会遇冷。”今日头条媒体合作与发展总经理安娜也用一组最新的数字,说明了优质内容的受欢迎程度。她介绍,在香港回归20周年的报道中,根据今日头条的大数据显示,央视新闻、澎湃新闻等媒体机构共进行了75场直播,吸引了2530万人观看,获得6222万次点赞,累计观看时长达69.6万小时。
为了能够让优质的内容传播得更远,传统媒体也借助今日头条等内容分发平台的力量。据安娜介绍,目前,已经有超过4000家媒体机构与今日头条展开合作。2016年年底,历史累积阅读量达1亿次的媒体已经有120家,超过5亿次的有24家,其中有5家甚至超过了10亿次。2016年,由媒体机构生产、在今日头条平台上分发的内容共有10.88万篇阅读总量达到10万+,有9336篇达到100万+。2016年12月统计显示,短视频的总消费时长已经是图文内容的1.33倍。而在直播领域,已经有307家媒体机构在今日头条上做直播。
不过,薛陈子认为,“借船出海,并不代表放弃原有的那片海。”传统媒体大多走向内容供应商,于是也会局限了发展。他认为,传统媒体不能因能力不足就固守成规,在分发平台的合作过程中不要完全依赖平台,反而放弃建立自己的用户数据。传统媒体应该制定力所能及、符合自身发展定位的策略,要善于利用政府资源,与政府部门实现合作双赢。
切莫过度解读大数据
“大数据作为一个产业资源,已经影响到各个行业,之于媒体行业来说,对传播体制是一种倒逼。”河南日报报业集团副总编辑董林在圆桌对话中表达了自己的观点。
《影视制作》主编李新民在主题演讲中也开宗明义。他认为,网络化、智能化和大数据化,正在打破媒体的界限、重塑传媒生态。“大数据时代,困扰媒体生产的核心问题是受众在哪里?受众需要什么?实现精准传播的最有效手段是大数据的应用。”李新民说。
北京时间新闻中心总监戴元初也介绍了北京时间目前正在运用大数据进行媒体融合以及全媒体播报的情况。“北京时间现在第二天就可以获知前一天网络客户端上发布的所有内容的用户数据,以及不同用户的类型。”在戴元初看来,数据的价值对于传媒人而言,不管是做客户端也好,还是做一般网络意义上的媒体也好,所有的数据都必须要有转化的能力才有大数据的价值。
“云计算、大数据是基础工具,这个基础工具的价值不能低估,也不能过度高估。虽然这种新技术、新概念能够解决许多问题,但是它不能解决所有问题。”戴元初提出了这样的观点。
与戴元初有相似观点的李新民也认为,应该防止传媒业的过度商业化和技术化倾向。他举例说,去年巴西奥运会,腾讯网共发布了360多篇稿件。有不少是机器人写作,每写一篇稿件的时间仅需0.5秒,报道事实的准确率,高达100%。最高点击量超过500万次,这让人对机器人快、多、省、准的编写优势惊叹。“在人们欢呼数据化、智能化采编的同时,我们也应认清人机关系可能带来的副作用。过分依赖机器,可能会导致媒体自主采编能力下降。大数据算法推送,有时易导致媒体内容的趋同。”李新民认为,技术无论怎么发展,它都必须是为了人、服务人。因此,必须让人成为大数据时代媒体改革、创新的真正主角。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在企业数字化转型过程中,“业务模型”与“数据模型”常被同时提及,却也频繁被混淆——业务团队口中的“用户增长模型”聚焦“如 ...
2025-11-20在游戏行业“高获客成本、低留存率”的痛点下,“提前预测用户流失并精准召回”成为运营核心命题。而用户流失并非突发行为——从 ...
2025-11-20在商业数据分析领域,“懂理论、会工具”只是入门门槛,真正的核心竞争力在于“实践落地能力”——很多分析师能写出规范的SQL、 ...
2025-11-20在数据可视化领域,树状图(Tree Diagram)是呈现层级结构数据的核心工具——无论是电商商品分类、企业组织架构,还是数据挖掘中 ...
2025-11-17核心结论:“分析前一天浏览与第二天下单的概率提升”属于数据挖掘中的关联规则挖掘(含序列模式挖掘) 技术——它聚焦“时间序 ...
2025-11-17在数据驱动成为企业核心竞争力的今天,很多企业陷入“数据多但用不好”的困境:营销部门要做用户转化分析却拿不到精准数据,运营 ...
2025-11-17在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10