京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据创新:要借船出海也要自造航母
本月初,人民网连续刊发两篇评论,指出游戏《王者荣耀》的危害性并呼吁政府和游戏制作方加强监管。于是,《王者荣耀》于日前开启专为未成年人健康游戏而实施的“史上最严防沉迷系统”。在该系统实施之后,根据大数据显示,在玩家最集中的晚间时段,一个小时内共有34万个玩家账号被保护,成长守护平台一天新增绑定45万个账号。
这是未来网总编辑万兴亚在第十二届中国传媒年会的分论坛上,向与会嘉宾分享的一组大数据。“这些数据说明什么?说明大数据能最直观清晰地反映青少年成长问题,我们也可以利用大数据作出反应,未雨绸缪,防微杜渐,从而让孩子们健康地成长。”万兴亚说道。
事实上,大数据在各行各业已经开始突显出其未雨绸缪的重要作用。在传媒领域,搭建大数据平台,有效挖掘大数据,实现大数据创新,是近两年来媒体的思考题,也是行业的必考题。
在大数据建设以及应用方面,灵活的互联网公司已经走在了传统媒体的前面。在技术服务流程上,杭州凡闻科技有限公司实现了全网数据实时覆盖,一家媒体生产的一篇稿子在全网发布之后,被哪些媒体转载了、全网的传播路径是怎样的,都会记录并反馈到大数据平台,平台再将反馈信息对接每一家媒体的后台,媒体就能准确了解所生产的这篇稿件在哪些领域和地方更受关注。
这让不少传统媒体的负责人感到震惊和紧迫。“作为专注于内容大数据分析的公司,凡闻科技有限公司已经拥有凡闻大数据服务平台、易闻版权交易平台、智闻可视化大数据输出服务平台和力闻传播影响力平台。”杭州凡闻科技有限公司董事长王鸣说道。那么,传统媒体又该怎样自建数据库呢?
观媒首席执行官薛陈子给传统媒体指出了几条前行路。首先,传统媒体要获取足够多的资源,建立起自身用户体系。比如,人民日报社的“中央厨房”不是一个封闭的系统,而是一个充分连接用户、连接其他行业的“内容+”平台。这样一个平台,将来一定会产生大量数据。
其次,通过收购、股权合作等方式获得目标数据。比如,浙江日报报业集团用31.9亿元收购边锋和浩方,获得了数以亿计的互联网用户,有效建立了用户连接。目前,这项业务已经占到浙报传媒营业收入30%以上、净利润一半以上。
再次,通过与比较成熟的互联网商业机构合作,如BTA等。这些商业机构已经掌握了绝大多数市场,对数据也有处理能力,他们的数据库对传统媒体来说可以有四项服务:为传统媒体进行受众画像、监控传统媒体的传播效果、分析传统媒体的流量走向和用户兴趣、为传统媒体定制精准投放的分发渠道。
此外,还可以通过政府挖掘数据。在国家大数据工程的推动下,各地政府正在大力推进智慧城市建设、政府数据开放工程等,其中已经有大量的数据被用来服务受众的线上生活,如交通数据中的地图、路况,居民消费数据,金融数据等。由于这部分数据存在一定的安全风险,所以各地政府在数据开放的过程中会选择具有公信力的传统媒体作为合作方。这种情况下,传统媒体就可以积极参与。
最后,党媒数十年来积累的历史数据也值得挖掘。宝贵的历史资料要尽快数字化,并且还要对相似问题进行分析,形成数据库。
“媒体除了做好信息传播之外,还要专注于社会解读和分析预测。而大数据恰恰可以提供对社会全面而深刻的洞察。”万兴亚认为,在数据为王观念的指导下,媒体要有强烈的数据意识,要善于挖掘数据、分析数据和使用数据。
王鸣在主题演讲中也提醒传统媒体要挖掘自身的两大金矿。一是数据金矿,二是渠道金矿。其中,所谓的数据金矿,不但包括现在和今后产生的,还要挖掘过去已经存在的海量内容数据,把历史内容数据唤醒,为传播提供参照和依据十分必要。他认为,当前媒体发展已经从内容为王阶段向内容数据为王阶段发展。可以说,内容数据是今后发展的基础。
借船出海并非放弃原有的海
今年1月—3月,《人民日报》综合发稿7.39万篇,原创占比36.91%;新华社发稿7.3万余篇,原创占比49.37%;央视以视频为主,原创占比达90.94%;腾讯网发稿达46万篇,是主流媒体的10倍,原创占比达19.42%;新浪网发稿41万篇,被转载总数293万次……
“为什么要罗列这些数据?是希望通过数据的收集、聚合、分析、运用来告诉媒体,用户真正想看的东西是什么。”王鸣说,“在大数据产业高速发展的今天,技术问题已经得到基本保障,但更重要的是媒体的内容。再先进的技术也离不开媒体生产力和创造力。”
“优质的内容永远不会遇冷。”今日头条媒体合作与发展总经理安娜也用一组最新的数字,说明了优质内容的受欢迎程度。她介绍,在香港回归20周年的报道中,根据今日头条的大数据显示,央视新闻、澎湃新闻等媒体机构共进行了75场直播,吸引了2530万人观看,获得6222万次点赞,累计观看时长达69.6万小时。
为了能够让优质的内容传播得更远,传统媒体也借助今日头条等内容分发平台的力量。据安娜介绍,目前,已经有超过4000家媒体机构与今日头条展开合作。2016年年底,历史累积阅读量达1亿次的媒体已经有120家,超过5亿次的有24家,其中有5家甚至超过了10亿次。2016年,由媒体机构生产、在今日头条平台上分发的内容共有10.88万篇阅读总量达到10万+,有9336篇达到100万+。2016年12月统计显示,短视频的总消费时长已经是图文内容的1.33倍。而在直播领域,已经有307家媒体机构在今日头条上做直播。
不过,薛陈子认为,“借船出海,并不代表放弃原有的那片海。”传统媒体大多走向内容供应商,于是也会局限了发展。他认为,传统媒体不能因能力不足就固守成规,在分发平台的合作过程中不要完全依赖平台,反而放弃建立自己的用户数据。传统媒体应该制定力所能及、符合自身发展定位的策略,要善于利用政府资源,与政府部门实现合作双赢。
切莫过度解读大数据
“大数据作为一个产业资源,已经影响到各个行业,之于媒体行业来说,对传播体制是一种倒逼。”河南日报报业集团副总编辑董林在圆桌对话中表达了自己的观点。
《影视制作》主编李新民在主题演讲中也开宗明义。他认为,网络化、智能化和大数据化,正在打破媒体的界限、重塑传媒生态。“大数据时代,困扰媒体生产的核心问题是受众在哪里?受众需要什么?实现精准传播的最有效手段是大数据的应用。”李新民说。
北京时间新闻中心总监戴元初也介绍了北京时间目前正在运用大数据进行媒体融合以及全媒体播报的情况。“北京时间现在第二天就可以获知前一天网络客户端上发布的所有内容的用户数据,以及不同用户的类型。”在戴元初看来,数据的价值对于传媒人而言,不管是做客户端也好,还是做一般网络意义上的媒体也好,所有的数据都必须要有转化的能力才有大数据的价值。
“云计算、大数据是基础工具,这个基础工具的价值不能低估,也不能过度高估。虽然这种新技术、新概念能够解决许多问题,但是它不能解决所有问题。”戴元初提出了这样的观点。
与戴元初有相似观点的李新民也认为,应该防止传媒业的过度商业化和技术化倾向。他举例说,去年巴西奥运会,腾讯网共发布了360多篇稿件。有不少是机器人写作,每写一篇稿件的时间仅需0.5秒,报道事实的准确率,高达100%。最高点击量超过500万次,这让人对机器人快、多、省、准的编写优势惊叹。“在人们欢呼数据化、智能化采编的同时,我们也应认清人机关系可能带来的副作用。过分依赖机器,可能会导致媒体自主采编能力下降。大数据算法推送,有时易导致媒体内容的趋同。”李新民认为,技术无论怎么发展,它都必须是为了人、服务人。因此,必须让人成为大数据时代媒体改革、创新的真正主角。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18小陈是某电商平台的数据分析师。老板交给他一个任务:“我们平台的注册用户已经突破1000万了,想了解一下用户的平均月消费金额。 ...
2026-05-18【专访摘要】本次CDA持证专访邀请到拥有丰富物流供应链数据分析经验的赖尧,他结合自身在京东、华莱士、兰格赛等企业的从业经历 ...
2026-05-15在数字化时代,企业的每一次业务优化、每一项技术迭代,都需要回答一个核心问题:这个动作到底能带来多少价值?是提升了用户转化 ...
2026-05-15在数据仓库建设中,事实表与维度表是两大核心组件,二者相互关联、缺一不可,共同构成数据仓库的基础架构。事实表聚焦“发生了什 ...
2026-05-15 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-05-15【核心关键词】互联网、机会、运营、关键词、账户、数字化、后台、客户、成本、网络、数据分析、底层逻辑、市场推广、数据反馈 ...
2026-05-14