
INMA在12月刚刚发布了战略报告:《大数据让传媒公司的决策更加明智》,报告研究了默多克新闻集团(News Corp)这三年里在大数据领域的作为。身为新闻集团CTO的Paul Cheesbrough在这篇报告里介绍了News Corp如何领先其他传媒集团,并分三个战略步骤推进他们的大数据规划。在经历了最初的收集数据、保护数据两个步骤以后,如今,新闻集团开始谋划用大数据 撬动盈利杠杆,并深刻植入用户关系维护、新闻采编等多个环节中。一起走进新闻集团的大数据蓝图。
“新闻集团从三年前开始对大数据进行战略投资,那时它正在为如何检验投资回报率一筹莫展。但新闻集团把眼光放得很长远,并逐步开始推进这项战略。”新闻集团首席技术官Paul Cheesbrough。
作为全球性的传媒集团,新闻集团旗下业务包括报纸、杂志、书刊、网络、电视、教育项目、营销等,如今它正试图用大数据来驱动优化并实现品牌的聚合效应。
向大数据进军:收集、保护、盈利,步步为营
新闻集团大数据战略开启以来,内部业务已经在不同程度上趋近成熟,经历了以下三个阶段:
第一步,收集并储存各个部门的第一手数据;
第二步,确保数据安全性,有些数据会危害到隐私,或者被第三方用来获取新的利益;
第三步,通过分析数据得出有价值的结论,并以此获得更多的收入。
新闻集团目前正处于‘保护数据’的最后阶段,下一步他们需要思考如何有效地使用这些数据产生价值。
“随着公司数字产品的增多,我们已经可以熟练地驾驭这些产品,通过数据分析准确地获知是谁在阅读,在什么时间阅读,以及在什么设备上阅读。”Paul Cheesbrough补充道,“对那些成立较早的传媒公司来说,通过订阅在线新闻与读者建立长期联系是很难做到的。”
组建精良团队实现战略出击
在对用户数据进行挖掘时,新闻集团也挖走了谷歌在欧洲的一位高手,并成立了专项团队,由他领导,该战略与谷歌、Facebook和雅虎的数据战略发展路线基本相同。
“我们发现,做大数据并没有什么最佳解决方案,必须依靠出色的工程师、技术人员和设计师,才能把碎片化的东西聚合在一起进行优化,聘用合适的人是成功的关键。”Paul Cheesbrough强调了人才对发展大数据战略的意义。
最近,新闻集团又加入了一位首席数据科学家,他的工作是从已经获得的数据中提出具有挑战性的问题,并以此推导出有价值的观点和可操作的方法。”
基于第一手数据实现广告精准投放
为了更好地保护隐私,2013年新闻集团开始逐步排除嵌入在其数字产品中的第三方参与者,并基于第一手数据推出了它的全球广告交易平台,以实现广告投放最优,并维护良好的客户关系。
除此之外,新闻集团还基于第一手数据,向读者推送内容和广告,它还和美国大数据公司Palantir Technologies 合作,研究用户的参与和流失,以精准预测用户是否会继续阅读。
平台推出的第一年里,新闻集团取得了令人满意的广告收入。“我们很快就收回了之前数据战略投入的费用。”Paul Cheesbrough相信,数据可以帮助他们更好地维护与广告客户之间的关系,获取更多收入。
举个例子,新闻集团将数据运用到这样一起实际用户体验调查中。《华尔街日报》的很多内容 都需要用户付费才能观看,不过也有一些免费内容,但是如果能针对付费用户和普通用户做不同的内容推送呢?新闻集团做了一个测试,通过页面的一个金钥匙图标 将指定的内容只提供给订阅用户,通过产生的数据来判断这个钥匙图标是否能增加用户阅读,或者会对他们产生干扰造成用户的转变和流失。
结果表明,这个图标对用户转变来说并没有产生什么实际影响,但是如果把图标拿走,便会有用户发生转变。
将数据植入媒体运营和新闻采编
新闻集团的每项业务都为建立它自己的内部数据团队积累经验。数据的用处不再只是为了做报告,或者仅仅为了统计浏览量和用户,必须挖掘出数据中的价值并据此预测未来。
为此,不同品牌和部门之间经常进行沟通,分享最佳的操作方法,以便迅速采取行动。“如果我们伦敦的某个业务中有非常有效的方法,数据会立刻告诉我们,然后我们会把这种方法导入到其他业务中,基于数据分析对应用和产品做出修改或者做新的设计。”
新闻采编室的工作人员也可以接触到很多数据,以了解他们生产的内容可以吸引到多少用户。数据的使用让Paul Cheesbrough对员工的工作状态十分满意,“我们的新闻采编室和创意团队在创作故事和产品时都会使用数据,这让他们工作时充满激情。”
前沿技术驱动数据运营优化
新闻集团很早就开始在业务中运用新技术,如云计算服务、Apache Hadoop(一种分布式系统基础架构)和开源软件,用以储存和处理海量数据。在建立平台的过程中,他们也广泛地使用了一些有效的工具。
“我们不会只和单一供应商合作或只使用一个平台,我们的工程团队已经利用Hadoop、Hive、谷歌组件和一些其他软件建立起了自己的全球数据采集平台,这个平台目前已经应用到我们所有的业务当中。”
数据加密确保用户隐私
处理数据需要花费大量的精力,且必须确保数据的安全性。新闻集团采用加密技术,并在每个数据安全区域配备工作人员,它也把一小部分第三方技术嵌入到数字平台以获取用户数据。
对于用户的隐私,Paul Cheesbrough表示:“我们非常重视用户的隐私,所以我们每个业务品牌在收集和使用数据时都坚持用户安全条款和限制。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29