
大数据,推倒新闻编辑室的那堵墙_数据分析师
迈克尔•苏德森(Michael Schudson)在《聚光灯,不是“真相的机器”》中指出:“新闻不是‘真相的机器’,而是李普曼所说的‘聚光灯’和‘探照灯’。在大数据与信息过剩的风险社会,真正有价值的新闻应当是基于数据分析得出的‘预计明天将有暴风雨’式的对公众的忠告、指南、通知、预警。”概言之,大数据时代的新闻传播较之传统的新闻业态是一种深刻的转型,本文集中探讨大数据对于新闻业态重构的若干革命性改变。
1、 生产信息提供者层面的变化
(一)个性化信息推荐:新闻生产机制的颠覆性转变
1.基于个性化信息聚合的信息推荐模式
这种模式是对新闻生产机制的颠覆性转变。“个性化信息推荐”首先是基于个性化的信息聚合,即通过人工智能分析和过滤机制,根据个性化需求聚合相关的信息和应用,并以此对信息进行深度智能分析,以实现用户个性化的、动态的需求。信息聚合已经不再是由媒体主导的信息过滤与筛选,而是基于互联网生产逻辑的信息聚合的过程,并借助特征分析、语义网等技术的发展,形成了基于个人兴趣的个性化信息合成和推荐模式。
社交网络和移动互联网的发展,为个性化信息聚合提供了更广泛和更便捷的平台,使深入分析用户标签之间的联系、跟踪用户标签的使用习惯和频率成为可能,并能够以此为用户推荐个性化内容。正如Frog Design咨询公司的时尚观察家所言:“我们正在离开信息时代,迈入推荐时代。”
2.基于用户兴趣图谱的个性化新闻推荐模式
以“今日头条”APP客户端为例,其有两个最大的特点:一是基于用户兴趣图谱分析的个性化阅读推荐。“今日头条”基于大数据挖掘技术,会有一个所谓的“冷启动”过程,即通过对用户微博账号的分析建立一个“兴趣图谱”,即兴趣模型,原理是根据用户在微博上发布的内容及其所属类别、用户自标签、社交关系、社交行为、参与的群组、机型、使用时间等数据源来推断出用户的兴趣点有哪些。随后系统后台作出分析,建立初始的用户兴趣DNA数据,并根据这些兴趣的权重来进行推荐。
二是“今日头条”通过对网易、新浪等各大门户网站的新闻进行内容聚合,完成基于“推荐”、“热门”、“好友动态”三个维度向用户进行包括资讯和评论在内的内容推送。“今日头条”应用的开发者张一鸣认为,“所谓个性化推荐,本质上是不需要用户做出任何选择的……只有让用户越方便,越偷懒的应用,才能体现出真正的个性化推荐。”通过社交数据挖掘+个性化推荐的新闻生产和推送模式,给用户塑造了一种“更懂我”的使用体验,同时也使整个新闻生产流程显得更智能。
(二)众包、众筹:从信息集成者到社会意义生成者
2006年,互联网杂志《连线》的资深编辑杰夫•豪(Jeff Hawe)在《众包的崛起》(The Rise of Crowd sourcing)一文中提出了“众包”(Crowd sourcing)这一概念。“众包”是指利用集体智慧来搜集与核实信息、报道故事,或者在新闻生产中做出选择。杰夫•豪还把众包生产划分成四种基本应用类型,即集体智慧(crowd wisdom)、集体创造(crowd creation)、集体投票(crowd voting)和众筹(crowd funding),它们都是基于大数据时代的海量信息,对数据和信息的重新聚合与价值挖掘。
1.众包新闻
众包新闻就是基于UGC(用户生成内容)的新闻生产。大数据时代,社会化媒体对数据新闻生产影响深远,它既是数据搜集的重要来源,又可以帮助扩大传播影响力。美联社记者乔纳森说,“构成新闻业的方方面面的工作既可在编辑部内部完成,也可在编辑部外部完成,可以是专业人士,也可以是业余人士,甚至民众自己也可以通过自己生成和分析数据的方式来提高对于政治事务的参与。”因此,基于社会化媒体的新闻生产方式,赋予新闻生产新的社会情境,而且破除了媒体间的障碍。
英国卫报的“数据博客”里的很多调查性报道都是采用众包的形式完成。“杰夫•豪认为,在许多行业中,‘众包’代表了运作方式上的彻底改变,尤其是在贩卖信息的行业。”从众包新闻网站的发展来看,英国卫报是影响力最大的,比如利用“众包”报道伦敦骚乱、奥运票务、议员消费情况等等。韩国的Ohmynews.com网站,也是以网络社区公众为核心,众包生产“公民新闻”的典范。如今,Ohmynews已经发展成为韩国最具影响力的新闻网站之一,其主要原因就在于这种独特的理念和前瞻性的众包式的新闻生产方式。
2.众筹新闻
众筹新闻(Crowd sourcing news),亦称新闻众筹,是指个人或机构向公众募集资金,实现特定的新闻报道计划。相比喜闻乐见的众包新闻生产,众筹新闻尽管开创了新闻生产的新模式,但是得到的评价却是毁誉参半。众筹新闻充分发动公众参与新闻生产,固然增强了记者与受众的互动性,但是也会容易导致丧失传统新闻生产孜孜以求的独立性。所以到现在为止,众筹新闻作为新闻生产的一种创新理念,前方的道路仍然充满未知的变数。众筹新闻是一个开创性的模式,虽然从一定程度上丰富了新闻生产和消费,但并不能取代传统的新闻报道形式和媒体经营模式,公众对于免费新闻的依赖、资金链的持续性、对透明性和公正性的要求、以及记者从新闻工作者向市场推销者的角色转变等问题,都影响着众筹新闻的未来。
2、 媒体层面的变化
(一)“推到新闻编辑室的那面墙”:数据团队进驻编辑部
2014 年3月24日,纽约时报发布了一份长达96页的《创新报告》,这份报告和该报社首位被解职的女主编一起成为业界关注的焦点,并再次引发了对于传统媒体数字化前景的关注。《创新报告》一方面再次强调了数字化转型的必要性和紧迫性,另一方面,也对报纸这样的传统媒体机构的改革提出了建议:脱离过去采编部分独立于其他部门,只关注内容生产的单一模式,要加强与技术、设计、产品、市场部门的合作,记者编辑也要参与到内容推广的流程当中。简言之,就是要把各部门进行融合,让数据团队入驻新闻编辑部。
这里的数据团队,指的就是基于各部门融合的、跨领域合作的数据新闻生产团队。 2012年首届国际数据新闻奖获奖作品的运行过程显示,数据新闻比拼的不是采访力量和团队规模,更看重具有新闻敏感的人与具有数据挖掘、分析和可视化呈现能力的人之间的相互协作。大数据新闻的生产模式决定了头脑风暴和奇思妙想的重要性,部门与部门之间的界限日渐模糊。正如英国卫报数据博客编辑西蒙•罗杰斯所指出的“新闻编辑部的布局很有讲究,如果你越靠近新闻编辑部,就更方便对报道进行交流,成为新闻策划进程中的一部分;反之则两者距离越来越远。”
芝加哥论坛报也正在实施把数据团队加入新闻编辑部的改革,双方就明确的新闻报道任务实时进行直接交流,协助记者调查和报道故事,在线描绘故事,并为芝加哥当地的特定群体建立永久的网络资源。澳大利亚全国广播公司(ABC)则组建了包括网页开发及设计人员、数据采集分析人员、数据挖掘、图形可视化的技术人员等七类人在内的数据新闻团队,来完成从传统新闻编辑团队向数据新闻编辑团队的转变。
(二)媒体融合、跨界合作与产业升级:大数据时代媒体机构的自我颠覆
除了“推倒新闻编辑室的那堵墙”,让新的数据团队来主导新闻生产外,从媒体自我颠覆的层面来说,还需要加强跨界合作,与社会化媒体、移动互联网结合起来,把不同行业、领域和终端的数据进行聚合,进行关联分析和价值挖掘,增强媒体融合及跨界合作,加速产业升级。
1.加速媒介融合
大数据技术的运用,促进了不同行业、不同领域、不同终端的数据交换和相互融合。11传统媒体联合新媒体正在打造的“云计算”和“全媒体平台”,能够为大数据分析和数据驱动的生产建立庞大的数据库基础和通畅的信息交流整合渠道。同时还可以对数据进行二次价值的挖掘。在媒介融合过程中,报纸、广播、电视等都成为全媒体平台的一部分。传统媒体在向商业公司体制转变的过程中,可以利用大数据分析,从社交媒体、移动媒体这些跨媒体终端上采集评论信息和使用信息,比如对点击率、转发率等数据进行分析,分析读者偏好,把握市场脉搏。如果能把大数据分析和市场调查结合起来,就会得到更精确的结果。
2.增强跨界合作
在大数据分析技术运用方面,新闻媒体还面临着很多挑战。数据的来源、加工和挖掘都需要专门的技术人才和设备等,跨界合作,也许是比自己事必躬亲来说是最适合的方式,不仅可以降低成本,而且可以通过合作碰撞出新的火花。比如“据说春运”就是央视与百度搜索合作制作的大数据新闻报道,央视负责专题选定和新闻制作,百度负责数据采集和挖掘,这对双方都是利好的事情,后来的“据说两会”、“据说就业”等也证明了这种跨界合作的可持续性和良好的合作前景。
3.加速产业升级
媒介融合和技术发展给媒介集团带来的冲击有目共睹,迫使传统媒体也在加快与互联网媒体融合的步伐,加速产业升级。文汇新民联合报业集团和解放日报报业集团于 2013年合并成立上海报业集团,除了对旗下业务板块进行重新整合之外,还将与百度公司合作,开始了与互联网媒体融合的第一步。2012年佛山传媒集团开始与国际调研公司尼尔森公司合作,希望根据多媒体平台数据库的整合与分析,为集团转型发展提供战略性的策略指导。在媒介融合以及跨界合作的趋势影响之下,基于大数据时代飞速发展的信息采集和分析技术,将给传媒产业带来巨大机遇和价值,基于“开放、关联、对接”的互联网逻辑,传统媒体的产业升级,不仅仅包括产业结构,还在于生产理念、商业模式和用户体验等方面的改革。
除此以外,传统媒体要想在大数据时代成功实现自我颠覆,在媒介内部也要模糊部门之间的界限,正如纽约时报的《创新报告》所倡导的那样,要把原本区分采编部门和其他运营部门的“墙”推倒,加强采编部门和客户服务、技术应用与设计、数字挖掘、产品研发这些部门之间的协同合作,坚持“产品第一、部门第二”的原则。
3、 用户层面的变化
(一)从“传者中心”转向“用户中心”
信息获取方式的多元化与信息的易得性,使得信息与媒体出现“富余化”倾向,信息生产的单位成本不断降低,信息的供应量以每年8%—10%的速度快速增长。媒介市场从“传者中心”向“受者中心”转变,信息的供应也从供不应求的卖方市场开始进入供过于求的买方市场。表现在新闻报道领域,即对数据进行筛选、整理和挖掘后转化为满足不同层面受众需求的细分化、定制化的新闻资讯,借助于新媒体平台,以直观、易用的形式向公众提供互动式服务,满足公众日益增长的知情、监督和选择的需求。
(二)从单向变双向:体验至上,提升用户分析价值
转变为以用户为中心的传播模式后,用户的体验和反馈对媒体的改进尤为重要。因此,通过跨媒体的平台来收集用户意见,通过关联分析受众需求、偏好及行为模式,是提升用户分析价值,增强用户体验满意度的有效途径。
以电视媒体为例,可以通过数字电视或者是互联网智能电视的机顶盒,采集与统计受众对节目内容的接触频次、行为轨迹等数据,甚至提取受众在观看电视时快进、暂停产生的收视率数据与传统媒体收视率数据汇总,以此找出受众的兴趣点和喜好所在。继而,建立起受众收看习惯和口味偏好的强大数据库,为受众筛选出最适合的内容,再加以针对性推荐;此外还可打造个性化的推荐栏,生成“我的媒体单”,推荐符合受众兴趣偏好的内容产品,帮助其更快捷、方便地找到所需内容。大数据时代,结合个性化的数据平台,通过有效的数据采集和受众洞察系统,可以实现节目定制,为受众带来更好的观看体验和推送内容。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29CDA 数据分析与量化策略分析流程:协同落地数据驱动价值 在数据驱动决策的实践中,“流程” 是确保价值落地的核心骨架 ——CDA ...
2025-08-29CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-28CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-08-28PCU:游戏运营的 “实时晴雨表”—— 从数据监控到运营决策的落地指南 在游戏行业,DAU(日活跃用户)、MAU(月活跃用户)是衡量 ...
2025-08-28Excel 聚类分析:零代码实现数据分群,赋能中小团队业务决策 在数字化转型中,“数据分群” 是企业理解用户、优化运营的核心手段 ...
2025-08-28CDA 数据分析师:数字化时代数据思维的践行者与价值推动者 当数字经济成为全球经济增长的核心引擎,数据已从 “辅助性信息” 跃 ...
2025-08-28ALTER TABLE ADD 多个 INDEX:数据库批量索引优化的高效实践 在数据库运维与性能优化中,索引是提升查询效率的核心手段。当业务 ...
2025-08-27Power BI 去重函数:数据清洗与精准分析的核心工具 在企业数据分析流程中,数据质量直接决定分析结果的可靠性。Power BI 作为主 ...
2025-08-27CDA 数据分析师:数据探索与统计分析的实践与价值 在数字化浪潮席卷各行业的当下,数据已成为企业核心资产,而 CDA(Certif ...
2025-08-27t 检验与 Wilcoxon 检验:数据差异比较的两大统计利器 在数据分析中,“比较差异” 是核心需求之一 —— 如新药疗效是否优于旧药 ...
2025-08-26季节性分解外推法:解锁时间序列预测的规律密码 在商业决策、资源调度、政策制定等领域,准确的预测是规避风险、提升效率的关键 ...
2025-08-26CDA 数据分析师:数据治理驱动下的企业数据价值守护者 在数字经济时代,数据已成为企业核心战略资产,其价值的释放离不开高 ...
2025-08-26基于 SPSS 的 ROC 曲线平滑调整方法与实践指南 摘要 受试者工作特征曲线(ROC 曲线)是评估诊断模型或预测指标效能的核心工具, ...
2025-08-25神经网络隐藏层神经元个数的确定方法与实践 摘要 在神经网络模型设计中,隐藏层神经元个数的确定是影响模型性能、训练效率与泛 ...
2025-08-25CDA 数据分析师与数据思维:驱动企业管理升级的核心力量 在数字化浪潮席卷全球的当下,数据已成为企业继人力、物力、财力之后的 ...
2025-08-25CDA数据分析师与数据指标:基础概念与协同逻辑 一、CDA 数据分析师:数据驱动时代的核心角色 1.1 定义与行业价值 CDA(Certified ...
2025-08-22Power Query 移动加权平均计算 Power Query 移动加权平均设置全解析:从原理到实战 一、移动加权平均法的核心逻辑 移动加权平均 ...
2025-08-22描述性统计:CDA数据分析师的基础核心与实践应用 一、描述性统计的定位:CDA 认证的 “入门基石” 在 CDA(Certified Data Analy ...
2025-08-22