京公网安备 11010802034615号
经营许可证编号:京B2-20210330
伦敦德比大数据:切尔西往绩占优 降盘不降水
面对大数据的考验,传统媒体站在十字路口。一方面,新闻的内容正在发生变化,数据可以拓展新闻报道的内容,挖掘有价值的联系和规律。另一方面,新闻的呈现方式也在发生变化,可视化的程度更高。然而,利用大数据做新闻,记者还面临着一系列值得注意的问题。而我国新闻媒体运用大数据报道新闻方面尚处于初级探索阶段,需要借鉴国际同行的经验。
大数据新闻报道魅力何在?
【背景】今年春运期间,在央视综合频道《晚间新闻》栏目中,一则名为“据说春运”的专题报道引发观众好评如潮。随着HTML5的异军突起,数据新闻的表现形式越发多样化。而从2009年开始,包括英国《卫报》、财新传媒在内的国内外媒体已先后组建了数据新闻团队,可视化新闻已经从“配角”变为“主角”,从“噱头”变为“看头”。
主持人:与传统新闻相比,大数据新闻有何特色?
郭俊义:对大数据的采集和挖掘,为新闻报道开辟了一个全新的领域。从新闻报道的内容来说,传统的新闻报道是需要有记者去实地采访,形成文字稿,或者视频片,然后再经过编辑后期的加工才能出来。但是大数据新闻基本不需要用传统的采访方式,它通过跟拥有大数据源或者大数据挖掘技术的互联网公司合作,就能从中挖掘出新闻。另外从新闻报道的表现方式来看,大数据新闻是通过可视化的方式来呈现,这些可视化手段让以往单调和抽象的数据更易被受众接受。
沈浩:我们身处移动互联网时代,每个人的上网行为,比如购物、社交、看新闻、出行等数据都可以被实时抓取,这些都为大数据新闻提供了丰富的新闻素材。此外,相比于传统新闻报道,大数据新闻更加善于抓住每个个体,比如像今日头条,它能更多地为每个个体进行新闻的“私人定制”,实现点对点的传播,而不再是传统的点对面的新闻传播。
喻国明:传统的新闻报道本身有它自身的价值,它对个体的观察,对现场的描述等都是它的长处,但有限的样本调查报道会影响新闻报道的客观性。比如说一个政策公布之后,一名记者如果用传统的方式,去走访一些他认为比较有代表性的采访者,例如教师、干部、群众、工人、农民等等,把他们的意见采集到一起进行整理,并认为这样就很有代表性了,能够反映各界人士的心声。但其实这样的采访方式由于带有太多的主观因素,得出的结论很容易产生偏差。大数据新闻报道则基于对大量庞杂数据的分析,样本会更加全面,使报道结果能相对客观一些。
数据一定不会说谎吗?
【背景】在当今互联网普及的社会中,几乎每一个人都会和统计数字接触,但有时貌似精确的统计数字在被人利用后,也会成为迷惑他人的工具。美国统计学家达莱尔·哈夫的《统计数字会撒谎》一书被中国网友称作“数据打假手册”,他在书中建议,在看到统计数字后,你应当首先问自己5个问题:“谁说的”“他是如何知道的”“遗漏了什么”“是否有人偷换了概念”“这个资料有意义吗”。
主持人:相比于传统的新闻报道,大数据新闻在样本选择上要庞大得多,这是否意味着大数据新闻报道一定比传统新闻报道更加客观?
郭俊义:与传统新闻一样,大数据新闻报道同样面对新闻的真实性、规范性等新闻伦理的问题。甚至在一些大数据新闻报道中,也需要用传统的新闻报道介入以核实信息的准确性。比如我们在《据说春运》的制作过程中,有一期百度大数据显示,从成都流向北京的人流量非常大,但按常理说,过年人流都是从大城市流向中小城市的,于是我们立即请成都站的记者去实地进行采访和拍摄,结果发现车上很多都是老年人,原来他们是从成都出发去北京的孩子身边过年。
喻国明:并不是所有的数据新闻都是准确客观的。数据新闻在制作的过程中会有指标选择、样本采集、分析方法、表述方式等一系列步骤,在此过程中都会面临一些主观因素的干扰。
沈浩:在大数据研究中有一个词叫作“脏数据”。比如在社交网络上存在大量的“水军”,通过“注水”发帖来扰乱网民的真实想法。那我们在研究中如果使用了因此而得来的数据,就会造成数据分析结果的偏差。
能否成为常规报道方式?
【背景】9月5日,国务院印发《促进大数据发展行动纲要》,其中指出,到2018年底前,建成国家政府数据统一开放平台,率先在信用、交通、医疗、卫生、就业、社保、地理、文化等重要领域实现公共数据资源合理适度向社会开放。2020年底前,逐步实现信用、交通、医疗等民生保障服务相关领域的政府数据集向社会开放。
喻国明:大数据新闻报道目前还处于起步阶段,面临很多挑战。第一是大数据的来源是受限制的,一些政府的统计数据,尤其是涉及民生的,目前很多都没有开放给公众。第二是数据来源的单一性,大数据不仅仅是数据的规模大、量大,大数据信息还涉及品类的多样性,比如你要研究人的社会活动,那你不仅仅是要看他的交往数据,而且最好还能看到他的购买数据等等。可以说,全世界到目前为止,针对大数据新闻报道,并没有找到一个完整、统一的规范和彻底的解决方案。
郭俊义:大数据新闻在未来会有越来越多的用武之地,特别是在很多跟民生密切相关的领域。比如上海外滩踩踏事故中的调查报告提到,当天执勤的民警曾经用肉眼看到过人流量过于密集,后来我在想,如果我们当时能有一个人流量的数据流动图,或许以后再遇到此类状况就能避免悲剧的发生。事后我找到腾讯公司,跟他们要到了当天在外滩的人流量数据图,并且对比事故发生的前一天和后一天,做了一个GIF人流量变化的动图,对比非常明显。如果以后的媒体能更多地跟大数据公司合作,会更好地彰显新闻的服务功能。
沈浩:新学期开学我们迎来了中国传媒大学第一届数据新闻专业的学生,这些新生在未来4年除了要学习传统的新闻知识,还要学习统计、编程、数据可视化制作等针对数据新闻的专业知识。其实放眼全球,必备的统计、编程、制图技能已经成为优秀记者的“标配”,这是一个未来的发展趋势。其实我们两年前就已经在校内开设了针对大二学生的数据新闻的实验班,虽然他们明年才正式毕业,但已经被很多媒体提前预订,这证明这类人才非常有市场。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04