京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据新闻传播是什么
大数据新闻传播不同于传统新闻报道那样的简单数字交代,而是展示了一种从宏观与中观的层面对社会某一方面的趋势、动态和结构性的把握。大数据方法在新闻传播时间中的初级应用,是借助类似百度指数等各类数据采集和分析工具去挖掘散落在社会文本“碎片”中的具有新闻价值的资讯描述和意义表达。传统的新闻采集数据的方式更多的是通过线人、采访这种形态,而大数据方法为媒体工作者提供了一个全新的专业工具,帮助大家去挖掘新闻。

大数据方法视野下的新闻传播创新包含这样两个层次的内涵:首先,它是新闻形态的一种创新,包括可视化信息、人性化的嵌入。其次,它是一种全新意义上的内容创新,即通过碎片化的数据及文本的挖掘技术,实现了新形态的“减少和消除不确定性”的新闻内容。
大数据在新闻传播领域的实际应用
目前利用大数据资源的实际社会成效、有实际影响力的产品依然屈指可数。数据源的代表性和价值、良好的供给与需求的合作以及有广泛影响力的平台,是大数据应用获得成功的两条重要因素。
大数据可以实现一种在兴味盎然的“新闻游戏化”的参与中完成的传播读解和消费的过程。例如《华盛顿邮报》关于奥巴马就职典礼的报道,其网站中贴出了千兆像素的巨幅图片展示奥巴马宣誓就职场景,可以清晰地放大每一个局部,让每个参与者“找到”自己或自己的熟人。还有获得美国新闻奖的2013年的雪崩报道,以及阿拉伯之春立体四维报道西亚北非17国的情形,都是运用最新大数据的技术手段改革新闻报道的典型案例。
近期较为成功的大数据报道的案例,就是央视《新闻联播》在2014年春节期间播出的11集“据说”春运和春节。数据说春运和春节的成功有几大因素,其中包括新闻形式上的可视化的突破、新闻内容上的数据化和故事化的画面表达,呈现出“大数据小故事”。
大数据已经是一种客观存在。只不过相当长一段时间,人们缺少有效整合这些数据的技术和手段,并且人们对大数据的使用成本很高。互联网的OTT突破了原来的局限,解决了信息不对称的问题。其中的关键是大数据拥有方的合作与开放。“据说春运”节目的合作方的是百度公司,百度作为最大的中文搜索平台,每天要处理60亿次相关的搜索请求,其海量的数据能够生动翔实地反映中国网民具体的需求、兴趣点,搜索者本人的个人特点,等等。实际上,百度已经可以被视为中国最大的内容提供者。
现阶段大数据方法在新闻传播创新中的难点与关键
大数据方法在新闻传播创新中的难点与关键,现阶段主要集中在大数据方法与新闻传播价值逻辑之间的矛盾,以及大数据的数据源的开放等问题。
1.大数据与新闻的价值逻辑之间的矛盾
大数据与新闻报道之间存在着几对矛盾。首先,事实之间的相关关系在新闻传播中却进行因果关系的解读所构成的矛盾。大数据的核心特色是强调伴随性指标的相关关系,大数据方法甚至于公开拒绝因果关系的认识逻辑。但新闻的传统解读却是具有强烈的因果逻辑的。如果在新闻报道的呈现中不把因果关系考虑进去,不但与人们的认识逻辑相悖,而且也容易滋长解读上的随意性和偶然性,这样便使数据对于新闻报道来说失去了核心意义。其次,大数据的内在逻辑与新闻表达的逻辑在某种程度上是相悖的。因为大数据强调的是信息结构化,抛开故事中心,“去故事化”,这就和传统报道中的故事化诉求产生了矛盾。如何将结构化的数据表现出人类生活的温度和质感,是大数据在应用于新闻传播过程中的一项极为重要的课题。另外,大数据方法与新闻传播所要求的精确性之间也是存在矛盾的,新闻要讲究精确性,而大数据方法却是以模糊性的呈现和把握为特点的。
2.数据源的开放问题
在人人都在说大数据的时代,数据源的开放便非常重要了。互联网本身是由开放精神主导的。如果我们无从得到权威的数据源的话,大数据方法就是一句空话。因此,大数据时代,Google也好,百度也好,必须要有开放的心态。很多媒体在前两年打造自己的微博,看起来是一个交流的平台,但是完全忽略了一个核心原则——只有开放和实现彼此连接,才是具有真正交流价值的平台。就现实而言,有质量的大数据源常常掌握在政府及大公司手中,如何开放这种大数据源的使用,事关社会的发展和人民生活的福祉,必须从制度和机制上给予保障。在这方面,美国政府的数据开放政策不但为政府开放数据源起到了一种很好的参照作用,对于大公司所掌握的数据源的开放也有着重要的借鉴意义。如果掌握着数据的公司或政府将数据源封闭在自己的圈子里,数据的巨大社会价值和商业价值就无法实现。实践表明,对于掌握着数据源的大公司和政府而言,数据放开会使政府和公司得到的比贡献出去的更多。
大数据方法在未来发展中的“行动路线图”是怎样的呢?首先,大数据分析在方法论上需要解决的问题在于:如何透过多层次、多维度的数据集实现对于某一个人、某一件事或某一种社会状态的现实态势的聚焦,即真相再现;其中的难点就在于,我们需要洞察哪些维度是描述一个人、一件事以及一种社会状态的最为关键的维度,这些维度之间的关联方式又是怎样的,等等。其次,如何在时间序列上离散的、貌似各不相关的数据集合中,找到一种或多种与人的活动、事件的发展以及社会的运作有机联系的连续性数据的分析逻辑。其中的难点就在于,我们对于离散的、貌似各不相关数据如何进行属性标签化的分类。概言之,不同类属的数据集的功能聚合模型(用于特定的分析对象)以及数据的标签化技术,是大数据分析的技术关键。
其次,从表现角度来说,嵌入是关键词。我认为,大数据呈现的结果和结论,与人的需求、人的行为、人的认识逻辑需要有一种相适应的嵌入。尤其是在大数据刚刚进入社会生活领域的时候,一定要顺势而为,跟人的需求相关,跟人的认识行为逻辑相关,这样人们就比较容易去解读它,然后去把握它,去消费它,去使用它。比如,与新闻媒介相结合的时候,新闻媒介自身的传播逻辑、传播规则、传播样式,新闻媒介在传播过程的需求点上可以嵌入当中的哪些大数据的服务。这要有更多的数据专家去解读。
最后,与现有的可视化技术发展相联系。日常生活中一些重大的新闻如果能够运用大数据来报道,其深度会大大强化,也能够给人以更强的动感和说服力,并且帮助人们比较准确地把握未来。在这个意义上,大数据与新闻的结合,将是新闻竞争的巨大技术驱动力。
概言之,大数据方法是需要社会规则创新和高智力投入的一项伟大的认识与实践范式。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15在CDA(Certified Data Analyst)数据分析师的日常工作中,“高维数据处理”是高频痛点——比如用户画像包含“浏览次数、停留时 ...
2026-01-15在教育测量与评价领域,百分制考试成绩的分布规律是评估教学效果、优化命题设计的核心依据,而正态分布则是其中最具代表性的分布 ...
2026-01-15在用户从“接触产品”到“完成核心目标”的全链路中,流失是必然存在的——电商用户可能“浏览商品却未下单”,APP新用户可能“ ...
2026-01-14在产品增长的核心指标体系中,次日留存率是当之无愧的“入门级关键指标”——它直接反映用户对产品的首次体验反馈,是判断产品是 ...
2026-01-14在CDA(Certified Data Analyst)数据分析师的业务实操中,“分类预测”是高频核心需求——比如“预测用户是否会购买商品”“判 ...
2026-01-14在数字化时代,用户的每一次操作——无论是电商平台的“浏览-加购-下单”、APP的“登录-点击-留存”,还是金融产品的“注册-实名 ...
2026-01-13在数据驱动决策的时代,“数据质量决定分析价值”已成为行业共识。数据库、日志系统、第三方平台等渠道采集的原始数据,往往存在 ...
2026-01-13在CDA(Certified Data Analyst)数据分析师的核心能力体系中,“通过数据建立模型、实现预测与归因”是进阶关键——比如“预测 ...
2026-01-13在企业数字化转型过程中,业务模型与数据模型是两大核心支撑体系:业务模型承载“业务应该如何运转”的逻辑,数据模型解决“数据 ...
2026-01-12当前手游市场进入存量竞争时代,“拉新难、留存更难”成为行业普遍痛点。对于手游产品而言,用户留存率不仅直接决定产品的生命周 ...
2026-01-12在CDA(Certified Data Analyst)数据分析师的日常工作中,“挖掘变量间的关联关系”是高频核心需求——比如判断“用户停留时长 ...
2026-01-12在存量竞争时代,用户流失率直接影响企业的营收与市场竞争力。无论是电商、互联网服务还是金融行业,提前精准预测潜在流失用户, ...
2026-01-09在量化投资领域,多因子选股是主流的选股策略之一——其核心逻辑是通过挖掘影响股票未来收益的各类因子(如估值、成长、盈利、流 ...
2026-01-09在CDA(Certified Data Analyst)数据分析师的工作场景中,分类型变量的关联分析是高频需求——例如“用户性别与商品偏好是否相 ...
2026-01-09数据库中的历史数据,是企业运营过程中沉淀的核心资产——包含用户行为轨迹、业务交易记录、产品迭代日志、市场活动效果等多维度 ...
2026-01-08在电商行业竞争日趋激烈的当下,数据已成为驱动业务增长的核心引擎。电商公司的数据分析师,不仅是数据的“解读官”,更是业务的 ...
2026-01-08在数据驱动决策的链路中,统计制图是CDA(Certified Data Analyst)数据分析师将抽象数据转化为直观洞察的关键载体。不同于普通 ...
2026-01-08在主成分分析(PCA)的学习与实践中,“主成分载荷矩阵”和“成分矩阵”是两个高频出现但极易混淆的核心概念。两者均是主成分分 ...
2026-01-07在教学管理、学生成绩分析场景中,成绩分布图是直观呈现成绩分布规律的核心工具——通过图表能快速看出成绩集中区间、高分/低分 ...
2026-01-07