京公网安备 11010802034615号
经营许可证编号:京B2-20210330
新闻是否可以从数据中发现和挖掘?数据新闻将给我们带来什么?大数据对传媒行业、传媒学科以至人文社会科学的发展意义何在?就这些话题,本报记者采访了相关学者。
春节期间,央视利用百度大数据推出“据说春运”特别节目,播报国内春节人口迁徙情况,受到了广泛关注。大数据的出现和广泛运用催生出一种全新的新闻传播方式——数据新闻,这种新颖的报道方式在满足公众全方位观察社会的需求的同时,也引发了社会各界对“大数据”的再次关注。
新闻是否可以从数据中发现和挖掘?数据新闻将给我们带来什么?大数据对传媒行业、传媒学科以至人文社会科学的发展意义何在?就这些话题,本报记者采访了相关学者。
数据新闻反映现实更为全面
春运期间,百度上线“春运迁徙地图”,人们通过该网站可以获悉8小时内排在前十位的“迁入热市”、“迁出热市”和“最热线路”。据介绍,迁徙地图的奥秘来源于人们日常运用的手机定位服务,百度分析网民的定位信息,利用大数据处理,得出国内各大城市的春运迁徙人口数据。
央视综合频道《晚间新闻》栏目引入该网站数据推出“据说春运”专题报道,以直观图像形式向观众展示全国春运迁徙的情况,并结合相关调查挖掘出诸如“逆向迁徙”等出现的新现象。与传统新闻报道相比,这种新闻建立在大量的数据基础上,反映的现象更为全面。
南京大学信息管理学院院长孙建军认为,大数据包含两重核心内涵:大数据是资源,而且是“人造资源”,依托于人类活动而产生,并能积极影响人类未来活动;大数据是应用,可改进现有思维模式、提高人类“观察能力”。在他看来,大数据之“大”更体现在其中的信息和数据是关联的。
数据新闻更易被理解
依托新闻机构开展的数据服务在世界范围内早已有之。在我国互联网领域,一些网站在美国总统选举、灾难应急事件等报道中,都大量采用了数据报道方式。
“数据新闻是对大数据做二次或更高层次的智能应用。”南开大学计算机与控制工程学院副教授史广顺表示,传统的数据信息大多是事后总结,像统计报表一样,现在所说的大数据则是“实时的”、“鲜活的”。他认为,把大数据和传媒相结合,媒体不仅能实时掌握数据,还能实时知道新闻传播效果,判定受众心态。
“数据新闻是快捷式新闻,不需要铺垫,观点鲜明。从生成方式看,如果数据分析流程顺畅,数据新闻可以做到随时随地报道,且能够满足‘发生及生产’。”孙建军表示,从信息传播角度看,传统新闻需要受众通过阅读抽取信息,有一定的“阅读负担”;而数据新闻则通过深度加工的语义信息呈现给受众,受众更易理解。
不过,孙建军表示,数据新闻一般只“敏锐地”发现问题,却很少给出合理的解释,也无法给出针对性的对策;数据分析的集群研究会忽略重要的个体特征,但个体反而是人文社会研究关注的焦点。
孙建军提到,因为数据新闻信息密度大,信息加工的难度很大,容易出现数据生涩、缺乏可理解性和适用性等状况。
全样本调查:改变传统抽样方法
事实上,大数据的出现和广泛应用不仅创造了全新的新闻传播形式,在更深层次上,或正改变着新闻传播行业及相关学术研究的方方面面。
中国传媒大学新闻学院教授沈浩表示,数据新闻的重要特征是数据可视化,其关键要注重合适的新闻选题。该选题既要满足传统新闻的基本要素,还要有叙事性,以便让人们更好地理解,这涉及对数据的挖掘、分析、可视化等。数据新闻使传统新闻工作者面临新的挑战,它要求人们不仅要有报道新闻的能力,还要具备挖掘数据价值的能力。
孙建军说,大数据这一概念具有超越行业、领域的特点,比如交通部门实时传送的车流量数据、天气预报趋势分析数据等。这些数据并不是新闻机构主动采集的,但也是数据分析的重要来源。
中国社会科学院信息化研究中心秘书长姜奇平表示,在大数据之前,对数据的利用都是抽样调查,而大数据则采用全样本进行调查。在大数据中,人们可以非常精确地看出哪一种事实最有代表性,从而使新闻报道更接近事实的真相。
据了解,除新闻传播等与社会热点紧密联系的领域,大数据在其他人文社会科学研究领域也有着更广泛的应用前景,在历史、文学、法学领域,一些学者开始采用大量的数据分析技术。这正逐渐改变着人们对传统人文社科的理解。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09