京公网安备 11010802034615号
经营许可证编号:京B2-20210330
反思大数据新闻的思维逻辑(1)
作为一种技术,大数据只是计算机数据分析技术新发展的一环。但就其对于新闻传播的影响或者意义而言,国内外研究者对大数据的内涵和外延都已进行了从自然科学到人文社会科学的思想跃迁和现象学式的想象,并将其价值和功能无限延宕。笔者认为,所谓大数据新闻传播,实质可视为计算社会科学的一个新发展,它要求新闻发现、生产与传播范式由传统意义上的以经验、理论和计算为中心转变到以数据处理为中心的新范式,这也就是我们所说的用数据思维产制新闻,即电脑化新闻模式,与传统的人脑(或人工)新闻模式相并立。
与传统文字叙述为主的新闻报道相比,大数据新闻主要通过数据统计—数据分析—数据挖掘等技术手段发现新闻线索,并用逻辑化的数据拓展既有新闻主题的广度与深度,最后以图表、数据为主,辅之以必要的少量文字的可视化方式加以呈现,从而致力于新闻报道的客观、系统和可视体验。这种想象和设计十分契合现代科学追求数字化、量化,把一切都还原为数学方程式的思维逻辑。按照这种思维逻辑的设定,新闻文本只要从纷繁芜杂的数据海洋(现象)中找到某种所谓的本质的东西,比如自然科学的公式,那么信息世界就尽可把握了,如是乎?作为一种认知新闻事物的思维程序,大数据新闻认知的普遍性逻辑必然会抽离个别新闻事物的具体性,其特征是一步一步地撇开个体新闻事物身上道德的、功用的、审美的和哲学的等意义,以还原为最为抽象的同一性。这种新闻生产逻辑必然会遗漏与特定本质属性缺乏关联的非本质新闻属性,从而使个别新闻事物的整体形象和全部意义无法得到认知与传播,最终导致大数据新闻的本质和客观性既不能深刻反映社会意义的原型结构,更不能反映超自然的、高位阶的社会信息需求。也就是说大数据本身是一种理性的表现,但还需要更大的理性——人文法则的观照。依据狄尔泰的看法,人文科学乃至生活世界中的客观性,在于解释与反思一系列视域和融贯性内的诸种关系。一般认为,这些意义、关系越融贯为一体,生活世界和人文科学中的客观性便越是客观的、真实的、具体的。对于大数据新闻而言,如何实现这些关系的内在融合,以实现新闻客观性、真实性和具体性之人文内涵,必须澄清当下“大数据”给我们在如下关系领域内造成的混乱。
(一)重普遍性而轻个体性。
对于大数据新闻人文与科学态度的划分,就是以强调个体性还是强调普遍性为基本依据的。因为人文科学强调的是个体性的人生价值意义而自然科学强调的是普遍性的规律。从大数据的实践层面看,一般认为大数据的时代其实是弘扬理性精神的时代,但如果大数据分析和使用在于满足非正义的事情,那么,这正好说明大数据本身不完全等同于理性,更大的理性是人文法则。最后,大数据新闻从自然之物到文化之物的转化过程,实际上就是普遍性本质转化为个体性本质的过程,也是一个由重共同性到重特异性的转化过程。因此,对于大数据新闻中的人物或者事物,我们都既可以从自然科学的角度来分析和报道,也可以从人文科学的角度来分析和报道。至于大数据如何推动社会进步,这种进步的速度有多快,或者进步的同时是否还会倒退,这些都取决于我们自己。
(二)重关联性而轻因果性。
维克托·迈尔·舍恩伯格在《大数据时代》中指出,随着人们看待数据的方式的变化——从局部变为全部以及从纯净变为凌乱,思维方式也应该转型,即从因果关系转向相关性。或者说,只要知道“是什么”,而不需要知道“为什么”。这观点有些类似于休谟怀疑论的知识论。休谟指出,对象之间并没有可以发现的联系,我们之所以能根据一个对象的出现推断另一个对象的存在,并不是凭着其他的原则,而只是凭着作用于想象上的习惯。这里休谟将因果关系归因于一种未经反思的心理经验,认为一切的抽象以及逻辑推理都是这种心理经验的派生物。这种“想象上的习惯”的关联方式无异于这个经典的社会学考题:冰淇淋的销量和强奸案的发生率存在线性关系,即一个增长,另一个也增长。不过,两者之间显然没有因果关系,而只有相关关系。另一个变量,即天气变暖,才是两者之间的真正桥梁。所以,舍恩伯格这种放弃因果关系而只考察相关性的思路,与其说是一种进步,倒不如说是一种思维紊乱。因为它不利于我们消除不确定性而进行下一步预测,也无法采取行动。研究者辨明因果关系并非来自统计,而是来自研究者的理论和假设。但是大数据分析更关注数据的相关性测量和商业应用价值。大数据是发现那些不能靠直觉发现的信息和知识,甚至是违背直觉的,有时候越是出乎意料可能越有商业价值。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25