
大数据对新闻业三大革命性改变
在大数据与信息过剩的风险社会,真正有价值的新闻应当是基于数据分析得出的‘预计明天将有暴风雨’式的对公众的忠告、指南、通知、预警。”概言之,大数据时代的新闻传播较之传统的新闻业态是一种深刻的转型,本文集中探讨大数据对于新闻业态重构的若干革命性改变。
一、生产信息提供者层面的变化
(一)个性化信息推荐:新闻生产机制的颠覆性转变
1、基于个性化信息聚合的信息推荐模式
这种模式是对新闻生产机制的颠覆性转变。“个性化信息推荐”首先是基于个性化的信息聚合,即通过人工智能分析和过滤机制,根据个性化需求聚合相关的信息和应用,并以此对信息进行深度智能分析,以实现用户个性化的、动态的需求。信息聚合已经不再是由媒体主导的信息过滤与筛选,而是基于互联网生产逻辑的信息聚合的过程,并借助特征分析、语义网等技术的发展,形成了基于个人兴趣的个性化信息合成和推荐模式。
社交网络和移动互联网的发展,为个性化信息聚合提供了更广泛和更便捷的平台,使深入分析用户标签之间的联系、跟踪用户标签的使用习惯和频率成为可能,并能够以此为用户推荐个性化内容。
2、基于用户兴趣图谱的个性化新闻推荐模式
以“今日头条”APP客户端为例,其有两个最大的特点:一是基于用户兴趣图谱分析的个性化阅读推荐。“今日头条”基于大数据挖掘技术,会有一个所谓的“冷启动”过程,即通过对用户微博账号的分析建立一个“兴趣图谱”,即兴趣模型,原理是根据用户在微博上发布的内容及其所属类别、用户自标签、社交关系、社交行为、参与的群组、机型、使用时间等数据源来推断出用户的兴趣点有哪些。
二是“今日头条”通过对网易、新浪等各大门户网站的新闻进行内容聚合,完成基于“推荐”、“热门”、“好友动态”三个维度向用户进行包括资讯和评论在内的内容推送。
(二)众包、众筹:从信息集成者到社会意义生成者
2006年,互联网杂志《连线》的资深编辑杰夫?豪(Jeff Hawe)在《众包的崛起》(The Rise of Crowd sourcing)一文中提出了“众包”(Crowd sourcing)这一概念。“众包”是指利用集体智慧来搜集与核实信息、报道故事,或者在新闻生产中做出选择。
1、众包新闻
大数据时代,社会化媒体对数据新闻生产影响深远,它既是数据搜集的重要来源,又可以帮助扩大传播影响力。
2、众筹新闻
众筹新闻(Crowd sourcing news),亦称新闻众筹,是指个人或机构向公众募集资金,实现特定的新闻报道计划。相比喜闻乐见的众包新闻生产,众筹新闻尽管开创了新闻生产的新模式,但是得到的评价却是毁誉参半。众筹新闻充分发动公众参与新闻生产,固然增强了记者与受众的互动性,但是也会容易导致丧失传统新闻生产孜孜以求的独立性。
二、媒体层面的变化
(一)“推倒新闻编辑室的那面墙”:数据团队进驻编辑部
大数据新闻的生产模式决定了头脑风暴和奇思妙想的重要性,部门与部门之间的界限日渐模糊。正如英国卫报数据博客编辑西蒙?罗杰斯所指出的“新闻编辑部的布局很有讲究,如果你越靠近新闻编辑部,就更方便对报道进行交流,成为新闻策划进程中的一部分;反之则两者距离越来越远。”
(二)媒体融合、跨界合作与产业升级:大数据时代媒体机构的自我颠覆
除了“推倒新闻编辑室的那堵墙”,让新的数据团队来主导新闻生产外,从媒体自我颠覆的层面来说,还需要加强跨界合作,与社会化媒体、移动互联网结合起来,把不同行业、领域和终端的数据进行聚合,进行关联分析和价值挖掘,增强媒体融合及跨界合作,加速产业升级。
1、加速媒介融合
大数据技术的运用,促进了不同行业、不同领域、不同终端的数据交换和相互融合。11传统媒体联合新媒体正在打造的“云计算”和“全媒体平台”,能够为大数据分析和数据驱动的生产建立庞大的数据库基础和通畅的信息交流整合渠道。同时还可以对数据进行二次价值的挖掘。
2、增强跨界合作
在大数据分析技术运用方面,新闻媒体还面临着很多挑战。数据的来源、加工和挖掘都需要专门的技术人才和设备等,跨界合作,也许是比自己事必躬亲来说是最适合的方式,不仅可以降低成本,而且可以通过合作碰撞出新的火花。
3、加速产业升级
媒介融合和技术发展给媒介集团带来的冲击有目共睹,迫使传统媒体也在加快与互联网媒体融合的步伐,加速产业升级。文汇新民联合报业集团和解放日报报业集团于2013年合并成立上海报业集团,除了对旗下业务板块进行重新整合之外,还将与百度公司合作,开始了与互联网媒体融合的第一步。
三、用户层面的变化
(一)从“传者中心”转向“用户中心”
信息获取方式的多元化与信息的易得性,使得信息与媒体出现“富余化”倾向,信息生产的单位成本不断降低,信息的供应量以每年8%—10%的速度快速增长。媒介市场从“传者中心”向“受者中心”转变,信息的供应也从供不应求的卖方市场开始进入供过于求的买方市场。
(二)从单向变双向:体验至上,提升用户分析价值
转变为以用户为中心的传播模式后,用户的体验和反馈对媒体的改进尤为重要。因此,通过跨媒体的平台来收集用户意见,通过关联分析受众需求、偏好及行为模式,是提升用户分析价值,增强用户体验满意度的有效途径。
以电视媒体为例,可以通过数字电视或者是互联网智能电视的机顶盒,采集与统计受众对节目内容的接触频次、行为轨迹等数据,甚至提取受众在观看电视时快进、暂停产生的收视率数据与传统媒体收视率数据汇总,以此找出受众的兴趣点和喜好所在。大数据时代,结合个性化的数据平台,通过有效的数据采集和受众洞察系统,可以实现节目定制,为受众带来更好的观看体验和推送内容。
本文来源:CDA数据分析师培训官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30