京公网安备 11010802034615号
经营许可证编号:京B2-20210330
机器算法和大数据技术帮助消除虚假信息的传播
如何识别和拦截虚假信息在社会上的流传,一直是媒体工作者们面临的难题。而随着新媒体和社交平台兴起、公众自发分享信息成为流行,这一问题也变得较历史上更加复杂,已经成为全球新闻界和技术界共同面对的一项挑战。
今日头条因为创造性地将机器算法和大数据技术应用于媒体传播领域而获得广泛的关注,现在,我们也在尝试着用计算机和大数据帮助我们消除各类虚假信息在今日头条上的传播。
根据传统的方法,识别虚假信息需要具备相关领域专业知识的工作人员进行审核判断,但目前今日头条平台上各类机构分享发布的信息每天已经接近20万篇。仅靠人工进行识别判断难以保证这项工作的效率和准确性。
因此,今日头条开始尝试结合机器算法和用户反馈来提升虚假信息识别的效率。例如,有大量用户举报了一篇内容为虚假信息,或在某篇内容的评论区中密集出现“假新闻”等相似关键词,机器即可自动识别并将其提交至今日头条审核团队的工作后台,提示进行高优先级的复审。目前,机器通过收集分析各类用户反馈识别虚假信息的准确率达到60%,结合人工复审可进一步提升到90%。
在准确甄别虚假信息后,今日头条运营团队将会立刻停止虚假信息的推荐和展示,并依据平台运营规则对发布虚假信息的来源进行处罚。
对于在被发现和停止推荐以前,已经造成较大范围影响的虚假信息,今日头条也在尝试通过大数据技术进行“精准辟谣”。这项功能已经在12月开始初步实验,其实现方法是:通过某篇虚假信息的用户阅读记录,将阅读过此信息的用户识别和标注出来。当辟谣信息发布时,则可通过特别的推荐通道,指定向这部分曾阅读过虚假信息的用户进行展示。
这类“辟谣”信息在这部分用户的信息流中显示为带有一类特殊标签的信息,从而引起该用户的格外重视。此“精准辟谣”功能在12月先后实验性地应用于“网传搜狐撤裁内容部不再设编辑岗位”和“网传保定曲阳一23岁女孩光天化日之下被抢走”两次虚假信息传播事件中。基于大数据技术的“精准辟谣”,相比传统的通报辟谣方式,能够更加精准地消除虚假新闻的传播影响,并且对无关用户造成更少的干扰。
今日头条作为智能分发和信息推荐引擎的发明者,一直在尝试使用创新技术实现人与信息之间精准、高效的连接。而在技术解决方案之外,新闻和内容工作者对事实真相的挖掘报道、用户对有害信息的及时反馈,对于维护信息传播的清洁度依然是非常重要的。新闻工作者、内容创作者和普通用户共同构成了技术方案得以有效工作的基础。
今日头条期待社会各界共同对今日头条平台上潜在的虚假信息进行监督、反馈、指正,也欢迎对今日头条的信息治理提供创意和建议。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-05-07在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24