京公网安备 11010802034615号
经营许可证编号:京B2-20210330
如何评价《人民日报》于 10 月 5 日发表的《不能让算法决定内容》?
《人民日报》(4 版)10 月 5 日发表题为《不能让算法决定内容》的文章。文章称,随着大数据、人工智能的广泛应用,一些商业网站、移动新闻客户端,都在运用算法这个「读心术」。文章指出,技术往往是一把冷冰冰的双刃剑,在价值和利益的天平上,所谓的算法成为了利益的砝码。一切围着流量转,唯点击量、转发量马首是瞻,「标题党」泛滥,价值取向跑偏,内容沦为附庸。
文章认为,算法不是王法,算法决定内容更不是王道。只有算法回归到服务内容的角色,变得有态度、有深度、有温度,才能让人们在信息的海洋里尽情遨游、在清朗的环境中自由飞翔,才能使网络空间碧波荡漾,激发出源源不断的正能量。
不吹不黑。只从技术角度来看,《人民日报》这篇文章也提到了一个很有意义的问题,那就是信息化时代我们很容易在不知不觉中被推荐内容“洗脑”。在现有技术手段下,适当引入人工筛选可以遏制一些有害行为,如软文推广、诈骗信息、虚假新闻等。
简单的科普一下媒体流常用的推荐算法:
在新用户注册时,你会被要求填写一些感兴趣的话题,作为初始“种子”进行文章推送。比如你表明你对篮球感兴趣,那么你的首页有很大比例都是篮球相关。
随着你的浏览量上升,比如关注了不同媒体或者大量浏览某个话题的文章以后,平台就会提高这类内容的占比。比较传统的协同算法,就是找到和你兴趣相似的人并把他们的浏览内容推荐给你,或者和当前文章相类似主题的文章。
当你看的文章越来越多,风格越来越鲜明以后,你的账户会被打上一些“标签”,对你的浏览爱好进行分类。有时候有社交属性的网站还会把使用者进行网络化/图谱化分析,加强推荐的准确性。
1. 推荐算法有什么问题?
你只能看到特定的话题,很难跳出这个信息圈。而这种效应会不断加强,时间久了容易一叶障目不见泰山。普通用户感兴趣的话题还是以生活、娱乐为主,导致其他有意义内容的生存空间比较小。不难发现,信息分发平台的每日推送头条常常是以明星八卦为主。慢慢的,你发现你对每个明星的行程了如指掌,但并不知道原来自动驾驶汽车已经上路实验好几年了。
很多网站试图加入一些“创新元素”,比如也会推荐“你可能对XXX感兴趣”。但往往这类帮助用户跳出“舒适圈”的信息流都很难引起大家的兴趣,还往往被用户批判一番。于是,最终能存活在大量用户时间线上的信息就主要是吸引眼球的爆款文了。这不仅促进了“标题党”和“博眼球”,也使得用户的精力花在了没有营养的内容上。
2. 如何利用推荐算法“作恶”?
对于推荐系统的依赖也给了别有用心的人发挥空间。大部分平台的推荐内容中都有一些难以分辨的广告推广、高级软文、甚至诈骗等。比如,一篇介绍中老年疾病的科普文章最后变成了销售保健品,可谓防不胜防。这可能是因为平台技术能力不足,也有可能是装作看不见甚至推波助澜,毕竟最后可以把锅推给算法。推荐系统不仅可以计算出推荐什么内容,也可以推测你适合的广告有哪些。即使不用算法推荐,人工推荐其实早就出现在了分发平台上,只不过更多的用在了商业推广上。
因此,标榜推荐算法的平台也有“作恶”的权力,比如慢性洗脑。请相信潜移默化的力量,慢慢的你会以为这些软文这是自己想看的内容,可能还在现实生活中购买了相关的产品。
3. 如何平衡推荐算法和人工筛选?
在法律法规和技术能力的双重限制下,不妨这么想:
站在官方角度考虑,建议将现在百分之二十的推荐文章替换为“我们需要阅读的文章”,比如“两学一做”等主旋律文章。很多平台,比如澎湃早就走了这个路线。这部分文章由编辑/运营手动选择,推荐给所有用户并关闭评论。在将来,或许当地政府选择“适合当地人民的内容”...这是时代的选择,我们都无可选择。
站在个人用户的角度,建议将系统推荐中百分之二十替换成“开阔眼界”的文章,比如前沿科技、艺术赏析、文化历史等。在比例不高不引起用户反感的前提下,尝试给用户提供一些不同的内容。
人工筛选也应该被用在识别“有害的内容上”,处理那些算法无法识别的恶意信息。很多高级的推广写的极具迷惑性,现在的语义分析能力并不能很好的区分出来。虚假新闻也很难依靠算法识别,这也是编辑/运营可以手动检索的内容之一。
科技企业也需要提高自己的业务道德。不是每一种钱都可以赚,人血馒头不能吃。如果明知是恶意信息但因为有利益原因还是将其推荐给用户,我宁可我们没有先进的技术。那些因为科技公司作恶而倾家荡产甚至失去生命的人的名字并没有远去,只是很容易被遗忘。内容推荐、新闻推送只不过是不同平台上的另一个应用,而类似的悲剧已经够多了。
4. 如果我不喜欢推送或者不愿意被“洗脑”怎么办?
技术宅建议还是选择自己订阅感兴趣的主题如RSS,或者写爬虫从特定站点收集自己感兴趣的话题。依赖于主流媒体的内容推送,不管是人工还是系统推荐,或多或少对会被洗脑。“定制化”和“效率”很难兼得。你如果要节省时间从平台处吸收资讯,就得接受他们“强奸”你的思想。
5. 这篇文章对于我们有什么启发?
换个角度看,这篇文章无心插柳地给普通大众提了个醒,要对于科技发展和技术公司保持警惕。大部分用户已经把安全和隐私完全交给了科技公司,现在连自己能看到什么也交了出去,这是无奈但正在发生的事情。过去短短几年,我们已经见识了多少科技公司做过的“恶”。
“民主”和“自由”本身就是对立的。问题的核心还在于提高分发平台的商业道德和技术能力,以及用户的阅读分辨能力。在短时间内,这两件事都不会发生,所以增加人工推荐的比例也不完全是个坏点子。我不反对利用人工筛选来增加些“主旋律内容”,但也希望增加一些“拓展眼界”的文章,并利用人工来减少一些迷惑性强的有害内容。
退一步说,大时代下没有人能独善其身,这也只是个开始而已 ʕ* ᴥ* ʔ
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在互联网运营、产品优化、用户增长等领域,次日留存率是衡量产品价值、用户粘性与运营效果的核心指标,更是判断新用户是否认可产 ...
2026-05-09相关性分析是数据分析领域中用于探究两个或多个变量之间关联强度与方向的核心方法,广泛应用于科研探索、商业决策、医疗研究、社 ...
2026-05-09 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-05-09在数据驱动运营的时代,指标是连接业务目标与实际行动的核心桥梁,是企业解读业务现状、发现问题、预判趋势的“量化标尺”。一套 ...
2026-05-08在存量竞争日趋激烈的商业时代,“以客户为中心”早已从口号落地为企业运营的核心逻辑。而客户画像作为打通“了解客户”与“服务 ...
2026-05-08 很多数据分析师每天与Excel打交道,但当被问到“什么是表格结构数据”“它和表结构数据有什么区别”“表格结构数据有哪些核 ...
2026-05-08在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-05-07在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28