京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据与情感分析:言多必得与言多必失
SmogFarm从事的是基于大数据的情绪分析,衡量、跟踪、聚合数百万人的情绪,然后做出全球第一份衡量群众心理的定量指标—地球脉搏。为什么要这么做?因为数据就是未来,情感是笔大买卖,选举、调查结果、流行新闻故事乃至于股市都会受到 “群众” 情绪的影响。
言多必得
相比之下,KredStreet则找到了另一个似乎更容易变现的垂直商业模式并已开始进行不公开测试:社会化股票交易员排名(The Social Stock Trader Rankings)。The Social Stock Trader Rankings 对 StockTwits 的数据进行情绪分析,对 Twitter 数据流进行采样,以便确定交易员总体看涨还是看跌。它还会将当前的股市表现与交易员过去的涨跌判断进行比对,进而依据交易员的准确率对其进行评分和排名。
这个排名系统的创意的确好。因为这里一切都是靠实力和结果说话,无名之辈只要预测准确率高也能把夸夸其谈的知名人士压倒。实际上,这一思路完全可以推广到许多领域,比方说倡导声音有力则不需名气的舆论网络初创企业 State的做法。说实话,这套东西有时候的确比文凭和砖家管用。
当然 SmogFarm/KredStreet 之流所从事的情绪分析,以及Summly从事的自然语言处理,还有Palantir从事的数据挖掘等尚处在早期阶段,还很不成熟。但请你设想一下 5年 之后。如果他们的大数据、高能量探照灯打在Facebook timeline这样的东西上,会有多少东西被他们洞悉?
几年前,EFF(电子前沿基金会)发现,哪怕是像浏览器设置这么简单的东西都会让你的匿名性下降到无法想象的地步。上一周,一项新研究又发现人的移动轨迹具有高度的独特性,按照这份研究的说法,从各人匿名提供的手机方位数据中只需抽取四个时空点就能识别出该用户,识别率高达 95%。好的软件能够从这些看似稀疏、空白的数据中挖掘出甚多宝物。
言多必失
随着语言和图像处理软件的不断进化,一旦被运用到 Facebook timeline 这样的东西上,就有可能产生出你意想不到的效果。你所说的话、发出去的图、玩过的游戏等,都会逐渐勾勒出你本人的一幅准确得令人恐怖的肖像,那些东西可能是你从来都不曾想公开的隐私。
更糟的是这件事有可能容易得出奇。老板可能根本就不需要通读你的 Facebook timeline,只需将档案分析软件往你的头像一点,半分钟之后,你的工作习惯、神经衰弱、人生受挫、情绪不稳、对老板的态度等悉数就被推断出来—你的照片、评论、喜欢、顶等,这些信息从个体上看虽然毫无意义,但是拼凑起来就能形成你的拼图。
这是一笔大买卖。前不久,IBM 开发的新型安全工具就能够运用大数据来识别安全威胁和不满员工。Facebook 之流显然也指望此类大数据应用为其定向广告挖掘出大金矿。
但是这会受到用户的反制。我们可以设想,一旦这样的工具成熟起来,大家在网上的表现一定不会再像以前那样直率,会变得更加小心翼翼。或者甚至只看不说。这样的网络到头来也许只有两种结果:死气沉沉、人人自危,或者只谈风月、口是心非。
扎克伯格定律认为互联网用户共享的信息每年都会翻番。但是一旦大家都意识到言多必失时这条规律还能不能延续?
工具无所谓好坏,言多必得还是言多必失,要看用者做不做恶,对于用户和商家来说结果只有两个:双赢或双输,善用则情感成为好买卖,滥用则数据没有未来。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05