京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据将如何颠覆投资管理
近年来,大数据成为了热门词汇。作为一种新的分析方法,大数据正运用在许多行业当中。但目前投资经理采用大数据技术相当有限,这可能为投资管理行业打开一扇“机会之窗”。
利用大数据扩展模型 进行“信息套利”
在信息时代,利用大数据做交易的投资经理将会远远走在同行之前,在他们的扩展模型和那些运用传统分析工具的模型之间进行“信息套利”。
随着大数据分析方法进一步提高数据容量、多样性以及更新频率,在过去10年,系统化交易模型的创新技术加速发展,定量分析与定性分析之间的差别将逐渐消失。
定量基本面分析师可采用大数据技术,将所要验证的变量扩展到行为、看法和感知反馈等数据,而这些领域以前只属于自主基本面分析师(discretionary fundamental researchers )。这提供了一个更广泛的模型:通过使用一组新的数据,来解释相关的、类似的、最优的和低劣的数值。而这些新的数据没有被纳入传统的投资模型当中。这就在运用大数据技术的公司和那些没有运用大数据公司之间,创造了“信息套利”的可能性。
与现有模型的数据量和处理速度相同的情况下,系统性交易模型可处理新的输入数据。新程序可能寻找大量输入数据之间的相关性,而不是在传统数据集中简单地选择基于分析的交易,从而能够识别新的交易模式,这些模式将价格活动与非价格相关的变量联系起来。“多因素”的系统化程序使用了更广泛的数据集,能够实现当前系统所没有的信息优势。
如果新的建模能力与大数据分析方法相结合,比如预测分析和机器学习,就可以通过这些能“思考”的模型得出前瞻性的结论,从而改变投资研究的性质。这将导致关注价值的定量基本面模型和关注价格的系统性交易程序趋于一致。结果可能会形成一种新的自动投资组合管理模型,该模型关注“未来价值”,并对一些还未发生的或还未公布的“可能性”事件起作用。
大数据将消除定性分析与定量分析的差别
新模型的关键将是扩展当前可用数据的阈值,采纳新的数据源。而这些数据反映人们的观点、行为和动作,有助于自主基本面研究人员做出投资决策。新模型可能不会完全包含所有的数据,但扩展数据将使量化模型能更深入地研究,更广泛地假设。
以石油和天然气行业为例,假设有一家名为ABC的公司。基于资产负债表等财务报表,自主投资组合基金经理和定量分析师的定量模型可能都创建了该行业中重要公司的相对排名。而这是目前大部分的定量模型能够走到最远的一步了。
与此同时,自主基本面投资组合经理能够与企业高管交谈,并从他们的肢体语言中体会到他们对下一个季度所表现出来的兴奋或紧张。自主基金经理可能开始领悟到更多关于公司的近期活动,如果他们感觉到公司活动不同寻常的繁忙或平静,他们甚至可能会造访并观察公司的办公室或一些设施。他们还可能会联系业内人士,询问他们是否察觉到投机机会或听说一些有意思的、新的人事变动。
通过上述努力,自主基本面基金经理认为,ABC公司的CFO看起来比通常更乐观,并且公司的新闻里多次提到一些重要高管在过去一年如何增加了研发预算。
将上述的解释和预测进行“数据化”之后,定量投资模型也能得到相同的结果。
过去18个月,语言程序利用情感分析,发现ABC公司公开使用的积极词汇和消极词汇的比例有明显变化,积极词汇更多而消极词汇变少。过去4个月,积极词汇加速增多。通过程序识别,ABC公司高管在最新一年的新闻稿和采访中使用“研发”一词的频率,较此前12个月上升了182%。此外,“勘探”与“扩张”使用频率也增加。
定量模型将这些高频词汇与提到ABC公司未开发油田的公开记录联系起来,来确定是否有新文件公布出来,并了解这些未开发油田的地理位置。量化模型提取出每个油田的卫星图片,并进行时间序列图像分析,从而确定哪些油田的地貌有明显变化。分析结果显示,中非和撒哈拉以南非洲地区均出现显著变化。那么,量化模型的这一结论与上述自主基本面分析师所预测的一致,ABC公司将在中非或撒哈拉以南非洲地区开发新油田。
另外,模型将ABC公司驻非洲员工在社交网站上的照片进行定位分析。比如,在20位员工中,有16位定位在撒哈拉以南非洲地区,有2位员工出现在中非地区。这一系列因素结合此前的预测模型,可以断定,ABC公司将建立新的油田生产设施。模型还可以更进一步,通过分析撒哈拉以南非洲办公室的建设进程,判断油田可能将在三个月后开始生产。
综上所述,基于还没宣布的未来事件,自主基本面投资组合经理和量化模型都将会做多ABC公司。
新型“未来价值”模型可能出现
随着构建新定量模型经验丰富,以及系统化交易程序能够识别越来越多的定价模式,可能会产生新型系统化组合管理模型,该模型将交易选择基于公司可能的“未来价值”。
这些未来价值模型开始于未来事件的输出(future event output)(如预计ABC公司将会宣布开发新油田)。新模型将未来事件进行分类,并从历史记录中寻找ABC公司及其同行的类似公告,将这些公告日期标记起来,检索事件前后的几个星期内相关公司的图表。
公司某些新闻可能会引发价格变动,定价模型可将平均价格变动幅度和持续时间进行量化。模型将检查公司过去90天的活动,并确定是否有最相近的先例。模型每天都重新评估当前和历史的价格模式,并基于不断完善的数据来确定价格上涨还是降低。
若事件公布正如预期,当预期价格变动幅度和持续时间已实现,模型就会关闭头寸。如果事件不在特定窗口公布出来,而预测分析发生了变化,并且ABC公司发出公告的可能性降低,模型会关闭头寸或更早关闭头寸。
大数据使用的其它例子
A公司通过分析社交媒体的数据,比较该公司与同行业的B公司在社交媒体上的活跃程度,以判断其广告活动是否取得成功。
一些公司通过观察中国建设活动的卫星图片,来衡量中国经济是否稳健。
在官方调查报告出炉前,投资经理剖析消费者信用卡的交易数据以及旗舰店停车场汽车的数量,来预测零售活动。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16