
大数据将如何颠覆投资管理
近年来,大数据成为了热门词汇。作为一种新的分析方法,大数据正运用在许多行业当中。但目前投资经理采用大数据技术相当有限,这可能为投资管理行业打开一扇“机会之窗”。
利用大数据扩展模型 进行“信息套利”
在信息时代,利用大数据做交易的投资经理将会远远走在同行之前,在他们的扩展模型和那些运用传统分析工具的模型之间进行“信息套利”。
随着大数据分析方法进一步提高数据容量、多样性以及更新频率,在过去10年,系统化交易模型的创新技术加速发展,定量分析与定性分析之间的差别将逐渐消失。
定量基本面分析师可采用大数据技术,将所要验证的变量扩展到行为、看法和感知反馈等数据,而这些领域以前只属于自主基本面分析师(discretionary fundamental researchers )。这提供了一个更广泛的模型:通过使用一组新的数据,来解释相关的、类似的、最优的和低劣的数值。而这些新的数据没有被纳入传统的投资模型当中。这就在运用大数据技术的公司和那些没有运用大数据公司之间,创造了“信息套利”的可能性。
与现有模型的数据量和处理速度相同的情况下,系统性交易模型可处理新的输入数据。新程序可能寻找大量输入数据之间的相关性,而不是在传统数据集中简单地选择基于分析的交易,从而能够识别新的交易模式,这些模式将价格活动与非价格相关的变量联系起来。“多因素”的系统化程序使用了更广泛的数据集,能够实现当前系统所没有的信息优势。
如果新的建模能力与大数据分析方法相结合,比如预测分析和机器学习,就可以通过这些能“思考”的模型得出前瞻性的结论,从而改变投资研究的性质。这将导致关注价值的定量基本面模型和关注价格的系统性交易程序趋于一致。结果可能会形成一种新的自动投资组合管理模型,该模型关注“未来价值”,并对一些还未发生的或还未公布的“可能性”事件起作用。
大数据将消除定性分析与定量分析的差别
新模型的关键将是扩展当前可用数据的阈值,采纳新的数据源。而这些数据反映人们的观点、行为和动作,有助于自主基本面研究人员做出投资决策。新模型可能不会完全包含所有的数据,但扩展数据将使量化模型能更深入地研究,更广泛地假设。
以石油和天然气行业为例,假设有一家名为ABC的公司。基于资产负债表等财务报表,自主投资组合基金经理和定量分析师的定量模型可能都创建了该行业中重要公司的相对排名。而这是目前大部分的定量模型能够走到最远的一步了。
与此同时,自主基本面投资组合经理能够与企业高管交谈,并从他们的肢体语言中体会到他们对下一个季度所表现出来的兴奋或紧张。自主基金经理可能开始领悟到更多关于公司的近期活动,如果他们感觉到公司活动不同寻常的繁忙或平静,他们甚至可能会造访并观察公司的办公室或一些设施。他们还可能会联系业内人士,询问他们是否察觉到投机机会或听说一些有意思的、新的人事变动。
通过上述努力,自主基本面基金经理认为,ABC公司的CFO看起来比通常更乐观,并且公司的新闻里多次提到一些重要高管在过去一年如何增加了研发预算。
将上述的解释和预测进行“数据化”之后,定量投资模型也能得到相同的结果。
过去18个月,语言程序利用情感分析,发现ABC公司公开使用的积极词汇和消极词汇的比例有明显变化,积极词汇更多而消极词汇变少。过去4个月,积极词汇加速增多。通过程序识别,ABC公司高管在最新一年的新闻稿和采访中使用“研发”一词的频率,较此前12个月上升了182%。此外,“勘探”与“扩张”使用频率也增加。
定量模型将这些高频词汇与提到ABC公司未开发油田的公开记录联系起来,来确定是否有新文件公布出来,并了解这些未开发油田的地理位置。量化模型提取出每个油田的卫星图片,并进行时间序列图像分析,从而确定哪些油田的地貌有明显变化。分析结果显示,中非和撒哈拉以南非洲地区均出现显著变化。那么,量化模型的这一结论与上述自主基本面分析师所预测的一致,ABC公司将在中非或撒哈拉以南非洲地区开发新油田。
另外,模型将ABC公司驻非洲员工在社交网站上的照片进行定位分析。比如,在20位员工中,有16位定位在撒哈拉以南非洲地区,有2位员工出现在中非地区。这一系列因素结合此前的预测模型,可以断定,ABC公司将建立新的油田生产设施。模型还可以更进一步,通过分析撒哈拉以南非洲办公室的建设进程,判断油田可能将在三个月后开始生产。
综上所述,基于还没宣布的未来事件,自主基本面投资组合经理和量化模型都将会做多ABC公司。
新型“未来价值”模型可能出现
随着构建新定量模型经验丰富,以及系统化交易程序能够识别越来越多的定价模式,可能会产生新型系统化组合管理模型,该模型将交易选择基于公司可能的“未来价值”。
这些未来价值模型开始于未来事件的输出(future event output)(如预计ABC公司将会宣布开发新油田)。新模型将未来事件进行分类,并从历史记录中寻找ABC公司及其同行的类似公告,将这些公告日期标记起来,检索事件前后的几个星期内相关公司的图表。
公司某些新闻可能会引发价格变动,定价模型可将平均价格变动幅度和持续时间进行量化。模型将检查公司过去90天的活动,并确定是否有最相近的先例。模型每天都重新评估当前和历史的价格模式,并基于不断完善的数据来确定价格上涨还是降低。
若事件公布正如预期,当预期价格变动幅度和持续时间已实现,模型就会关闭头寸。如果事件不在特定窗口公布出来,而预测分析发生了变化,并且ABC公司发出公告的可能性降低,模型会关闭头寸或更早关闭头寸。
大数据使用的其它例子
A公司通过分析社交媒体的数据,比较该公司与同行业的B公司在社交媒体上的活跃程度,以判断其广告活动是否取得成功。
一些公司通过观察中国建设活动的卫星图片,来衡量中国经济是否稳健。
在官方调查报告出炉前,投资经理剖析消费者信用卡的交易数据以及旗舰店停车场汽车的数量,来预测零售活动。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
用 Power BI 制作地图热力图:基于经纬度数据的实践指南 在数据可视化领域,地图热力图凭借直观呈现地理数据分布密度的优势,成 ...
2025-07-24解析 insert into select 是否会锁表:原理、场景与应对策略 在数据库操作中,insert into select 是一种常用的批量数据插入语句 ...
2025-07-24CDA 数据分析师的工作范围解析 在数字化时代的浪潮下,数据已成为企业发展的核心资产之一。CDA(Certified Data Analyst)数据分 ...
2025-07-24从 CDA LEVEL II 考试题型看 Python 数据分析要点 在数据科学领域蓬勃发展的当下,CDA(Certified Data Analyst)认证成为众多从 ...
2025-07-23用 Python 开启数据分析之旅:从基础到实践的完整指南 在数据驱动决策的时代,数据分析已成为各行业不可或缺的核心能力。而 Pyt ...
2025-07-23鸢尾花判别分析:机器学习中的经典实践案例 在机器学习的世界里,有一个经典的数据集如同引路明灯,为无数初学者打开了模式识别 ...
2025-07-23解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-07-22解析神经网络中 Softmax 函数的核心作用 在神经网络的发展历程中,激活函数扮演着至关重要的角色,它们为网络赋予了非线性能力, ...
2025-07-22CDA数据分析师证书考取全攻略 一、了解 CDA 数据分析师认证 CDA 数据分析师认证是一套科学化、专业化、国际化的人才考核标准, ...
2025-07-22左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-22你是不是也经常刷到别人涨粉百万、带货千万,心里痒痒的,想着“我也试试”,结果三个月过去,粉丝不到1000,播放量惨不忍睹? ...
2025-07-21我是陈辉,一个创业十多年的企业主,前半段人生和“文字”紧紧绑在一起。从广告公司文案到品牌策划,再到自己开策划机构,我靠 ...
2025-07-21CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-21MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-21在AI渗透率超85%的2025年,企业生存之战就是数据之战,CDA认证已成为决定企业存续的生死线!据麦肯锡全球研究院数据显示,AI驱 ...
2025-07-2035岁焦虑像一把高悬的利刃,裁员潮、晋升无望、技能过时……当职场中年危机与数字化浪潮正面交锋,你是否发现: 简历投了10 ...
2025-07-20CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-18刚入职场或是在职场正面临岗位替代、技能更新、人机协作等焦虑的打工人,想要找到一条破解职场焦虑和升职瓶颈的系统化学习提升 ...
2025-07-182025被称为“AI元年”,而AI,与数据密不可分。网易公司创始人丁磊在《AI思维:从数据中创造价值的炼金术 ...
2025-07-18CDA 数据分析师:数据时代的价值挖掘者 在大数据席卷全球的今天,数据已成为企业核心竞争力的重要组成部分。从海量数据中提取有 ...
2025-07-18