京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据将如何颠覆投资管理
近年来,大数据成为了热门词汇。作为一种新的分析方法,大数据正运用在许多行业当中。但目前投资经理采用大数据技术相当有限,这可能为投资管理行业打开一扇“机会之窗”。
利用大数据扩展模型 进行“信息套利”
在信息时代,利用大数据做交易的投资经理将会远远走在同行之前,在他们的扩展模型和那些运用传统分析工具的模型之间进行“信息套利”。
随着大数据分析方法进一步提高数据容量、多样性以及更新频率,在过去10年,系统化交易模型的创新技术加速发展,定量分析与定性分析之间的差别将逐渐消失。
定量基本面分析师可采用大数据技术,将所要验证的变量扩展到行为、看法和感知反馈等数据,而这些领域以前只属于自主基本面分析师(discretionary fundamental researchers )。这提供了一个更广泛的模型:通过使用一组新的数据,来解释相关的、类似的、最优的和低劣的数值。而这些新的数据没有被纳入传统的投资模型当中。这就在运用大数据技术的公司和那些没有运用大数据公司之间,创造了“信息套利”的可能性。
与现有模型的数据量和处理速度相同的情况下,系统性交易模型可处理新的输入数据。新程序可能寻找大量输入数据之间的相关性,而不是在传统数据集中简单地选择基于分析的交易,从而能够识别新的交易模式,这些模式将价格活动与非价格相关的变量联系起来。“多因素”的系统化程序使用了更广泛的数据集,能够实现当前系统所没有的信息优势。
如果新的建模能力与大数据分析方法相结合,比如预测分析和机器学习,就可以通过这些能“思考”的模型得出前瞻性的结论,从而改变投资研究的性质。这将导致关注价值的定量基本面模型和关注价格的系统性交易程序趋于一致。结果可能会形成一种新的自动投资组合管理模型,该模型关注“未来价值”,并对一些还未发生的或还未公布的“可能性”事件起作用。
大数据将消除定性分析与定量分析的差别
新模型的关键将是扩展当前可用数据的阈值,采纳新的数据源。而这些数据反映人们的观点、行为和动作,有助于自主基本面研究人员做出投资决策。新模型可能不会完全包含所有的数据,但扩展数据将使量化模型能更深入地研究,更广泛地假设。
以石油和天然气行业为例,假设有一家名为ABC的公司。基于资产负债表等财务报表,自主投资组合基金经理和定量分析师的定量模型可能都创建了该行业中重要公司的相对排名。而这是目前大部分的定量模型能够走到最远的一步了。
与此同时,自主基本面投资组合经理能够与企业高管交谈,并从他们的肢体语言中体会到他们对下一个季度所表现出来的兴奋或紧张。自主基金经理可能开始领悟到更多关于公司的近期活动,如果他们感觉到公司活动不同寻常的繁忙或平静,他们甚至可能会造访并观察公司的办公室或一些设施。他们还可能会联系业内人士,询问他们是否察觉到投机机会或听说一些有意思的、新的人事变动。
通过上述努力,自主基本面基金经理认为,ABC公司的CFO看起来比通常更乐观,并且公司的新闻里多次提到一些重要高管在过去一年如何增加了研发预算。
将上述的解释和预测进行“数据化”之后,定量投资模型也能得到相同的结果。
过去18个月,语言程序利用情感分析,发现ABC公司公开使用的积极词汇和消极词汇的比例有明显变化,积极词汇更多而消极词汇变少。过去4个月,积极词汇加速增多。通过程序识别,ABC公司高管在最新一年的新闻稿和采访中使用“研发”一词的频率,较此前12个月上升了182%。此外,“勘探”与“扩张”使用频率也增加。
定量模型将这些高频词汇与提到ABC公司未开发油田的公开记录联系起来,来确定是否有新文件公布出来,并了解这些未开发油田的地理位置。量化模型提取出每个油田的卫星图片,并进行时间序列图像分析,从而确定哪些油田的地貌有明显变化。分析结果显示,中非和撒哈拉以南非洲地区均出现显著变化。那么,量化模型的这一结论与上述自主基本面分析师所预测的一致,ABC公司将在中非或撒哈拉以南非洲地区开发新油田。
另外,模型将ABC公司驻非洲员工在社交网站上的照片进行定位分析。比如,在20位员工中,有16位定位在撒哈拉以南非洲地区,有2位员工出现在中非地区。这一系列因素结合此前的预测模型,可以断定,ABC公司将建立新的油田生产设施。模型还可以更进一步,通过分析撒哈拉以南非洲办公室的建设进程,判断油田可能将在三个月后开始生产。
综上所述,基于还没宣布的未来事件,自主基本面投资组合经理和量化模型都将会做多ABC公司。
新型“未来价值”模型可能出现
随着构建新定量模型经验丰富,以及系统化交易程序能够识别越来越多的定价模式,可能会产生新型系统化组合管理模型,该模型将交易选择基于公司可能的“未来价值”。
这些未来价值模型开始于未来事件的输出(future event output)(如预计ABC公司将会宣布开发新油田)。新模型将未来事件进行分类,并从历史记录中寻找ABC公司及其同行的类似公告,将这些公告日期标记起来,检索事件前后的几个星期内相关公司的图表。
公司某些新闻可能会引发价格变动,定价模型可将平均价格变动幅度和持续时间进行量化。模型将检查公司过去90天的活动,并确定是否有最相近的先例。模型每天都重新评估当前和历史的价格模式,并基于不断完善的数据来确定价格上涨还是降低。
若事件公布正如预期,当预期价格变动幅度和持续时间已实现,模型就会关闭头寸。如果事件不在特定窗口公布出来,而预测分析发生了变化,并且ABC公司发出公告的可能性降低,模型会关闭头寸或更早关闭头寸。
大数据使用的其它例子
A公司通过分析社交媒体的数据,比较该公司与同行业的B公司在社交媒体上的活跃程度,以判断其广告活动是否取得成功。
一些公司通过观察中国建设活动的卫星图片,来衡量中国经济是否稳健。
在官方调查报告出炉前,投资经理剖析消费者信用卡的交易数据以及旗舰店停车场汽车的数量,来预测零售活动。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04