京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据将如何颠覆投资管理
近年来,大数据成为了热门词汇。作为一种新的分析方法,大数据正运用在许多行业当中。但目前投资经理采用大数据技术相当有限,这可能为投资管理行业打开一扇“机会之窗”。
利用大数据扩展模型 进行“信息套利”
在信息时代,利用大数据做交易的投资经理将会远远走在同行之前,在他们的扩展模型和那些运用传统分析工具的模型之间进行“信息套利”。
随着大数据分析方法进一步提高数据容量、多样性以及更新频率,在过去10年,系统化交易模型的创新技术加速发展,定量分析与定性分析之间的差别将逐渐消失。
定量基本面分析师可采用大数据技术,将所要验证的变量扩展到行为、看法和感知反馈等数据,而这些领域以前只属于自主基本面分析师(discretionary fundamental researchers )。这提供了一个更广泛的模型:通过使用一组新的数据,来解释相关的、类似的、最优的和低劣的数值。而这些新的数据没有被纳入传统的投资模型当中。这就在运用大数据技术的公司和那些没有运用大数据公司之间,创造了“信息套利”的可能性。
与现有模型的数据量和处理速度相同的情况下,系统性交易模型可处理新的输入数据。新程序可能寻找大量输入数据之间的相关性,而不是在传统数据集中简单地选择基于分析的交易,从而能够识别新的交易模式,这些模式将价格活动与非价格相关的变量联系起来。“多因素”的系统化程序使用了更广泛的数据集,能够实现当前系统所没有的信息优势。
如果新的建模能力与大数据分析方法相结合,比如预测分析和机器学习,就可以通过这些能“思考”的模型得出前瞻性的结论,从而改变投资研究的性质。这将导致关注价值的定量基本面模型和关注价格的系统性交易程序趋于一致。结果可能会形成一种新的自动投资组合管理模型,该模型关注“未来价值”,并对一些还未发生的或还未公布的“可能性”事件起作用。
大数据将消除定性分析与定量分析的差别
新模型的关键将是扩展当前可用数据的阈值,采纳新的数据源。而这些数据反映人们的观点、行为和动作,有助于自主基本面研究人员做出投资决策。新模型可能不会完全包含所有的数据,但扩展数据将使量化模型能更深入地研究,更广泛地假设。
以石油和天然气行业为例,假设有一家名为ABC的公司。基于资产负债表等财务报表,自主投资组合基金经理和定量分析师的定量模型可能都创建了该行业中重要公司的相对排名。而这是目前大部分的定量模型能够走到最远的一步了。
与此同时,自主基本面投资组合经理能够与企业高管交谈,并从他们的肢体语言中体会到他们对下一个季度所表现出来的兴奋或紧张。自主基金经理可能开始领悟到更多关于公司的近期活动,如果他们感觉到公司活动不同寻常的繁忙或平静,他们甚至可能会造访并观察公司的办公室或一些设施。他们还可能会联系业内人士,询问他们是否察觉到投机机会或听说一些有意思的、新的人事变动。
通过上述努力,自主基本面基金经理认为,ABC公司的CFO看起来比通常更乐观,并且公司的新闻里多次提到一些重要高管在过去一年如何增加了研发预算。
将上述的解释和预测进行“数据化”之后,定量投资模型也能得到相同的结果。
过去18个月,语言程序利用情感分析,发现ABC公司公开使用的积极词汇和消极词汇的比例有明显变化,积极词汇更多而消极词汇变少。过去4个月,积极词汇加速增多。通过程序识别,ABC公司高管在最新一年的新闻稿和采访中使用“研发”一词的频率,较此前12个月上升了182%。此外,“勘探”与“扩张”使用频率也增加。
定量模型将这些高频词汇与提到ABC公司未开发油田的公开记录联系起来,来确定是否有新文件公布出来,并了解这些未开发油田的地理位置。量化模型提取出每个油田的卫星图片,并进行时间序列图像分析,从而确定哪些油田的地貌有明显变化。分析结果显示,中非和撒哈拉以南非洲地区均出现显著变化。那么,量化模型的这一结论与上述自主基本面分析师所预测的一致,ABC公司将在中非或撒哈拉以南非洲地区开发新油田。
另外,模型将ABC公司驻非洲员工在社交网站上的照片进行定位分析。比如,在20位员工中,有16位定位在撒哈拉以南非洲地区,有2位员工出现在中非地区。这一系列因素结合此前的预测模型,可以断定,ABC公司将建立新的油田生产设施。模型还可以更进一步,通过分析撒哈拉以南非洲办公室的建设进程,判断油田可能将在三个月后开始生产。
综上所述,基于还没宣布的未来事件,自主基本面投资组合经理和量化模型都将会做多ABC公司。
新型“未来价值”模型可能出现
随着构建新定量模型经验丰富,以及系统化交易程序能够识别越来越多的定价模式,可能会产生新型系统化组合管理模型,该模型将交易选择基于公司可能的“未来价值”。
这些未来价值模型开始于未来事件的输出(future event output)(如预计ABC公司将会宣布开发新油田)。新模型将未来事件进行分类,并从历史记录中寻找ABC公司及其同行的类似公告,将这些公告日期标记起来,检索事件前后的几个星期内相关公司的图表。
公司某些新闻可能会引发价格变动,定价模型可将平均价格变动幅度和持续时间进行量化。模型将检查公司过去90天的活动,并确定是否有最相近的先例。模型每天都重新评估当前和历史的价格模式,并基于不断完善的数据来确定价格上涨还是降低。
若事件公布正如预期,当预期价格变动幅度和持续时间已实现,模型就会关闭头寸。如果事件不在特定窗口公布出来,而预测分析发生了变化,并且ABC公司发出公告的可能性降低,模型会关闭头寸或更早关闭头寸。
大数据使用的其它例子
A公司通过分析社交媒体的数据,比较该公司与同行业的B公司在社交媒体上的活跃程度,以判断其广告活动是否取得成功。
一些公司通过观察中国建设活动的卫星图片,来衡量中国经济是否稳健。
在官方调查报告出炉前,投资经理剖析消费者信用卡的交易数据以及旗舰店停车场汽车的数量,来预测零售活动。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02