登录
首页数据挖掘量化投资方法
数据挖掘量化投资方法
2018-08-09
收藏

数据挖掘量化投资方法

数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。

数据挖掘相近的同义词有数据融合、数据分析和决策支持等。在量化投资中,数据挖掘的主要技术包括关联分析、分类/预测、聚类分析等。

关联分析是研究两个或两个以上变量的取值之间存在某种规律性。例如,研究股票的某些因子发生变化后,对未来一段时间股价之间的关联关系。关联分为简单关联、时序关联和因巢关联。关联分析的目的是找出数据库中隐藏的关联网。一般用支持度和可信度两个阈值来度量关联规则的相关性,还不断引入兴趣度、相关性等参数,使得所挖掘的规则更符合需求。

分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型,一般用规则或决策树模式表示。分类是利用训练数据集通过一定的算法而求得分类规则。分类可被用于规则描述和预测。

预测是利用历史数据找出变化规律,建立模型,并由此模型对未来数据的种类及特征进行预测。预测关心的是精度和不确定性,通常用预测方差来度量。

聚类就是利用数据的相似性判断出数据的聚合程度,使得同一个类别中的数据尽可能相似,不同类别的数据尽可能相异。


数据分析咨询请扫描二维码

上一篇
下一篇
客服在线
立即咨询