京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据投资渐行渐近
大数据指数是金融结合互联网技术、特别是大数据技术设计的金融产品,是金融与互联网融合的重要形式。与此前金融跨界互联网的尝试相比,将大数据技术引入金融投资,实现“互联网的金融化”,是一种跨越式的进步。
与传统投资方式相比,大数据指数的优势一方面在于能够更加及时、更加全面的获取市场信息,并能够将信息拓展至传统金融无法触及的领域。另一方面在于可以运用先进的数据处理技术,挖掘海量信息中包含的投资价值。因此,大数据技术的使用,将金融服务、金融投资的广度和深度提高到了一个新的层次。
大数据投资的有效性与领先性
对投资者来说,大数据指数还是新鲜概念。大数据指数引入各种非传统、非结构化、海量的信息来预测股市,如搜房房天下的房地产数据、银联的消费数据的社交金融数据等。
一旦确定该大数据信息对股市有提前的预判(无论是对行业、风格、择时或者直接对上市公司等的收益有预测性),就可以通过一定的规则,选择其看好的标的作为指数的候选成分股。最后,从可投资性、换手率、风险控制等角度考虑,同时结合基金公司自身在的量化投资方面构建的包括基本面因子等在内量化因子体系,综合筛选确定每期的指数成分股。
在有效性方面,大数据指数在较为长期的历史数据基础上,采用科学严格的回测方法,建立大数据量化模型,对大数据因子对于股市的预测性作用进行深入的研究,明确其显著的有效性。
在领先性方面,因为大数据因子本身是可以每日或每月汇总的,其反应的信息是非常及时的。从换手率方面的考虑,大数据指数通常设置为月度调仓,这也远高于通常的公司财报发布的频度。所以大数据因子对于股市可能会有3到6个月的领先性。
策略指数与“大数据因子”
近年来,随着金融研究的逐步发展,以非市值加权及因子投资为核心的Smart Beta策略在欧美市场逐渐兴起,并在被动投资领域得到广泛应用。根据晨星公司数据,Smart Beta类ETF的全球资产管理规模快速增加,总额已高达3800亿美元。其中比较有代表性的Smart beta ETF包括:标准普尔500等权ETF、标准普尔500低波动率ETF、Schwab美国基本面指数ETF等。
在Smart Beta兴起之初,中证指数公司就已经着手研发Smart Beta类的投资策略,陆续发布了基本面指数、低波动指数及动量指数等指数,并获得了市场应用。去年以来,博时基金基于因子投资的理念,与多家基金公司合作推出了共14条覆盖大数据因子的Smart beta类指数。与传统指数相比,大数据指数的主要差别体现在以“大数据因子”为核心进行规则的确定。希望利用大数据多维度、及时性的特征,更灵敏地捕捉市场机会。例如房天下大数据指数,在指数设计时,采用了包括销售情况(如销售金额,面积),土地储备情况(如拿地面积,拿地价格),去化情况(如销供比)等大数据构建而成的因子,能够更加全面地反映房地产企业的盈利预期。
博时基金将“大数据+”作为公司的核心战略进行布局,正全力打造出业内规模最大、覆盖面最全的多领域大数据平台,并在基金行业率先推出了大数据品牌——“指慧家”。“指慧家”含义是“智慧的大数据指数专家”。截至2015年9月,“指慧家”品牌旗下目前共有4只大数据指数,是目前国内产品数量最多的大数据指数品牌。淘金100大数据指数偏线上消费数据,银智100聚焦线下消费数据,搜房房天下则聚焦具体行业,后续还将与多个不同领域和行业的龙头企业合作,推出更多的大数据指数,将“指慧家”打造成为业内最大的大数据指数平台,以丰富的大数据产品线满足投资者多样化的投资需求。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09