
大数据基金纷涌而至 六大特点可掘金
正在发行的南方大数据300,成为目前第七只大数据基金。在“互联网+”时代背景下,大数据投资俨然成为牛市热潮,为投资者提供了新的投资选择。
从去年3月银河定投宝中证腾安指数基金发行,拉开了大数据基金的序幕,银河定投宝跟踪的指数中证腾安价值100指数由腾讯参与开发,是首只互联网与专业机构联合推出的指数。去年10月份成立的广发百发100跟踪的指数由百度参与编制,并采用百度金融搜索和用户行为的大数据编制而成,也是首只真正采用互联网大数据的指数。今年3月17日,天弘云端生活基金成立,这只基金被称为业内第一只大数据主动投资基金。今年4月份更是有3只大数据基金相继上市发售,掀起一波大数据基金浪潮。4月21日,依托电商大数据指数淘金100产生的第一只电商大数据基金博时招财一号在招财宝平台独家销售。4月22日,南方基金和新浪财经联合出品的大数据100指数基金开始发售,4月27日,博时淘金大数据100基金也上市发售。加上目前正在发行的南方大数据300,目前已经有7只大数据基金。
大数据基金有六大特点,投基者不妨重点关注。
1、依据互联网数据:无论是主动操作品种还是指数型基金,都将来自互联网的大数据作为投资的参考依据之一。互联网大数据相比传统数据而言,基于电商的全样本、实时数据能更直观、实时地反映各行业变化。而且能够反映一些传统数据无法统计的方面,比如投资者情绪、市场热点的变化等。
2、调整更为灵活:跟踪指数调整周期短,一般为一个月,传统指数调整周期大多为半年,且大多数采用等权重投资,避免单一股票对组合的影响,此类基金换股快,个股投资比例小。从已经成立时间较长的银河定投宝和广发100来看,两只基金前十大重仓股持股比例不超过20%,而且前十大重仓股更换率达到80%。
3、大数据的运用不是单一指标:大数据基金实际上是基于多因子模型的一个量化选股。互联网大数据是其选择股票的一个因子,其他的因子大多为市场以及基本面因子,比如百发100指数以财务因子、综合动量因子和搜索因子作为选股模型,淘金100指数则以财务因子、市场因子以及淘宝大数据因子纳入选股模型,大数据100以及300指数选择因子也包含了财务因子、市场因子与大数据因子。
4、大数据来源不同:目前大数据基本来源于三个渠道:电商(淘宝、京东)、门户网站(新浪、腾讯)、搜索网站(百度)。不同渠道的数据特征有所不同,比如,电商的数据代表了真实的成交额,价格走势等,而搜索网站的数据更多的反映了用户的关注点以及情绪因素,而不是实际发生的行为,门户网站的数据也更多的反映了用户关注点和情绪。
5、风格差异大:大数据指数依据的大数据来源、特点不同,量化选股模型不同,造成各个基金的风格、投向不同。即使依据相同大数据的基金风格也差别很大,比如同样依据新浪数据的大数据100和大数据300,前者偏成长,后者偏蓝筹,同样以淘宝大数据为投资依据的博时淘金100和天弘云端生活优选业绩分别为-0.69%和-3.74%,差距也非常大。
6、中长期业绩稳健:从基金成立后业绩表现来看,成立时间较长的基金广发百发100业绩排名持续位于30%左右,银河定投宝业绩排名持续位于40%左右,其余基金成立时间较短,业绩还不稳定,但是在大概率下能够排名在前50%。但是由于大数据基金,尤其是指数型基金持股十分分散,因此在业绩排名上很难排到十分靠前的位置。
我们认为,大数据基金融入了对投资者情绪以及更实时数据的分析,对市场的变化也更敏感,也更具有前瞻性和预测性,从业绩来看,表现较为稳健,但排名也很难十分靠前,同时受到数据的质量、受众、覆盖度、时间等的影响,也受到构建指数的量化模型的影响,大数据对于业绩并不是点石成金的金手指。对于目前日渐火爆的大数据基金,投资者应当存一份理性,在购买时还是需要多了解一下基金的风格、过往业绩表现、大数据的有效性等因素。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23