
天弘基金打造三领域领先的大数据指数
国务院近日发布了《促进大数据发展行动纲要》(以下简称《纲要》),将大数据发展提升为国家战略,大数据所蕴含的巨大价值将被进一步挖掘。作为国内大数据投研的领先者,天弘基金开发定制的国内首只社交投资大数据指数——雪球100指数于9月15日正式发布,从此日开始,投资者可通过雪球网、Wind等数据终端查看指数行情,了解具体的点位、涨跌幅、分时走势等数据。
雪球100指数的特点是投资者最为关心的问题,对此,天弘基金投研部总经理肖志刚介绍称,天弘基金所定制开发的雪球100指数,在三方面做到领先。第一,率先引入投资众包思维,筛选大量有经验的投资者的智慧,将其智慧转化为有指导意义的、可视化的指数;第二,采用雪球独特的数据资源,打造国内首只社交投资大数据指数;第三,编制中剔除其他重复性因子,也是国内首只纯粹的大数据指数。
肖志刚同时表示,天弘基金选择以雪球的数据来编制大数据指数,是看中了雪球作为社交投资平台,具备去中心化的投资体系。“雪球的数据量大,里面肯定有很多优秀的投资人,优秀的想法,如果能用一定的方法把这些人筛选出来,把这些想法集中起来,必定能在大概率上跑赢市场。而且雪球的模拟组合能把投资者的投资思路数据化,更加直观,处理起来也更加方便,因此我们想到了合作开发这样一只指数,把大众的智慧调动起来。”肖志刚表示,在雪球100指数发布后,天弘基金将尽早发行跟踪雪球100指数的基金,目前产品正在筹备中。
天弘基金在编制雪球100指数时,也打破传统,采用创新模式,为的是给投资者提供简单、清晰、有效的工具。
肖志刚表示,在编制过程中,综合考虑了雪球用户对股票的认同,用户的研究能力、投资能力,最后的组合等来综合决策,是一个经历了层层筛选的策略,模拟真实的投资决策,能够反映具有投资能力和研究能力的用户的股票持仓及增减仓总体情况。简单来说,雪球100的编制,先筛选出得到用户认可的大V,然后对其研究能力和投资能力进行量化,再对其股票综合评分,选取高分组合。
首先,在雪球的全部注册用户中,选取粉丝数排名前5%的用户作为参考用户;在参考用户创建的所有自选组合中,选取最近一个月内仓位发生过变动的组合作为参考组合。在全部参考组合所覆盖的股票中,选取至少被20个参考用户所持有的股票(截至月末)作为待选样本;其次,对大V的研究能力和投资能力根据其评论和调仓等数据进行量化。对每个待选样本所覆盖的参考用户,根据其相关的组合历史业绩和线上活跃度进行评分(当组合创建时间不足一年时,相关历史业绩评分为零),得到单个参考用户关于某待选样本的能力评分。计算单个待选样本的持仓评分与调仓评分(增持为正,减持为负),并由此通过加权得到其综合评分。选取综合评分最高的100只待选样本作为指数样本股。
另外,雪球100指数的成分股每个月调整一次。最近一期的100只成分股中,沪市、深市、创业板的股票数量占比分别为42%、39%和19%,持仓市值占比分别为57.22%、34.34%和8.44%,包括浦发银行、民生银行、中国石化、包钢股份、复星医药等。而且,该指数采用流通市值加权的方式,防止小股票权重过高。目前看,该指数的模拟业绩效果很好,走势相对稳健,换手率较低,近8个月都在30%以下,年化超额收益在30%以上。而且在市场大幅震荡中回撤幅度远小于其他大数据指数。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24