
首个电商大数据指数面世 大数据“碰撞”金融带来什么
淘金100的模式证明,当数据、技术与平台渠道成为金融业务的核心要素之后,互联网和金融的结合,确实能够产生深刻的“化学反应”,孕育出新的互联网金融产品。
用大数据指导投资策略,一直是很多投资者的梦想。现在,互联网与金融的深度融合,终于让梦想照进现实。
蚂蚁金融服务集团、博时基金管理有限公司、恒生聚源及中证指数日前共同发布全球第一个电商大数据指数——中证淘金大数据100指数(简称“淘金100”)。同时,基于淘金100指数开发的相应的公募基金产品随后也将在市场推出。
所谓指数,是根据特定标准采样部分股票或债券的价格统计,比如沪深300指数,是在沪深交易所选取市值最大的300只股票,根据价格计算出来的统计结果。博时基金副总裁王德英表示,现在互联网与金融的结合程度越来越深,特别是海量的、真实的线上交易数据,更成为极具价值的富矿。淘金100指数依托蚂蚁金服的大数据平台,基于海量的互联网电商交易大数据,来预期一个行业未来盈利状况,预判一个行业的繁荣程度,并在此基础上选取100只股票形成投资组合。
数据显示,目前,中国电子商务的交易总额已经占到社会消费品零售总额的10%左右,相比以往金融机构通过调研获取的数据,基于电商的全样本、实时数据能更直观、更实时地反映各个行业的变化。而这也是影响投资决策的核心因素之一。
“由于时效性的大幅提升,淘金100会每个月审核一次样本股,并将样本股调整周期缩短至一个月。这样有助于指数及时反映市场动态变化,发挥更快更好跟踪市场的作用。”博时基金相关人士说。据了解,博时基金将推出两只与淘金100指数挂钩的基金产品,包括一只淘金100大数据指数基金和一只大数据保本基金。指数基金的投资会与淘金100的成份股对应,并采用等权重方式。
相关数据显示,从2009年12月31日的基日计算,5年的收益率超过572%;2014年全年的收益率超过116%;2015年第一季度的收益率超过41%。据测算,2009年至2014年,淘金100的年化收益率约为54%,远超同期的上证综指、沪深300等大盘走势。
值得关注的是,淘金100指数是蚂蚁金服旗下金融信息服务平台与外部基金公司合作的首个大数据指数产品。“在这个平台上,汇集了线上线下海量的交易数据。通过对这些数据的脱敏、加工,再与行业业绩、财务表现等数据结合,可以形成供需、价格和成长活力等行业指标,最终综合成为行业景气指数。这个行业景气指数能够及时反映甚至预测不同行业的状况与前景。”据蚂蚁金服产品经理沈洲介绍,比如,通过分析电商平台上服装纺织、医疗保健、饮料行业的供需、成长和价格指数的变化,相关行业板块的股票价格与其走势曲线基本保持一致。以白酒行业为例,从蚂蚁金服旗下“维他命”平台产生的行业景气指数看,白酒行业在2012年6月份出现了明显的下跌,随后,白酒行业的股票在2012年四季度也出现大幅下跌。这大约领先了一个季度。
“目前平台的行业景气指数可以覆盖35个中证三级行业,超过1700只股票,覆盖约70%的上市公司。基金公司可以将这一行业景气指数作为投资选股的重要参考,与综合财务因子、市场驱动因子等因素一起,构成量化投资的选股模型。”沈洲说。
据介绍,以往,蚂蚁金服跟基金公司的合作更多是在支付和渠道层面。蚂蚁金服旗下的支付宝为基金公司提供支付服务,而招财宝则为基金公司面向用户销售基金产品提供平台。不过,随着金融信息服务平台的开放以及淘金100这样的大数据指数产品的诞生,基金公司跟蚂蚁金服的合作正在进入一个全方位合作的阶段。
蚂蚁金服金融事业部总经理袁雷鸣表示,技术与数据正在拓宽金融的边界,互联网的核心能力大数据、云计算、平台,将成为金融行业的基本要素和生产工具。而蚂蚁金服也将全面向基金行业开放自己的数据、技术和渠道能力。
“淘金100的模式也证明,当数据、技术与平台渠道成为金融业务的核心要素之后,互联网和金融的结合,确实能够产生深刻的化学反应,孕育出新的互联网金融产品。”袁雷鸣说,蚂蚁金服旗下的金融信息服务平台,将对外开放,成为金融产品创新的数据和技术引擎,与各家金融机构一起,为用户提供更丰富的金融服务。
据袁雷鸣透露,除了开放自己的数据、技术和渠道能力,蚂蚁金服还会逐步将所有基金的支付成本进一步降低。根据规划,支付宝对基金公司收取支付技术服务费的调整分为两步走。一是将计费方式统一为按流量收费。同时,支付宝把权益类基金的支付技术服务费的费率下降了一半。二是支付宝计划逐步将所有合作基金的支付成本进一步降低。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30