京公网安备 11010802034615号
经营许可证编号:京B2-20210330
BAT大数据联姻指数基金 新玩法谁会领跑
2015年4月9日,蚂蚁金服与博时基金管理有限公司、恒生聚源及中证指数共同发布电商大数据指数,即中证淘金大数据100指数(简称“淘金100”)。这是阿里第一次搞指数基金。
至此,国内BAT三家都已涉足互联网大数据指数基金,此前腾讯和百度分别推出了腾安价值100和百发100。4月10日百发100打开二次申购,并于4月14日大比例分红,金额达到0.36元,预计分红金额0.67元。
这一轮牛市正在逐步进入高潮,BAT三家拥有大数据的巨头插手指数基金,会给行业带来什么变化,谁又会占得先机呢?
一、 传统基金和互联网大数据
传统基金也好,股票也好,投资的依据主要靠公开调研、财报信息和分析师报告等,这些数据一定程度上存在失真和时效性差等局限性。调研调研不到真实信息,财报数字做手脚,分析师的道德风险,都会让投资依据失效,以此为基础作出的投资决策自然也就不靠谱。
互联网巨头们手中拥有着传统投资者和决策人难以想象的大数据,这些数据可以通过筛选分析得出有价值的第一手真实信息,而分析师和投资人可以依靠这种真实信息对行业趋势,企业情况进行分析,拨开层层迷雾看到真实的情况。
譬如一家食品公司财务报表造假,通过各种手段把财务报表的数字处理的非常辉煌,销售额大幅增长。调研者去公司看到的也是可以表演的景象,分析师则被公关发表一些积极言论。这些手法通过传统的模式是无法识破的,很容易作出增持的决策。
而有了大数据以后,通过百度搜索指数,淘宝阿里的电商交易数据,腾讯的微商数字,全部反映这家食品公司的产品搜索指数,成交指数在下降,那么这家公司财报中销售数字大幅增长就要打一个问号。
同样,对于行业趋势的变化,也可以通过大数据里面各种指数的变化加以判断。这些手段是传统的基金行业所没有的,而在大数据出现之后,基金行业可以以此为依据优化不同行业股票的组合,完善资产配置。
此外,股票的价格经常是非理性的,而传统基金的分析是基于行业、财务数据等资料作出的理性判断。对于传媒影响、投资者心理、投机者动向等因素无法判断。而大数据则有可能通过海量数据的分析,掌握这些非理性的因素的蛛丝马迹,从而帮助决策者即时发现迹象,进行应对。
基于上述原因,基金公司非常愿意与互联网巨头配合,获取互联网巨头手中的大数据,丰富自身的投研工具与应用手段,求得更低的风险和更多的收益。
二、 BAT三家的大数据资源
在BAT三家中,百度主要的大数据来自于搜索,阿里主要的大数据来自于电商,而腾讯的主要大数据来自于社交平台和娱乐平台。不同的大数据对于基金投资的价值是不同的。
腾讯数据主要来自在于社交与娱乐平台,虽然近期腾讯在不断扩张,投资也京东,也通过微商获得了一些电商的数据,但是腾讯能拿到的数据占电商的份额很小。而搜索方面更是可以忽略不计。而腾讯手中最多的社交和娱乐平台数据很难挖掘出对基金投资有用的信息。腾讯手中的大数据价值相对较低。
阿里作为目前电商行业的巨头,掌握了自有平台上的电商信息数据与订单交易数据,结合阿里巴巴、淘宝、天猫等平台上的细分行业成交与电商交易趋势进行大数据分析。阿里的优势是数据都是交易数据,准确性非常高。
但是,最终消费品仅仅是社会消费的一部分,难以反映整个经济趋势,而电商仅仅是渠道之一,不能以偏概全。譬如手机行业,OPPO和vivo主打线下渠道,在淘宝电商的销量数据不多,也不通过阿里巴巴这种渠道做批发。结果就是阿里基于自有电商的交易平台采集不到这两家企业的准确趋势和数据,从而错过投资。
此外,阿里的终端销售数据反映到股价上还会有一定的滞后性,也无法捕捉投资的各种非理性因素。所以阿里的大数据价值不错,但是有一定的局限性。
百度手里主要是搜索数据,但是百度又不仅仅有搜索数据,通过百度地图,通过移动互联网应用入口,百度实际掌握了相当的物流、人流信息,百度迁徙就是例子。
因为百度是搜索数据,虽然数据比较模糊,但是覆盖的范围远远超过了电商的范畴。谷歌利用搜索做全美流感趋势判断,号称比医疗系统出来的数据还快还准,这是大数据领域中会被反复提及的经典案例。其实它恰恰说明了搜索引擎大数据包罗万象的能力。
看股票行业,人们往往先在百度中输入股票代码,统计搜索量,很容易看出哪只股票被搜索的更多,关注度更高;产品需求,服务需求,行业需求,媒体热点,关注度热点都可以通过搜索指数的形式表现出来。
而这些指数除了包含行业信息、财务信息这类理性判断所需的数字之外,还可以把社会心理、投资者心理,投机者动向这些非理性的因素表现出来,电商类、社交类大数据信息做不到这些,而这正是搜索引擎获取大数据的强大之处。
百度搞的“百发100指数”综合了财务因子、综合动量因子和搜索因子,这个搜索因子,就是对搜索引擎大数据的实际应用。
当然,百度的大数据也有它的问题,就是搜索引擎出来的数据过于庞大,而且与投资的相关性需要高度的人工智能进行分析,从中筛选出有用的数据很难。
不过,百度很早就认识到这个问题,一直在大力研发研究人工智能,在硬件上发展异构的超级计算机模拟人类神经元,挖来异构计算专家、AMD异构系统前首席软件架构师吴韧,在软件上挖来谷歌人工智能科学家的吴恩达,成立深度学习研究所,来解决人工智能的水平问题。
从这个角度看,百度虽然大数据的准确性和相关性不如阿里,但是数据的广度和处理是领先的,价值也很高。
当然,数据和人工智能最终还要是给基金公司产品策略和投资需要服务,BAT三家在数据的区别和各自的优势仅仅表现在所提供数据的门类与转化效果上,而最终表现还是要看市场。
三、 大数据联姻指数基金的未来
目前,阿里的淘金100还没有上市销售,但是阿里给出的模拟数字是2009年至2014年,“淘金100”的年化收益率约为54%,理想很美好,现实不知道会如何;百度百发100自2014年6月20日实盘运行以来的涨幅大约218%,去年10月至今收益率接近70%;腾讯腾安从去年3月至今收益接近1倍,业绩都算是不错,排名都在前列。
从配置的股票来看,百度百发100特色更为明显一些,各种概念,题材基本都没有错过,这个应该与它所列入的搜索因子有关,柴静拍个《穹顶之下》,环保相关搜索指数上升,环保题材自然进入搜索因子。
从数据分析的角度看,大数据资源与基金投资决策还需要一个很长的磨合期。筛选出来的数据资料经过分析应用于投资决策,是一个积累的过程的,通过不断的尝试,可以更科学的分析两者之间的关系,也可以更多的采集相关数据作为投研依据。
目前,介入时间最长的腾讯不过刚刚运行了一年多而已,百度则只有几个月,阿里还没开始。而且运行时间最长的腾讯大数据相关性本来就不算强,所以目前的业绩说明不了大数据指数基金的潜力。
而未来随着穿戴式设备,车联网、物联网等科技的发展,大数据所涉及的领域,采集到的数据会越来越多,自动处理数据的人工智能会越来越发达,而大数据应用于指数基金的经验也会越来越丰富,大数据应用的潜力和业绩提升会在未来几年爆发出来。而在这个过程之中,数据采集最多,质量最高,处理能力最强的将会占据领跑者的位置。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15