
大数据选股有奇效 百度股市通“智能选股”日均涨幅1.7%
5月7日,百度股市通对外展示了大数据和人工智能在股市中的巨大成效。截至目前,百度股市通官方统计的数据显示,所有热点事件股票的上涨概率达78%,股票日均涨幅达1.7%。
这一数字预示着,基于大数据的人工智能技术将有可能成为中国股民投资决策的重要依据之一。
百度股市通是百度于今年2月推出的国内首款应用大数据引擎技术智能分析股市行情热点的股票APP,其核心优势是与全网大数据结合的“智能选股”服务,目前“智能选股”有“最新热点”、“异动个股”和“优选公告”三大功能。
“最新热点”是基于百度每日实时抓取的数百万新闻资讯和数亿次的股票、政经相关搜索大数据,通过技术建模、人工智能,能够帮助用户快速获知全网关注的投资热点及相关个股;“异动个股”结合了百度的股票知识图谱和热搜指数等指标,将前一天相关指标数据涨幅最大的5只股票在开盘前遴选出来。而“优选公告”则是通过自然语言算法实时分析每日上市公司发布的所有公告,自动进行公告分类和文本信息的提取;同时根据百度的股票知识图谱模型,统计了过去十几年所有上市公司的公告,通过分析上市公司类型、股票价格、公告信息、全网数据等信息,计算出个股发布公告后的上涨概率和历史收益,为股民投资提供量化参考。
上线3个月以来,百度股市通应用大数据推荐的热点有685个,将每个热点的关联股票作为一个组合,平均仓位以当天开盘价买入,第二天开盘价卖出计算,有78%的热点题材股票都是上涨的,而日均涨幅达到1.7%,如果按照A股1年240个交易日计算,年复利理论收益达56倍。
而如果将“异动个股”作为测算标的,以当天开盘价买入,第二天开盘价卖出计算,当日平均涨幅为3.28%,对比净值是沪深300指数的4.5倍。由于“异动个股”的数据完全通过大数据模型量化得出,不掺杂人工因素,因此异动的方向可能是大涨也可能是大跌。
特许金融分析师(CFA)张翼轸对“异动个股”也曾做过回测统计,仅考虑那些开盘后涨幅在0%到5%之间的,分别测算当日收盘于开盘价的涨幅以及次日收盘价与当日开盘价的涨幅,日内涨幅平均是3.97%,2日涨幅则是6.54%。如果再严格点筛选条件,只选择开盘上涨0到3%的个股,那么日内涨幅上涨到5.21%,2日涨幅8.08%,涨幅更高。
从上述结果可以看出,相比较传统的股票软件,“百度股市通”的意义在于第一次有效解决了股民最基础、最迫切的“信息不对称”问题,使普通股民可以跨越信息搜集难题,让复杂的选股过程变得简单、高效。
百度股市通“纯机器结果,无人工干预”的结果能够从根本上杜绝各种“荐股潜规则”,保证股民的利益。这也是百度这样的互联网公司进军证券业的核心竞争力。
当前,互联网证券正在加速到来,在这一背景下,作为百度布局互联网证券的关键一环,百度股市通凭借着互联网理念、技术和影响力,在为股民带来切实利益的同时必将有力促进证券业务拓展。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04