京公网安备 11010802034615号
经营许可证编号:京B2-20210330
从IT到DT,阿里巴巴大数据背后的商业秘密
空气污染究竟在多大程度上影响了人们的网购行为?有多少比重的线上消费属于新增消费?为什么中国的“电商百佳县”中浙江有41个而广东只有4个?
这些电商的秘密就隐藏在阿里巴巴商业生态的“大数据”中。
“未来制造业的最大能源不是石油,而是数据。”阿里巴巴董事局主席马云如此形容“数据”的重要意义。
在他看来,阿里巴巴本质上是一家数据公司,做淘宝的目的是为了获得零售的数据和制造业的数据;做蚂蚁金服的目的是建立信用体系;做物流不是为了送包裹,而是这些数据合在一起,“电脑会比你更了解你”。与此同时,产业的发展也正在从IT时代走向以大数据技术为代表的DT时代。
而在阿里巴巴内部,由电子商务、互联网金融、电商物流、云计算与大数据等构成的阿里巴巴互联网商业生态圈,也正是阿里研究院所扎根的“土壤”。
具体而言,阿里巴巴平台的所有海量数据来自于数百万充满活力的小微企业、个人创业者以及数亿消费者,阿里研究院通过对他们的商务活动和消费行为等进行研究分析,从某种程度上可以反映出一个地方乃至宏观经济的结构和发展趋势。
而随着阿里巴巴生态体系的不断拓展和延伸,阿里巴巴的数据资源一定程度上将能够有效补充传统经济指标在衡量经济冷暖方面存在的滞后性,帮助政府更全面、及时、准确地掌握微观经济的运行情况。
从IT到DT
不同于一些企业以技术研究为导向的研究院,阿里研究院副院长宋斐表示,阿里研究院定位于面向研究者和智库机构,主要的研究方向包括未来研究(如信息经济)、微观层面上的模式创新研究(如C2B模式、云端制组织模式)、中观层面上的产业互联网化研究(如电商物流、互联网金融、农村电商等)、宏观层面上新经济与传统经济的互动研究(如互联网与就业、消费、进出口等)、互联网治理研究(如网规、电商立法)等。
具体到数据领域,就是在阿里巴巴互联网商业生态基础上,从企业数据、就业数据、消费数据、商品数据和区域数据等入手,通过大数据挖掘和建模,开发若干数据产品与服务。
例如,将互联网数据与宏观经济统计标准对接的互联网经济数据统计标准,包括了中国城市分级标准;网络消费结构分类标准;网上商品与服务分类标准等。
而按经济主题划分的经济信息统计数据库则包括商品信息统计数据库;网购用户消费信息统计数据库;小企业与就业统计数据库;区域经济统计数据库。
还有反映电商经济发展的“晴雨表”——阿里巴巴互联网经济系列指数。其中包括反映网民消费意愿的阿里巴巴消费者信心指数aCCI、反映网购商品价格走势的阿里巴巴全网网购价格指数aSPI和固定篮子的网购核心价格指数aSPI-core、反映网店经营状态的阿里巴巴小企业活跃度指数aBAI、反映区域电子商务发展水平的阿里巴巴电子商务发展指数aEDI等等。其中,现有aSPI按月呈报给国家统计局。
而面向地方政府决策与分析部门的数据产品“阿里经济云图”,则将分阶段地推出地方经济总览、全景分析、监测预警以及知识服务等功能。宋斐介绍,其数据可覆盖全国各省、市、区县各级行政单位,地方政府用户经过授权后,可以通过阿里经济云图看到当地在阿里巴巴平台上产生的电子商务交易规模、结构特征及发展趋势。
“借助数据可视化和多维分析功能,用户可以对当地优势产业进行挖掘、对消费趋势与结构变动进行监测、与周边地区进行对比等等。”宋斐表示,该产品未来还可以提供API服务模式,以整合更多的宏观经济数据和社会公开数据,为当地经济全貌进行画像,给大数据时代的政府决策体系带来新的视角和工具。
数据会“说话”
对于如何利用“大数据”,马云在公司内部演讲中曾提到:“未来几年内,要把一切业务数据化,一切数据业务化。”
其中,后半句话可以理解为,让阿里巴巴各项业务所产生、积累的大数据来丰富阿里的生态,同时让生态蕴含的数据产生新的价值,再反哺生态,这是一个相辅相成的循环逻辑。
宋斐举例称,蚂蚁金服旗下的芝麻信用已获得人民银行个人征信牌照批准筹备,未来将通过分析大量的网络交易及行为数据,如用户信用历史、行为偏好、履约能力、身份特质、人脉等信息,对用户进行信用评估,这些信用评估可以帮助互联网金融企业对用户的还款意愿及还款能力做出结论,继而为用户提供快速授信及现金分期服务。本质上来说,“芝麻信用”是一套征信系统,该系统收集来自政府、金融系统的数据,还会充分分析用户在淘宝、支付宝等平台的行为记录。
再如,对于如火如荼的农村电商领域,阿里研究院从2010年就已开始对“沙集模式”个案进行研究,后续一系列基于数据和案例调研所驱动的农村电商研究成果,对于地方政府科学决策,推动当地农村电子商务发展、创造就业和发展地方经济起到了助力作用。到2014年底,全国已经涌现了212个淘宝村,而阿里巴巴也在这一年启动千县万村计划,将在三至五年内投资100亿元,在农村建立起电子商务服务体系。
除了通过数据分析去助力业务外,宋斐告诉笔者,有时候大数据报告可能会与传统的印象结论差异很大。
以区域电子商务为例,在阿里研究院发布的2014年中国电商百强县排行榜中,浙江有41个县入围,福建有16个,而广东只有4个,这个结果与传统的印象相差比较大。而事实上,这是因为浙江和广东两省电商发展在地理分布、产业结构等方面的明显不同而带来的。
再如,外界常常认为网络零售替代了线下零售,但事实上,麦肯锡《中国网络零售革命:线上购物助推经济增长》的研究报告,通过借鉴阿里研究中心(阿里研究院前身)和淘宝网UED用户研究团队的大量报告与数据,最后发现:“约60%的线上消费确实取代了线下零售;但剩余的40%则是如果没有网络零售就不会产生的新增消费。”
“这一研究成果,有助于社会各界准确认识网络零售与线下零售的关系,共同探索和建设良好的商业发展环境。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05