
2017:大数据支撑“AI+”加速落地
过去的2016年,政府、行业以及大众对大数据的认知有了更进一步提升,但是大数据的应用落地及价值体现还是处在初级阶段,大数据如何促进创新创业,带来新的经济增量,如何推动传统行业转型升级,如何实现商业价值在2017年将会受到更多关注,尤其是以大数据为基石的人工智能应用将会驱动着“AI+”的发展。
2016:数据新能源价值拓展从互联网到传统行业
阿里巴巴集团董事局主席马云在10月份云栖大会上首次提到“五新”的趋势,分别是新零售、新金融、新制造、新技术和新能源。而数据正是代表的新能源,过去的发展是基于石油和煤,未来的发展是基于新的能源,那就是数据,数据是人类第一次自己创造了能源,而且数据越用越值钱。
数据作为物理世界在虚拟空间的客观映射,人、事、物都在被数据化,人与人、物与物、人与物之间瞬间就会产生大量的数据,数据成为新经济的生产要素,如同工业时代的钢铁、石油。数据新能源只有在使用中才能不断体现和衍生出价值,2016年我们看到大数据实践从互联网行业拓展到越来越多的传统行业、政府部门的实践。
1、政府部门着力推动大数据相关政策法规、机构及产业发展
自2015年9月国务院发布《关于促进大数据发展的行动纲要》,十八届五中全会公报提出要实施“国家大数据战略”之后,大数据相关地方和行业政策法规依次出台。2016年1月15日,贵州省通过了《贵州省大数据发展应用促进条例》,这是中国首部大数据地方法规,将大数据产业纳入法治轨道,以立法引领和推动大数据产业蓬勃发展。
截止2016年底,全国已有30多个地方政府部门出台了大数据相关的政策文件,10多个地方政府专门设置了大数据管理部门,统筹推进大数据发展。目前全国已建或拟建的大数据产业园区超过10个。这些大数据产业主要分布在北京、上海等比较发达的地区,并已形成了较完备的产业链,产业规模也在不断扩大,为相关企业向大数据产业迅速转型奠定了良好基础。
政府行业的信息化和数据化水平参差不齐,但作为国家大数据行动纲要的重要目标之一——政府和公共数据资源的开放共享是目前重要方向,将会大幅提升政府治理创新能力和决策水平,也有助于利用社会力量实现协同治理的目标。根据初步统计,截止2016年8月,我国共有19个地方政府部门建有数据开放平台网站。但数据开放水平和政府数据价值挖掘还有待提升,不少政府部门认识到数据即权力,对于数据共享开放持保守的态度。
另一方面,信息化水平比较高的政府部门已经着手搭建统一的大数据平台,比如海关、国税总局等在探索依赖云计算技术建立统一的大数据平台,提升部门内部数据的共享,打通信息孤岛,提升政府治理能力和水平。交通部门与互联网企业紧密合作,推动交通大数据的融合助力城市交通治理能力的加强。
2、大数据的落地与行业的互联网化和信息化水平紧密相关
2016年,大数据加速在行业应用场景的落地,从互联网行业向传统行业的渗透进程加速。但总体来看,应用水平最高的是互联网行业,在线实时的数据成为支撑互联网行业业务的基石,围绕着消费者进行个性化推荐和精准营销成为最主要的应用场景:
比如,在2016年双11期间阿里平台上的千人千面服务使得每个消费者都可以拥有自己专属的双11就是典型的智能个性化推荐的应用场景,同时基于大数据的风险控制、贷款服务和信用应用也成为数据外部化应用的典型场景;
比如蚂蚁金融的小微贷款和芝麻信用服务,依据阿里巴巴商家在平台上的数据建立的信用风险模型让商家可以获得310的贷款服务(3分钟申请,1秒钟审批,0人工干预),个人的芝麻信用分数可以应用在大量的商业消费场景中;
比如租车、酒店住宿、婚恋、签证服务等,同时也在帮助最高人民法院对“老赖”进行信用惩戒方面提供了新路径。
金融和电信行业作为信息化水平较高的行业,不仅有大量的历史数据积累,同时也越来越重视内外部数据的整合应用,从支撑业务、支撑决策,到营销类应用和风险控制类应用,数据的价值在逐渐扩大,我们还看到电信运营商的信令数据可以为交通治理服务这样的外部应用开始逐渐浮现和发展。
传统制造业、物流、医疗、农业等行业在很多点的大数据应用方面也有突破,比如“大数据+工匠精神”对于制造业的转型升级至关重要。而大数据的实时、感知和预测等特点确实可以为制造企业在降低成本,缩短生产周期,提升效率,细分产品定位,优化流程和决策等方面扮演重要的角色
阿里巴巴目前也已经和徐工集团开始进行合作,希望利用阿里云上面的大数据能力,协助徐工建中国工业大数据平台,实现“阿里云+徐工”=“中国的Predix”,在工业大数据平台、应用及生态建设方面探索一条新路。
索菲亚在探索C2B的实践过程中,数据对于其规模化和个性化的平衡起到关键作用。索菲亚认为自己不是家具制造企业,而是一家大数据企业。在调研时我们发现,索菲亚有强大的科技团队,超过400多人,而其中300多人是在做数据加工。索菲亚利用大数据提升客户体验,提高交付效率,减少差错和库存,基本可以做到零库存水平。在索菲亚的前端需求到后端的生产系统中,数据的共享、联通和流动是实现订单准确地从需求端传递到生产制造和采购端的关键。
3、数据商业化面临诸多挑战
虽然在2015到2016年,不少地方政府主导成立了数据交易所,一些商业化的数据交易平台也上线运营,但目前基于数据的全新商业模式依然还处在探索的初级阶段,数据交易、交换及服务的商业化面临诸多挑战,比如应用场景和价值不易标准化,数据定价及资产评估问题,安全和隐私的问题,政府数据开放的速度较慢问题等。
作为新能源,数据是越用越有价值,但也正是如此,同样的数据在某个场景下价值很大,在其他场景下可能没有价值,数据的应用场景和价值不容易标准化,就如同挖金子的初期一样,真正赚钱的还是卖铁锹的,如今还没有到真正卖金子的时候。
数据与工业时代的商品有截然不同的属性,工业时代的商品是实体物品为主,基于一定成本的原料生产后,基于工厂相对标准化的大规模生产模式生产出来;而目前的数据应用水平和程度有限,数据标准化程度很低,无法按照传统的商品销售模式进行销售。
工业时代的商品经历了上百年的发展之后,已经形成了大家都认同的标准化定价模式,比如基于物权的定价模式,基本上是成本加上品牌定价;而数据的权属问题目前还是个大难题,传统物权、知识产权等都存在不适用的部分,同时数据产生的边界成本基本为零,因此目前从数据加工的成本和基于数据加工衍生出的服务出发,以API或数据集的方式销售给用户是一些在尝试的模式,比如以数据堂、聚合数据为代表的第三方数据服务公司正在采用这样的模式,还有以DaaS(DataasServices)的云服务模式提供给用户使用,但总体规模和盈利模式都远不成熟。
2017:大数据支撑AI+加速落地
2016年的AlphaGo和年底的Master通过人机大战让人工智能成了尽人皆知的概念,但外在的人机大战背后是内在的数据+计算+算法能力的崛起,正是这三个因素让诞生了60年之久的AI在今天再度成为热点。笔者曾经听一位从事机器学习领域研发的资深专家讲,猛然在2016年才意识到自己原来从事的是AI行业,以前从来没有意识到。可见AI的热度并非凭空产生,是多年的技术发展到一定阶段的结果。
2017年,大数据的发展有以下几个主要趋势:
1、数据+算法+计算能力加速AI+落地
云计算技术的日臻成熟和成本的降低奠定了大数据发展的技术基础,深度学习算法的兴起和发展使得计算+数据+算法三者支撑的人工智能走下神坛。
伴随着大数据时代的到来,多来源、实时、大量、多类型的数据可以从不同的角度对现实进行更为逼近真实的描述,而利用深度学习算法可以挖掘数据之间的多层次关联关系,为人工智能应用奠定了数据源基础。目前的人工智能应用场景都是以大数据作为基础的,比如在搜索、推荐、语音交互等场景中已经有了不少成功实践。
2、基于数据融合和外在价值的探索会诞生新商业模式
目前大数据比较成熟的场景是包括个性化推荐和营销类应用,以及风险控制、信用评估类应用。我们看到,大数据产品技术及解决方案的创新比较清晰,开源技术基础上的创新和服务是主要方向,但围绕着数据本身的新商业模式还在探索过程中。
2017年,基于数据融合和外在价值的创新模式会诞生新的商业模式,企业内外数据、线上线下数据融合产生化学反应,基于数据的创新模式给我们无限想象空间。
3、大数据开始重构传统工业和制造业的价值链
传统企业和行业用户已经开始围绕着数据进行业务流程重构和再造,以数据为核心开始尝试业务创新模式,比如C2B/C2M模式实质是以消费者数据为核心倒逼传统产业的升级转型。2017年传统工业和制造业会更多地关注数据如何驱动主要传统产业的解构、重构和再造,基于数据的传统产业转型升级成为主流。
4、围绕着数据权属、个人信息保护、跨境数据流动的相关政策法规标准出台
2016年《网络安全法》的出台引起了社会上对数据安全相关领域的强烈关注,2017年数据权属、个人信息保护以及跨境数据流动相关政策法规标准会逐渐完善,推动《网络安全法》的落地实施,促进我国大数据的健康有序发展。
正如前面所讲,数据权属的界定目前也需要有相应的法律规范出台他,它对于基于数据的创新创业影响巨大。过往几年中基于数据买卖的地下灰黑产业非常猖獗,带动了消费者个人和国家对个人信息保护的关注,但目前来看我国个人信息保护相关的法律规范尚不完善,目前只在一些法律中有零散规定,仍然存在效力层级低、法律法规协调性弱、保护内容片面等立法不足,有待于加强和完善。
同时,互联网使得数据的跨境流动变得普遍,我国越来越多的企业在通过互联网成为全球化企业,数据本地化和跨境数据流动的问题会日益凸显。大数据产业发展呼唤政策法规标准的快速跟进。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01