京公网安备 11010802034615号
经营许可证编号:京B2-20210330
2017:大数据支撑“AI+”加速落地
过去的2016年,政府、行业以及大众对大数据的认知有了更进一步提升,但是大数据的应用落地及价值体现还是处在初级阶段,大数据如何促进创新创业,带来新的经济增量,如何推动传统行业转型升级,如何实现商业价值在2017年将会受到更多关注,尤其是以大数据为基石的人工智能应用将会驱动着“AI+”的发展。
2016:数据新能源价值拓展从互联网到传统行业
阿里巴巴集团董事局主席马云在10月份云栖大会上首次提到“五新”的趋势,分别是新零售、新金融、新制造、新技术和新能源。而数据正是代表的新能源,过去的发展是基于石油和煤,未来的发展是基于新的能源,那就是数据,数据是人类第一次自己创造了能源,而且数据越用越值钱。
数据作为物理世界在虚拟空间的客观映射,人、事、物都在被数据化,人与人、物与物、人与物之间瞬间就会产生大量的数据,数据成为新经济的生产要素,如同工业时代的钢铁、石油。数据新能源只有在使用中才能不断体现和衍生出价值,2016年我们看到大数据实践从互联网行业拓展到越来越多的传统行业、政府部门的实践。
1、政府部门着力推动大数据相关政策法规、机构及产业发展
自2015年9月国务院发布《关于促进大数据发展的行动纲要》,十八届五中全会公报提出要实施“国家大数据战略”之后,大数据相关地方和行业政策法规依次出台。2016年1月15日,贵州省通过了《贵州省大数据发展应用促进条例》,这是中国首部大数据地方法规,将大数据产业纳入法治轨道,以立法引领和推动大数据产业蓬勃发展。
截止2016年底,全国已有30多个地方政府部门出台了大数据相关的政策文件,10多个地方政府专门设置了大数据管理部门,统筹推进大数据发展。目前全国已建或拟建的大数据产业园区超过10个。这些大数据产业主要分布在北京、上海等比较发达的地区,并已形成了较完备的产业链,产业规模也在不断扩大,为相关企业向大数据产业迅速转型奠定了良好基础。
政府行业的信息化和数据化水平参差不齐,但作为国家大数据行动纲要的重要目标之一——政府和公共数据资源的开放共享是目前重要方向,将会大幅提升政府治理创新能力和决策水平,也有助于利用社会力量实现协同治理的目标。根据初步统计,截止2016年8月,我国共有19个地方政府部门建有数据开放平台网站。但数据开放水平和政府数据价值挖掘还有待提升,不少政府部门认识到数据即权力,对于数据共享开放持保守的态度。
另一方面,信息化水平比较高的政府部门已经着手搭建统一的大数据平台,比如海关、国税总局等在探索依赖云计算技术建立统一的大数据平台,提升部门内部数据的共享,打通信息孤岛,提升政府治理能力和水平。交通部门与互联网企业紧密合作,推动交通大数据的融合助力城市交通治理能力的加强。
2、大数据的落地与行业的互联网化和信息化水平紧密相关
2016年,大数据加速在行业应用场景的落地,从互联网行业向传统行业的渗透进程加速。但总体来看,应用水平最高的是互联网行业,在线实时的数据成为支撑互联网行业业务的基石,围绕着消费者进行个性化推荐和精准营销成为最主要的应用场景:
比如,在2016年双11期间阿里平台上的千人千面服务使得每个消费者都可以拥有自己专属的双11就是典型的智能个性化推荐的应用场景,同时基于大数据的风险控制、贷款服务和信用应用也成为数据外部化应用的典型场景;
比如蚂蚁金融的小微贷款和芝麻信用服务,依据阿里巴巴商家在平台上的数据建立的信用风险模型让商家可以获得310的贷款服务(3分钟申请,1秒钟审批,0人工干预),个人的芝麻信用分数可以应用在大量的商业消费场景中;
比如租车、酒店住宿、婚恋、签证服务等,同时也在帮助最高人民法院对“老赖”进行信用惩戒方面提供了新路径。
金融和电信行业作为信息化水平较高的行业,不仅有大量的历史数据积累,同时也越来越重视内外部数据的整合应用,从支撑业务、支撑决策,到营销类应用和风险控制类应用,数据的价值在逐渐扩大,我们还看到电信运营商的信令数据可以为交通治理服务这样的外部应用开始逐渐浮现和发展。
传统制造业、物流、医疗、农业等行业在很多点的大数据应用方面也有突破,比如“大数据+工匠精神”对于制造业的转型升级至关重要。而大数据的实时、感知和预测等特点确实可以为制造企业在降低成本,缩短生产周期,提升效率,细分产品定位,优化流程和决策等方面扮演重要的角色
阿里巴巴目前也已经和徐工集团开始进行合作,希望利用阿里云上面的大数据能力,协助徐工建中国工业大数据平台,实现“阿里云+徐工”=“中国的Predix”,在工业大数据平台、应用及生态建设方面探索一条新路。
索菲亚在探索C2B的实践过程中,数据对于其规模化和个性化的平衡起到关键作用。索菲亚认为自己不是家具制造企业,而是一家大数据企业。在调研时我们发现,索菲亚有强大的科技团队,超过400多人,而其中300多人是在做数据加工。索菲亚利用大数据提升客户体验,提高交付效率,减少差错和库存,基本可以做到零库存水平。在索菲亚的前端需求到后端的生产系统中,数据的共享、联通和流动是实现订单准确地从需求端传递到生产制造和采购端的关键。
3、数据商业化面临诸多挑战
虽然在2015到2016年,不少地方政府主导成立了数据交易所,一些商业化的数据交易平台也上线运营,但目前基于数据的全新商业模式依然还处在探索的初级阶段,数据交易、交换及服务的商业化面临诸多挑战,比如应用场景和价值不易标准化,数据定价及资产评估问题,安全和隐私的问题,政府数据开放的速度较慢问题等。
作为新能源,数据是越用越有价值,但也正是如此,同样的数据在某个场景下价值很大,在其他场景下可能没有价值,数据的应用场景和价值不容易标准化,就如同挖金子的初期一样,真正赚钱的还是卖铁锹的,如今还没有到真正卖金子的时候。
数据与工业时代的商品有截然不同的属性,工业时代的商品是实体物品为主,基于一定成本的原料生产后,基于工厂相对标准化的大规模生产模式生产出来;而目前的数据应用水平和程度有限,数据标准化程度很低,无法按照传统的商品销售模式进行销售。
工业时代的商品经历了上百年的发展之后,已经形成了大家都认同的标准化定价模式,比如基于物权的定价模式,基本上是成本加上品牌定价;而数据的权属问题目前还是个大难题,传统物权、知识产权等都存在不适用的部分,同时数据产生的边界成本基本为零,因此目前从数据加工的成本和基于数据加工衍生出的服务出发,以API或数据集的方式销售给用户是一些在尝试的模式,比如以数据堂、聚合数据为代表的第三方数据服务公司正在采用这样的模式,还有以DaaS(DataasServices)的云服务模式提供给用户使用,但总体规模和盈利模式都远不成熟。
2017:大数据支撑AI+加速落地
2016年的AlphaGo和年底的Master通过人机大战让人工智能成了尽人皆知的概念,但外在的人机大战背后是内在的数据+计算+算法能力的崛起,正是这三个因素让诞生了60年之久的AI在今天再度成为热点。笔者曾经听一位从事机器学习领域研发的资深专家讲,猛然在2016年才意识到自己原来从事的是AI行业,以前从来没有意识到。可见AI的热度并非凭空产生,是多年的技术发展到一定阶段的结果。
2017年,大数据的发展有以下几个主要趋势:
1、数据+算法+计算能力加速AI+落地
云计算技术的日臻成熟和成本的降低奠定了大数据发展的技术基础,深度学习算法的兴起和发展使得计算+数据+算法三者支撑的人工智能走下神坛。
伴随着大数据时代的到来,多来源、实时、大量、多类型的数据可以从不同的角度对现实进行更为逼近真实的描述,而利用深度学习算法可以挖掘数据之间的多层次关联关系,为人工智能应用奠定了数据源基础。目前的人工智能应用场景都是以大数据作为基础的,比如在搜索、推荐、语音交互等场景中已经有了不少成功实践。
2、基于数据融合和外在价值的探索会诞生新商业模式
目前大数据比较成熟的场景是包括个性化推荐和营销类应用,以及风险控制、信用评估类应用。我们看到,大数据产品技术及解决方案的创新比较清晰,开源技术基础上的创新和服务是主要方向,但围绕着数据本身的新商业模式还在探索过程中。
2017年,基于数据融合和外在价值的创新模式会诞生新的商业模式,企业内外数据、线上线下数据融合产生化学反应,基于数据的创新模式给我们无限想象空间。
3、大数据开始重构传统工业和制造业的价值链
传统企业和行业用户已经开始围绕着数据进行业务流程重构和再造,以数据为核心开始尝试业务创新模式,比如C2B/C2M模式实质是以消费者数据为核心倒逼传统产业的升级转型。2017年传统工业和制造业会更多地关注数据如何驱动主要传统产业的解构、重构和再造,基于数据的传统产业转型升级成为主流。
4、围绕着数据权属、个人信息保护、跨境数据流动的相关政策法规标准出台
2016年《网络安全法》的出台引起了社会上对数据安全相关领域的强烈关注,2017年数据权属、个人信息保护以及跨境数据流动相关政策法规标准会逐渐完善,推动《网络安全法》的落地实施,促进我国大数据的健康有序发展。
正如前面所讲,数据权属的界定目前也需要有相应的法律规范出台他,它对于基于数据的创新创业影响巨大。过往几年中基于数据买卖的地下灰黑产业非常猖獗,带动了消费者个人和国家对个人信息保护的关注,但目前来看我国个人信息保护相关的法律规范尚不完善,目前只在一些法律中有零散规定,仍然存在效力层级低、法律法规协调性弱、保护内容片面等立法不足,有待于加强和完善。
同时,互联网使得数据的跨境流动变得普遍,我国越来越多的企业在通过互联网成为全球化企业,数据本地化和跨境数据流动的问题会日益凸显。大数据产业发展呼唤政策法规标准的快速跟进。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27在数字化时代,企业积累的海量数据如同散落的珍珠,若缺乏有效的梳理与分类,终将难以发挥实际价值。CDA(Certified Data Analys ...
2026-02-27在问卷调研中,我们常遇到这样的场景:针对同一批调查对象,在不同时间点(如干预前、干预后、随访期)发放相同或相似的问卷,收 ...
2026-02-26在销售管理的实操场景中,“销售机会”是核心抓手—— 从潜在客户接触到最终成交,每一个环节都藏着业绩增长的关键,也暗藏着客 ...
2026-02-26