京公网安备 11010802034615号
经营许可证编号:京B2-20210330
2017:大数据支撑“AI+”加速落地
过去的2016年,政府、行业以及大众对大数据的认知有了更进一步提升,但是大数据的应用落地及价值体现还是处在初级阶段,大数据如何促进创新创业,带来新的经济增量,如何推动传统行业转型升级,如何实现商业价值在2017年将会受到更多关注,尤其是以大数据为基石的人工智能应用将会驱动着“AI+”的发展。
2016:数据新能源价值拓展从互联网到传统行业
阿里巴巴集团董事局主席马云在10月份云栖大会上首次提到“五新”的趋势,分别是新零售、新金融、新制造、新技术和新能源。而数据正是代表的新能源,过去的发展是基于石油和煤,未来的发展是基于新的能源,那就是数据,数据是人类第一次自己创造了能源,而且数据越用越值钱。
数据作为物理世界在虚拟空间的客观映射,人、事、物都在被数据化,人与人、物与物、人与物之间瞬间就会产生大量的数据,数据成为新经济的生产要素,如同工业时代的钢铁、石油。数据新能源只有在使用中才能不断体现和衍生出价值,2016年我们看到大数据实践从互联网行业拓展到越来越多的传统行业、政府部门的实践。
1、政府部门着力推动大数据相关政策法规、机构及产业发展
自2015年9月国务院发布《关于促进大数据发展的行动纲要》,十八届五中全会公报提出要实施“国家大数据战略”之后,大数据相关地方和行业政策法规依次出台。2016年1月15日,贵州省通过了《贵州省大数据发展应用促进条例》,这是中国首部大数据地方法规,将大数据产业纳入法治轨道,以立法引领和推动大数据产业蓬勃发展。
截止2016年底,全国已有30多个地方政府部门出台了大数据相关的政策文件,10多个地方政府专门设置了大数据管理部门,统筹推进大数据发展。目前全国已建或拟建的大数据产业园区超过10个。这些大数据产业主要分布在北京、上海等比较发达的地区,并已形成了较完备的产业链,产业规模也在不断扩大,为相关企业向大数据产业迅速转型奠定了良好基础。
政府行业的信息化和数据化水平参差不齐,但作为国家大数据行动纲要的重要目标之一——政府和公共数据资源的开放共享是目前重要方向,将会大幅提升政府治理创新能力和决策水平,也有助于利用社会力量实现协同治理的目标。根据初步统计,截止2016年8月,我国共有19个地方政府部门建有数据开放平台网站。但数据开放水平和政府数据价值挖掘还有待提升,不少政府部门认识到数据即权力,对于数据共享开放持保守的态度。
另一方面,信息化水平比较高的政府部门已经着手搭建统一的大数据平台,比如海关、国税总局等在探索依赖云计算技术建立统一的大数据平台,提升部门内部数据的共享,打通信息孤岛,提升政府治理能力和水平。交通部门与互联网企业紧密合作,推动交通大数据的融合助力城市交通治理能力的加强。
2、大数据的落地与行业的互联网化和信息化水平紧密相关
2016年,大数据加速在行业应用场景的落地,从互联网行业向传统行业的渗透进程加速。但总体来看,应用水平最高的是互联网行业,在线实时的数据成为支撑互联网行业业务的基石,围绕着消费者进行个性化推荐和精准营销成为最主要的应用场景:
比如,在2016年双11期间阿里平台上的千人千面服务使得每个消费者都可以拥有自己专属的双11就是典型的智能个性化推荐的应用场景,同时基于大数据的风险控制、贷款服务和信用应用也成为数据外部化应用的典型场景;
比如蚂蚁金融的小微贷款和芝麻信用服务,依据阿里巴巴商家在平台上的数据建立的信用风险模型让商家可以获得310的贷款服务(3分钟申请,1秒钟审批,0人工干预),个人的芝麻信用分数可以应用在大量的商业消费场景中;
比如租车、酒店住宿、婚恋、签证服务等,同时也在帮助最高人民法院对“老赖”进行信用惩戒方面提供了新路径。
金融和电信行业作为信息化水平较高的行业,不仅有大量的历史数据积累,同时也越来越重视内外部数据的整合应用,从支撑业务、支撑决策,到营销类应用和风险控制类应用,数据的价值在逐渐扩大,我们还看到电信运营商的信令数据可以为交通治理服务这样的外部应用开始逐渐浮现和发展。
传统制造业、物流、医疗、农业等行业在很多点的大数据应用方面也有突破,比如“大数据+工匠精神”对于制造业的转型升级至关重要。而大数据的实时、感知和预测等特点确实可以为制造企业在降低成本,缩短生产周期,提升效率,细分产品定位,优化流程和决策等方面扮演重要的角色
阿里巴巴目前也已经和徐工集团开始进行合作,希望利用阿里云上面的大数据能力,协助徐工建中国工业大数据平台,实现“阿里云+徐工”=“中国的Predix”,在工业大数据平台、应用及生态建设方面探索一条新路。
索菲亚在探索C2B的实践过程中,数据对于其规模化和个性化的平衡起到关键作用。索菲亚认为自己不是家具制造企业,而是一家大数据企业。在调研时我们发现,索菲亚有强大的科技团队,超过400多人,而其中300多人是在做数据加工。索菲亚利用大数据提升客户体验,提高交付效率,减少差错和库存,基本可以做到零库存水平。在索菲亚的前端需求到后端的生产系统中,数据的共享、联通和流动是实现订单准确地从需求端传递到生产制造和采购端的关键。
3、数据商业化面临诸多挑战
虽然在2015到2016年,不少地方政府主导成立了数据交易所,一些商业化的数据交易平台也上线运营,但目前基于数据的全新商业模式依然还处在探索的初级阶段,数据交易、交换及服务的商业化面临诸多挑战,比如应用场景和价值不易标准化,数据定价及资产评估问题,安全和隐私的问题,政府数据开放的速度较慢问题等。
作为新能源,数据是越用越有价值,但也正是如此,同样的数据在某个场景下价值很大,在其他场景下可能没有价值,数据的应用场景和价值不容易标准化,就如同挖金子的初期一样,真正赚钱的还是卖铁锹的,如今还没有到真正卖金子的时候。
数据与工业时代的商品有截然不同的属性,工业时代的商品是实体物品为主,基于一定成本的原料生产后,基于工厂相对标准化的大规模生产模式生产出来;而目前的数据应用水平和程度有限,数据标准化程度很低,无法按照传统的商品销售模式进行销售。
工业时代的商品经历了上百年的发展之后,已经形成了大家都认同的标准化定价模式,比如基于物权的定价模式,基本上是成本加上品牌定价;而数据的权属问题目前还是个大难题,传统物权、知识产权等都存在不适用的部分,同时数据产生的边界成本基本为零,因此目前从数据加工的成本和基于数据加工衍生出的服务出发,以API或数据集的方式销售给用户是一些在尝试的模式,比如以数据堂、聚合数据为代表的第三方数据服务公司正在采用这样的模式,还有以DaaS(DataasServices)的云服务模式提供给用户使用,但总体规模和盈利模式都远不成熟。
2017:大数据支撑AI+加速落地
2016年的AlphaGo和年底的Master通过人机大战让人工智能成了尽人皆知的概念,但外在的人机大战背后是内在的数据+计算+算法能力的崛起,正是这三个因素让诞生了60年之久的AI在今天再度成为热点。笔者曾经听一位从事机器学习领域研发的资深专家讲,猛然在2016年才意识到自己原来从事的是AI行业,以前从来没有意识到。可见AI的热度并非凭空产生,是多年的技术发展到一定阶段的结果。
2017年,大数据的发展有以下几个主要趋势:
1、数据+算法+计算能力加速AI+落地
云计算技术的日臻成熟和成本的降低奠定了大数据发展的技术基础,深度学习算法的兴起和发展使得计算+数据+算法三者支撑的人工智能走下神坛。
伴随着大数据时代的到来,多来源、实时、大量、多类型的数据可以从不同的角度对现实进行更为逼近真实的描述,而利用深度学习算法可以挖掘数据之间的多层次关联关系,为人工智能应用奠定了数据源基础。目前的人工智能应用场景都是以大数据作为基础的,比如在搜索、推荐、语音交互等场景中已经有了不少成功实践。
2、基于数据融合和外在价值的探索会诞生新商业模式
目前大数据比较成熟的场景是包括个性化推荐和营销类应用,以及风险控制、信用评估类应用。我们看到,大数据产品技术及解决方案的创新比较清晰,开源技术基础上的创新和服务是主要方向,但围绕着数据本身的新商业模式还在探索过程中。
2017年,基于数据融合和外在价值的创新模式会诞生新的商业模式,企业内外数据、线上线下数据融合产生化学反应,基于数据的创新模式给我们无限想象空间。
3、大数据开始重构传统工业和制造业的价值链
传统企业和行业用户已经开始围绕着数据进行业务流程重构和再造,以数据为核心开始尝试业务创新模式,比如C2B/C2M模式实质是以消费者数据为核心倒逼传统产业的升级转型。2017年传统工业和制造业会更多地关注数据如何驱动主要传统产业的解构、重构和再造,基于数据的传统产业转型升级成为主流。
4、围绕着数据权属、个人信息保护、跨境数据流动的相关政策法规标准出台
2016年《网络安全法》的出台引起了社会上对数据安全相关领域的强烈关注,2017年数据权属、个人信息保护以及跨境数据流动相关政策法规标准会逐渐完善,推动《网络安全法》的落地实施,促进我国大数据的健康有序发展。
正如前面所讲,数据权属的界定目前也需要有相应的法律规范出台他,它对于基于数据的创新创业影响巨大。过往几年中基于数据买卖的地下灰黑产业非常猖獗,带动了消费者个人和国家对个人信息保护的关注,但目前来看我国个人信息保护相关的法律规范尚不完善,目前只在一些法律中有零散规定,仍然存在效力层级低、法律法规协调性弱、保护内容片面等立法不足,有待于加强和完善。
同时,互联网使得数据的跨境流动变得普遍,我国越来越多的企业在通过互联网成为全球化企业,数据本地化和跨境数据流动的问题会日益凸显。大数据产业发展呼唤政策法规标准的快速跟进。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20