京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据融合彰显价值 跨界链接产业变革
12月7日电 5日,由国家发改委牵头组织的“中国数据创新行”主要活动——2017中国国际大数据挖掘大赛复赛在北京举行。复赛现场,来自江苏的“心脏康复大数据平台”项目正在台上为专家评委们带来精彩的路演,并博得阵阵掌声。
作为全国首个数据挖掘的国际性赛事,从今年3月赛事启动至今,已经吸引了全球19个国家和地区的万余支项目团队报名参赛。经过评委专家精心筛选,有200支项目入围复赛。据了解,大数据挖掘大赛在结束北京的复赛单元后,将在贵阳举行总决赛暨颁奖礼。
赛事评委、清华大学数据科学研究院执行副院长韩亦舜在纵览复赛项目后表示,大数据技术的渗透融合,催生了新的行业与领域,也给更多的传统行业带来了新生机。“数聚华夏 创享未来”,通过技术引领、深度融合提高实体经济发展质量,是新时期的重要探索方向,同样是本次复赛的重要主题。
数据融合 深挖“跨界”富矿
据“心脏康复大数据平台”项目负责人高锐介绍,项目通过案例大数据智能管理(Big Case)、数字心肺步行试验(DCW)、康复训练和检测设备(CTIM)等核心技术为患者提供心脏康复评估、处方、训练监测等心脏康复全流程解决方案,实现三期心脏康复的无缝对接。“我们以临床案例为基础,首创案例大数据智能管理系统,根据病人数据、健康数据自动进行分析,来提出处方建议、知识推送、服务组织,能极大程度降低失误率。”
来自深圳的“城市交通大数据在线检测与动态仿真系统”项目同样也是数据融合与挖掘利用的典型案例。项目主讲人周勇告诉记者,他们正致力于打造一个面向精细化管控和全方式智慧出行的实时在线仿真系统。系统基于移动车辆GPS、手机信令、地磁流量、视频图像等动态大数据和静态数据的多源融合,通过现实交通系统与虚拟交通系统的互动学习,以动态OD估计、中微观交通流仿真为核心,结合无人机航拍与图像识别技术对驾驶行为参数的标定,实现车道级的动态仿真与高精度的实时在线推演。目前,项目已经在深圳市福田区、新洲路和深南大道等案例中实现了深度应用。
“如何融合多元数据资源,跨越产业转型升级壁垒?这些项目给出了亮眼的答案。项目通过挖掘潜在于多种产业中的多类型数据,让大数据技术与产业发展得到深层的融合。”赛事评委、赛仕软件研究开发(北京)有限公司总经理刘政认为,多个参赛项目的出现正是我国大数据与全产业深入融合发展的具体体现。
比赛现场,各项目选手紧扣大赛主题“唤醒沉睡的数据”,从平台搭建、技术创新、数据有效利用、应用实现等多个方面,全面展现了数据融合的新前景和大数据发展的新进程。
数据挖掘是数据应用的核心,是发现新应用、创造新价值的关键,是数字经济最核心的动力,而融合则是全面激发大数据价值的最佳途径。赛事评委、TCL股权投资有限公司董事总经理游浩认为,“互联网+是大数据应用的幼年期,从技术、数据、人才、资金等资源匹配程度来看,目前大数据已经进入全面融合的新阶段探索。”
数据渗透 成为“转型”支点
多位参赛选手表示,吸引他们参赛的,是组委会提供的一系列政府开放的数据源,这其中包括14个政府开放数据平台的11600多个数据集,1600多个数据接口。“数据就是生产资源。我们的项目涉足领域广泛,得到更多领域数据的支持,才能够进一步加速应用与多领域的融合开发和完善。”
“共享开放是大数据应用的重要基础,共享的同时数据的价值也可以无限放大,通过多种形式的开发得到全方位渗透,这是数据开放的重要目的,甚至是大数据发展的重要落脚点。” 云上贵州大数据产业发展有限公司首席技术官秦晓东曾在大赛启动仪式上表示。
赛事评委、清华大学数据科学研究院执行副院长韩亦舜在分析大数据与全产业融合趋势时表示,党的十九大报告提出加快发展先进制造业,推动互联网、大数据、人工智能和实体经济深度融合,为传统行业与大数据全面融合指明了方向。本次大赛的项目从整体看,比往届赛事项目更为成熟,在数据的挖掘、分析等技术层面更为先进,尤其重视通过数据融合与渗透,在多行业多领域找到痛点解决方案或行业转型升级策略。
以此为视角,从大赛初选中脱颖而出的复赛项目不乏新颖之处。
号称“24h无人便利店”的“X空间”项目以其新颖的商业模式和便捷的购物体验吸引着各界的关注。项目负责人刘霏介绍,除了无人的特点之外,“X空间”作为线下物联网终端,将收集用户基本信息及消费数据,依靠大数据挖掘结果实现精准营销及供应链精细化管理。据了解,该项目已落地北京、长沙、青岛、汕头,并获得了市场的认可。
赛事组委会负责人告诉记者,通过赛事,引导大数据的纵向探索与全面融合,以比拼和选拔的方式,为优秀项目提供展示平台和融资机会,真真切切地为大数据行业发展做实事,是赛事的重要责任和使命。
据悉,本月晚些时候将举行2017中国国际大数据挖掘大赛总决赛及颁奖礼,这也将是“中国数据创新行”活动的收官之战。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27