京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据不在于大小 关键得有价值 各路大咖论剑大数据应用
一场会议不仅来了两位院士,连国际大数据分析大会主席都专门作了主题演讲,只能坐下300人的会议厅连走廊过道都站满了听众……如果利用大数据为本次软博会的分场论坛制作一张热力图的话,昨天下午国展中心的扬子厅一定是颜色最深的那一个。因为这里讨论的是目前被社会各界关注的大数据如何与产业融合创新的问题。
大数据是这两年互联网普及运用带来的一个热词,随着信息爆炸和所有人群电子痕迹的采集,全世界的大数据容量正在以令人难以置信的速度快速增长。据有关方面不完全统计,2004年全球的大数据容量约为30EB(以日常接触的手机内存容量GB为标准,一EB大约等于11亿GB),到2013年这个数字已经是35000EB,而且这一容量每年都在呈几何级数不断增加。对于已经达到这样一个量级的数据究竟该怎么处理,不仅仅是计算机硬件的问题,更是软件和整个解决方案架构的问题。因为只有把这些数据处理好了才能建立运用的基础。
“大数据实际上并不是什么新鲜词,早在上世纪80年代就被美国著名的未来学家托夫勒教授提出了,之所以现在大家对这一名词产生新的关注,是因为数据带来的新问题。”来自浙江大学的中国工程院院士谭建荣教授表示,其实直到目前对于什么是大数据还没有一个专业的定义,最被大家所接受的说法是运用现有技术、现有手段、现有方法没办法处理的数据就是大数据。因此,要解决大数据的运用问题,首先要解决大数据的处理难题。在谭建荣看来,因为现在大家对众多的数据哪些有用哪些没用并不清楚,只有首先做到海量的数据提取,才有可能从中找到有价值的数据。
来自加拿大工程院的凌晓峰院士则认为数据没有大小之分,关键是找到其中的价值。为了便于会场的听众理解,凌院士专门找来一张个人信贷支出的数据,在排除干扰数据后,利用有效数据来提前判定个人信用违约发生的可能性。“如果把这一功能延展,可以在个人饮食、医疗健康等各领域得到充分运用。”凌晓峰院士认为在互联网普及发展的今天,需要一个平台来让各种大数据完成交互,进而形成系统,才能最终实现大数据唱戏的结果。
记者了解到,作为本次软博会确定创建的软件名城示范区,中国(南京)软件谷主导建设的南京大数据产业基地已集聚大数据企业135家,尤其2015年9月南京市大数据产业协会成立后,构建了“协会(联盟)+平台+基地+基金”产业链发展新模式,初具特色的大数据产业体系已基本形成。目前,南京软件谷在大数据产业发展方面已形成了“五大产业集群”,分别是以华为、中兴、步步高等为龙头的通信及智能终端产业集群;以SAP、亚信等为引领的云计算、大数据及移动互联网产业集群;以欧飞、润和等为支柱的电子商务及互联网金融产业集群;以中兴光电子、美满、天溯等为核心的物联网及芯片设计产业集群;以中电十四所、宏图三胞、舜天等为平台的旗舰经济。
成立不到4年的一家大数据处理公司运满满,该平台撮合司机、货主双方在平台上进行对接,汇聚全国95%的货物信息、78%的重卡司机,每日产生TB级的海量数据,包括司机行驶里程、路线、交易行为等大数据沉淀,运用大数据、云计算、人工智能精准车货匹配、计算最佳路径、预测回程配货概率,降低空驶率。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10