京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据有大商机
深秋,信息通信领域一群知名专家学者聚首怀柔,一个比北京的秋景更加热烈绚烂的话题摆在他们面前——大数据。
这是一个创新研究和成果层出不穷的行业,继云计算、物联网、智慧地球之后,“大数据”再度来袭。
ICT最新风向标
大数据被用来描述信息爆炸所产生的海量数据。Jim Gray的新摩尔定理认为,每18个月全球新增的信息量是计算机有史以来全部信息量的总和。截至2010年,人类拥有的信息总量大约是1.2ZB(1ZB等于1万亿GB)。IDC预计,到2020年,世界上的数据存储总量将达35ZB。
数据之所以增长如此之快,源于各类传感器、智能终端的剧增。而高清晰图像和视频,更使得数据呈指数级增长。如何收集、管理和分析数据日益成为信息通信技术创新的重中之重。
著名未来学家阿尔温·托夫勒在《第三次浪潮》中预言说:“如果说IBM的主机拉开了信息化革命的大幕,那么‘大数据’才是第3次浪潮的华彩乐章。”今年3月,美国政府宣布正式启动“大数据计划”,并将其与历史上对超级计算和互联网的投资相提并论。这标志着大数据已经上升至美国国家战略。
工业和信息化部电信经济专家委员会(ECTE)的委员们在日前举办的秋季沙龙上研讨普遍认为,从全球ICT发展整体趋势看,大数据时代已经来临。
大数据可以干什么
多大数据算大,业界没有统一定论,一般认为,起步应当是100PB,而且在动态扩展,没有上限。
北京拓尔思总经理、中国非结构化数据管理系统标准工作组副组长施水才教授认为,比“大”更重要的是用途,就是从数据中发现规律,预测未来。据介绍,拓尔思为厄瓜多尔明年总统大选研发了预测分析系统,聚合了千家西班牙语新闻网站,包括博客、论坛、社会化媒体的信息,实时提取舆论热点及倾向性预测大选结果,用户则使用网络账号获取服务。
大数据最典型的应用应属美国联邦政府的统一数据开放门户网站——Data.Gov,旨在向全美开放政府拥有的公共数据,鼓励新的创意,提供更透明、更丰富的公共服务。截至2011年12月,Data.Gov共开放原始数据3721项、地理数据386429项。更重要的是,该网站还汇集了1570个数据可视化应用。从空气质量与工厂数量的关系,到胖子数量与快餐店的多寡,给人无限的启示和便利。
Data.Gov应用不仅服务于大众,刺激经济,还调动了大量的创新。其中一项免费的航班延误分析应用,通过分析对比航班历史准点率数据,帮助消费者找到表现最佳,或者最符合需要的航班。伴随着Data.Gov的数据开放,美国航班延误率由2008年的27%下降到2010年的20.23%。
工信部信息化推进司副司长董宝青告诉《人民邮电》报记者,要积极看待大数据热潮。大数据的兴起,不完全源于信息技术变革到了一个多么了不起的高度,而源于一国政府、企业、国民的信息化应用和创新思维到了一个崭新的高度。大数据的本质是对信息资源、知识资源、智慧资源开发利用的高度重视与创新。而我国在2004年的中办、国办34号文件里已经深刻阐述过这一理念,现在需要更加积极地去推动。
大挑战蕴含大机遇
“科技界应高度关注大数据研究这一新的发展方向,推动以大数据为基础的新兴技术和学科发展。”中国工程院院士李国杰日前表示。今年9~10月间,中国计算机学会、中国通信学会等纷纷成立了相应的大数据专家委员会。
工信部电信经济专家委员会(ECTE)在秋季学术沙龙上提出,对海量数据的掌控和解释运用将成为未来竞争与增长的基础,“大数据”引领的智慧科技时代给信息通信业带来新的机遇和挑战。
在发达国家,制造业、银行业、消费营销行业等较早进入大数据时代,各类顾客点击、浏览、反馈和交易记录,都构成了大数据的基础。百度目前数据总量接近1000PB,存储的网页数量接近10000亿,每天还会对这些数据进行更新,响应用户的请求也是几十亿次。通用电气正投资15亿美元建设全球软件和分析中心,拟雇佣400名数据科学家,协调全球1万名软件工程师通过共同的平台工作。IBM商业价值研究院和牛津大学商学院对全球数千名企业高管的调查显示,有63%的企业管理者希望大数据技术能与企业运营管理实践相结合,形成企业新的核心优势。28%的受访者所在企业已经开始试点部署大数据。
中国联通研究院副院长童晓渝认为,无论从获取、存储、处理和服务哪个环节看,大数据产业都正在快速形成。要推动其发展,应从战略的高度去做好顶层设计和行业的发展规划,标准规范,示范工程,还要前瞻性地完善制度建设,用法律法规来保证大数据的公共性、真实性、安全性和隐私保护等。
电信运营商机会何在
与国外大数据的热火朝天相比,国内IT企业参与这一领域的并不多。但嗅觉灵敏的互联网公司已经走在了前头。腾讯启动门户、微博、视频、无线的跨平台深度整合战略,天猫推出“聚石塔”平台。但目前而言,互联网业的大数据,主要是对自身用户数据的挖掘和应用深化。
运营商掌握着信息通信网络上很多关键数据,包括网络信息、用户信息、位置信息等,经过相应的加工处理可以为政府、行业、企业、个人等用户提供更加精准的服务。IBM认为,数据就是运营商的生产力。但运营商对数据商业价值的发现和筛选是一个“盲点”。此外,很多专家不约而同地指出,随着产生、存储、分析的数据量越来越大,用户个人的隐私受到前所未有的挑战。电信运营商的规模、实力与国企身份,在数据安全保护方面有比普通IT或互联网企业更强的公信力。
近年来,电信运营商在传统业务增长乏力的情况下纷纷实行战略转型,大力发展数据业务。中国移动通信集团设计院有限公司党委书记周建明表示,大数据将成为电信运营商发展的核心引擎。但同时,大数据给固网和无线宽带都带来巨大挑战。过快的流量增长可能会带来网络质量下降,将降低中国信息网络的竞争力,也间接降低了中国经济竞争力。所以,运营商要高度重视大数据时代的网络建设,还要对宽带网络进行智慧管理。
工信部电信经济专家委员会秘书长陈金桥用“一半是火焰,一半是海水”形象地比喻了大数据对通信业的机遇和挑战。尽管电信运营商拥有数据,但在快速兴起的互联网尤其是移动互联网业务面前,电信运营商数据业务并不强大,层次还很低。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12