
“大数据时代”开启产业转型新模式
有人把数据比喻为蕴藏能量的煤矿,不同煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”,价值含量、挖掘成本比数量更为重要。现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。
大数据带来新产业
说起“大数据”这三个字,很多人都听过,但要说真正了解“大数据”是什么意思,相信绝大多数人都并不清楚。近日,记者来到位于南河道高新大厦的汉唐大数据研究院,这里是由兰州睿创波迪信息科技有限公司发起,在省、市相关政府部门支持下,联合国内知名高校、科研院所,聘请了十多名包括院士、长江学者、千人计划学者在内的国内顶级专家,集产、学、研一体的大数据研究机构,同时,作为兰州市高新区创业中心重点扶持项目之一,也得到了一整层楼共1066㎡的创业场所作为扶持。
“近两年,大家对大数据的概念听得很多,但大都是一些概念上的炒作,人们都不知道大数据到底是做什么的。很多人都问过我一个问题,你的数据从哪来?其实大数据而言,它不仅是一个数据的加工分析利用,其实是一整个技术产业链的发展,需要各方面的配套,并不是单纯某个方面的问题。”兰州睿创波迪信息科技有限公司总经理张亚东说。他认为,大数据的概念比较多,可能现在大众比较认同的一种解释是:数据量大、或者复杂到一定程度,已经用传统的方式无法进行处理的数据,称之为大数据。与传统数据相比较,大数据呈现出诸多新的特性,如数据容量大、数据类型繁多、价值密度低及处理速度快等,其最核心的价值就是在于对海量数据进行存储、分析与挖掘,需要研究与之相应地一系列新方法、新技术或新标准。
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式计算架构。它的特色在于对海量数据的挖掘,但它必须依托云计算的分布式处理、分布式数据库、云存储和虚拟化技术。简而言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。
研究差异决定细化走向
“其实一开始建数据院是为了服务我们自己的项目,睿创波迪信息科技有限公司是以做软件为主,包括移动互联网这块,需要一些大数据的分析,我们聘请的博士就是大数据研究领域的专业人士。在项目开展过程中发现以传统的项目角度来做大数据存在诸多问题,主要是由于当前项目与人的生活、商业、医疗、教育、物业等方面都有关系,是一个产业性的问题,单独靠一两个人或一两个企业是很难解决的。所以去年我们就跑去北京,到中科院、清华这些专业人士聚集的地方‘取经’,最终邀请到数位活跃在物联网、云计算、数据库的国内知名专家加入我们,可以说他们的一些技术、成果,通过我们可以很好的应用到现实中,所以大家一拍即合,为了搭建一个良好的协作平台,最终由睿创波迪作为发起方,共同筹建成立了我们这个汉唐大数据研究院。”
张亚东告诉记者,初期以面向消费服务的商业大数据研究为目标,研究基于时空数据的数据采集、存储、检索体系架构,建设CTM公共商业数据平台,在此基础上围绕安全、交通、健康、金融、商业、生活等,凝练出几个准国家级重点实验室或工程中心的研究方向,形成几个具有自有特色的研究实体。目前,研究院下设有:大数据基础理论与关键技术研究中心、智慧生活大数据研究中心、隐私安全大数据研究中心、
健康与教育大数据研究中心。
记者了解到,根据不同的研究方向,每个实验室所侧重的数据研究方向也各有不同。比如在智慧生活大数据研究中心,围绕智慧生活,包括家居、商业、交通、旅游等,相关的系统架构、关键技术为主要研究目标,以产业化应用为目的,研究方向主要包括智慧社区、智慧商业、智慧交通、智慧旅游等方面。“我们正在榆中建立西北首个真正意义上的‘智慧社区’,它不等同于拥有很多智能化设备的智能社区,而是像‘智慧城市’这种概念,为每个人提供的服务都是不一样的,可以说是个性化服务,数据能自动识别、自动判别为不同的人提供不同的服务。但‘智慧城市’是一个很宽泛、涉及的行业非常广的一个项目,它的建设周期或者建设成本是非常耗时耗力的,所以我们以点入手,先从社区开始。”张亚东表示,在我们生活中,每个人每天面临到的信息量都非常的大,像视频、图像、语音等等这些“非结构化”的数据信息的采集、存储、加工、利用就是未来大数据要做的事情。
力争建设大数据“贝尔实验室”
在谈到如何将大数据技术应用到实际生活中时,张亚东表示,接下来汉唐大数据研究院将和地产公司亨威集团合作,在榆中建立一座“主题购物公园”。“传统的城市综合体都是提着大包小包的在购物,如何将拎包购物变成一个休闲娱乐购物呢?”他解释,逛商场时看中某件商品,扫描刷卡以后可以继续去逛街去吃饭去休闲娱乐,而不用自己拎着大包小包,整个逛完以后买好的商品全部都打包好直接送到家里,或者直接送到地下停车场顾客的车位旁,是不是很方便呢?“这都是我们下一步计划要做的事情,都是应用大数据的技术,更有可能的是,比如你在商场里走路,通过你走路的快慢,你眼光的方向,通过大数据的集中处理,就可以判断出你感兴趣的东西是什么,你走的慢,要么是有事情在这里等人,要么就是你有个感兴趣的东西在这里,这就是大数据的视频技术。很多个体无意识的行为,在一个群体里面,他就是有规律可寻的,这就是大数据体现在生活中的一个方面。”
技术服务商是研究院今后扮演的重要角色。把政府、企业、高校、研究院所、资本和创业型企业连接起来,实现产学研对接、推动行业发展是中心建设的重要目标。力争建设成为大数据行业的“贝尔实验室”,并将研究院建设成为学科、学术、技术、产业、机制等均在国内具有引领地位的大型创新平台。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29