京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据将助企业更好实现商业价值
大数据将帮助企业更好地实现商业价值,以及通过改善商业智能来帮助企业改变组织流程和客户体验。
2016年,各行各业的大数据应用开始从空洞的理论变为具体实践。因此,很多专家认为2016年才是真正意义上的大数据元年。那么,2017年大数据发展趋势主要集中在哪些方面?为此,本报记者近日采访了中兴飞流信息科技公司CTO郑龙。
大数据时代数据处理有三个特点
记者:大数据时代,如何从海量数据中分析得到需要的数据,是很多公司的努力方向。在您看来,大数据时代数据处理的特点是什么?
郑龙:总体来说大数据时代数据处理的特点包括三个方面:一是海量实时流数据需要高吞吐、低延时处理能力。实时事件、交易、交互数量每秒以百万计,由此产生的数据兼具海量与实时的特性,自然会给大数据处理系统造成巨大的压力,需要具备强大的并行计算能力,需要同时满足高吞吐、低延时的特点。可见实时处理是大数据发展的重大趋势。
二是基于Lambda架构的动态流批混合处理能力。目前市场上流行的流式处理系统有Spark Streaming和Storm。但还是存在计算延时仍然无法保障以及资源调度低效等缺点。Lambda架构整合离线计算和实时计算,融合不可变性(Immunability),是一个能满足实时大数据系统关键特性(如高容错、低延时和可扩展等)的架构。基于Lambda架构的统一流批混合处理平台,可以动态感知批处理或流处理的优先级,使得资源高效调度成为可能。
三是面向高度数据智能需求的大数据处理能力。当下业务场景除了对实时性要求越来越严格,业务场景的复杂程度也越来越高,数据分析、决策支持将成为大数据的重要应用。如今结合智能计算的大数据分析逐渐成为热点,包括大数据与神经计算、深度学习、语义计算以及人工智能其他相关技术结合,成为大数据分析领域的热点。
未来大数据将从三个方面快速发展
记者:未来大数据的发展方向是什么?
郑龙:大数据将帮助企业更好地实现商业价值,以及通过智能化手段来帮助企业改变组织流程和客户体验。未来大数据的发展方向包括以下几个方面——
一是机器学习将在图像识别、预测分析等领域实现商业化。Gartner研究报告称,机器学习是2017年十大战略技术趋势之一。当今最先进的机器学习和人工智能系统正在超越传统的基于规则的算法,创建出能够理解、学习、预测、适应,甚至可以自主操作的系统。随着大数据分析能力的不断提高,很多企业开始投资机器学习。
二是高吞吐、低延时的实时数据处理技术广泛运用。典型的实时数据将产生于临床实验与医疗设备、疫情预警、保险欺诈检测、电信运营商DPI分析及位置定位业务、智能电网的生产及勘探设备、交通行业路线拥堵及车辆追踪等领域。鉴于这样的流数据的分布广,影响大,所以,对于全行业大数据应用都是非常重要的组成。
业务需求驱动高吞吐、低延时的流数据处理技术应运而生,离线计算和实时计算需要在统一框架中予以动态调配完美融合,而幸运的是,这样的技术已经浮出水面,商业模式也已呼之欲出。
三是物联网与大数据的结合愈加紧密。数十亿与互联网连接的“物件”将生产大量数据。企业日益期望从这些数据中获得价值,通过发展大数据技术以便与物联网数据衔接起来。Forrester报告预计,可提供物联网洞察能力分析的第三方供应商在2017年将翻一番。
Yita是基于数据流的大数据计算引擎
记者:在您看来,什么是数据流?
郑龙:为了提高计算机的并行处理能力,人们一直致力于研发高度并行的计算模型,在这样的计算模型中,不仅要考虑数据控制类型,更要考虑驱动方式。
数据流跟控制流的区别可以简单理解为市场经济和计划经济的区别,控制流处理过程中会预先设定好每一步该干什么,然而在数据处理的实际过程中,如果有动态的变化,就没有办法处理和调整,有点类似于计划经济。相反,数据流更加像市场经济,它只规定了市场经济的准则,只要有资金、有技术、有人就开始执行。在实际处理过程中,只要有数据、计算资源、CPU就可以让任务启动起来。这样就减少了计算中的控制同步等待,从而实时性更强。
记者:正是看到了数据流模型在大数据处理方面的优势,中兴飞流推出了基于数据流模型的Yita大数据计算引擎。您能谈谈Yita大数据计算引擎的具体情况吗?
郑龙:目前数据流思想在中国的落地正是Yita计算引擎。这个从运算机理上进行创新的计算框架,不仅面对海量高压数据场景处理更加游刃有余,而且使用Lambda架构动态感知处理方式的优先级,可以进行流批混合计算,同时有机结合了机器学习能力、图计算能力和深度学习能力,最终实现了以Yita计算引擎为核心的大数据平台的智能化。
中国大数据企业需在核心技术上下功夫
记者:目前在大数据领域,我国企业需要在哪些方面下功夫?
郑龙:目前我们可以很明显看到,在系统软件领域没有一款产品是纯自主研发的。从技术角度来说这是一个很严重的问题。
中国企业要拿出核心竞争力,在大数据技术发展中占据一席之地,就如通讯业从3G向4G、5G的发展进程中,中国企业不再被牵着鼻子走,而是开始发出自己的声音,引领技术的发展,这是我国企业在技术层面需要重视的事情。
记者:作为大数据技术公司,中兴飞流着眼点在什么领域?
郑龙:作为专业从事创新大数据核心技术研发和服务的高科技软件企业,中兴飞流提供具有核心自主知识产权的大数据技术及解决方案。核心产品是以数据流思想为理论基础的Yita计算引擎,基于该计算引擎的JDH大数据平台,辅以丰富的算法库,构建了融合hadoop生态的、面向海量实时和流批混合计算的行业大数据整体解决方案。主要面向电信运营商领域、金融领域和交通、公安等政府领域,持续创造和提供具有竞争力的产品和应用,实现“数据智慧,极速共享”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04