京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据基础设施论坛:如何构建符合大数据时代的网络基础设施
2014中国大数据技术大会第二日上午的大数据基础设施论坛上,Mellannox亚太区市场开发总监刘通、武汉绿色网络信息服务有限责任公司副总经理雷葆华、浪潮云产品部兼渠道推进部总经理王峰、百度基础架构部高级架构师 柴华和博科中国区技术总监 谷增云五位专家主要专注于网络层面的相关问题展开的演讲。
图:Mellannox亚太区市场开发总监刘通
Mellannox亚太区市场开发总监刘通带来了主题为“高速网络InfiniBand加速大数据应用”的演讲。他表示基础设施和上层的应用有着非常紧密的联系,软硬件结合才更有意义。在他看来,InfiniBand是一个完全自主且非常智能的二层网络,从诞生的那天其就是SDN的网络。
“高达56Gb/s的带宽(100G EDR InfiniBand也已问世)以及低于700纳秒的延迟为高速数据传输提供了保证。InfiniBand内置支持RDMA(远端内存直接访问)网络传输技术,提供内存零拷贝、内核旁路、协议卸载的优势,从而大幅下载网络通信对CPU资源的占用,这些优势是传统TCP/IP通信协议所不具备的。”他说道。
图:武汉绿色网络信息服务有限责任公司副总经理雷葆华
武汉绿色网络信息服务有限责任公司副总经理雷葆华发表主题为“大数据在网络服务中的应用及网络演进”的演讲。 他就网络运营中的大数据探索和大数据时代的智能化网络基础设施演进两个内容进行了阐述。他介绍了基于网络的大数据体系架构的三个层次:第一个是大数据海量数据采集及预处理;第二个是DMP数据管理平台汇聚了各省的数据资源,并进行安全去隐私化处理;第三个是合作伙伴可以利用运营商大数据平台的资源,进行数据的深入分析挖掘。
他认为IDC是互联网产业的基础战略资源,作为信息中枢,直接支撑整个互联网产业的发展。而大数据时代,网络演进发生了三个变化:1.不定向突发流量的挑战;2.云数据中心互联;3.云开数据中心内部组网支持云服务。归纳来说就是业务变化驱动网络架构的变化:1. 业务流量由纵向为主演进为横向为主;2. 大型异构化,更多的节点数跨数据中心;虚拟化:3. 同一物理服务器的虚拟机之间的通信、跨物理服务器的虚拟机通信时的虚拟机标识、虚拟机迁移。
图:浪潮云产品部兼渠道推进部总经理王峰
浪潮云产品部兼渠道推进部总经理王峰发表了主题为“开放融合的云数据中心”的演讲。过去的数据中心是为某一个应用做的,我们的数据中心的效率并不是非常高,然后提出了软件定义的计算和存储,他表示希望未来在信息领域做的所有东西都是可以软件定义的,所有的资源都可以被抽象化、池化 和自动化。
传统的数据中心架构,计算、存储和网络资源是彼此独立,不同应用更是要求不同的设备和网络,利用应用软件定义的数据中心能够简化IT应用基础架构,让其不再是整个云计算、大数据中最重的那一部分。最后,他总结了两点:1. SDDC将完全改变数据中心的设备形态、服务形式,甚至IT应用的开展方式;2. 在完全融合、池化、软件定义的数据中心到来之前,我们还有几个必经阶段。
图:百度基础架构部高级架构师 柴华
百度基础架构部高级架构师 柴华介绍了百度分布式计算平台。他先是介绍了百度MapReduce的发展历程:2004年MapReduce论文发表,2007年上线了基于Haddop的百度MR,2011年百度MR单集群规模达到5000台,2013年百度MR单集群达到13000台,2014年 百度DCE发布,DAG引擎上线。
演讲中,柴华重点介绍了百度分布式计算的“七剑客”:1. 大规模离线计算平台DCE(MapReduce/DAG模型),2. 大规模机器学习平台MPI(BSP模型),3. 新一代大规模机器学习框架ELF(Parameter server架构),4. 毫秒级实时计算系统Dstream,5. 小批量流式计算系统Task Manger,6. 基于内存的开源分布式计算框架Spark,7. 分布式Trace系统Rig。
博科中国区技术总监 谷增云
博科中国区技术总监谷增云,带来了“用于大数据可视化的SDN技术”技术分享,主要讲述SDN技术,在大规模、超高性能的大数据采集方面的应用。其中Vyatta平台的架构包含三个核心层:NFV连接服务、SDN结构服务和功能编排。这个开放式架构的每一层都是模块化的,让客户能够选择适合其特定数据中心要求的产品和/或解决方案。这个平台开放和模块的特性实现了互操作性,为客户带来更好的选择。层间通信采用基于标准的透明协议和方法,包括REST APIs和NETCONF/YANG模式,确保配置的互操作性。最后针对SDN/Openflow技术如何在数Tbps带宽容量的数据中心、骨干网随时自动化的采集上应用做了简要的分析。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10