京公网安备 11010802034615号
经营许可证编号:京B2-20210330
2014年12月12-14日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中科院计算所与CSDN共同协办的 2014中国大数据技术大会 将在北京新云南皇冠假日酒店拉开帷幕。大会为期三天,以推进行业应用中的大数据技术发展为主旨,拟设立“大数据基础设施”、“大数据生态系统”、“大数据技术”、“大数据应用”、“大数据互联网金融技术”、“智能信息处理”等多场主题论坛与行业峰会。由中国计算机学会主办,CCF大数据专家委员会承办,南京大学与复旦大学协办的“2014年第二届CCF大数据学术会议”也将同时召开,并与技术大会共享主题报告。
本次大会将邀请近100位国外大数据技术领域顶尖专家与一线实践者,深入讨论Hadoop、YARN、Spark、Tez、 HBase、Kafka、OceanBase等开源软件的最新进展,NoSQL/NewSQL、内存计算、流计算和图计算技术的发展趋势,OpenStack生态系统对于大数据计算需求的思考,以及大数据下的可视化、机器学习/深度学习、商业智能、数据分析等的最新业界应用,分享实际生产系统中的技术特色和实践经验。
携程资深软件工程师廖晓格将在“大数据技术”分论坛带来“让大数据更实时和可视化”的演讲。大数据不仅是数据规模大,而且最好能实时查看和分析。 实时和可视化拉近了大数据与普通用户的距离,更加贴近业务需要。携程在大数据实时和可视化方面做了不少努力,实现了以下目标,廖晓格将在演讲中分享携程在其中的经验和技术:
廖晓格,携程资深软件工程师
有6年Hadoop相关应用开发经验,先后在PPTV,eBay,携程参与开发过相应大数据平台相关应用,目前在携程Data Infrastructure team负责大数据平台的运维和开发工作。
CSDN:你所在的公司,都曾使用过哪些大数据技术?你对这些技术满意的地方和不满意的地方分别有什么?
廖晓格:我们公司比较重视大数据技术,我们主要使用的技术是Hadoop生态环境的各种开源框架,storm,spark等。满意的地方是他们都是开源的,所以遇到问题的时候总会找到解决方案,而且社区也很活跃, 能够获得很多帮助。同时也会遇到很多bug,需要对使用的框架很了解,才能很好的使用它,幸亏我们有很强大的运维和开发团队支持,不断优化,不断解决问题。
CSDN:根据你的了解,目前类似的企业中,在数据方面,遇到的最大困难是什么?
廖晓格:据我了解,每个公司都有很多数据,每天T级或P级的数据,但是大部分都是搞技术的不懂业务,搞业务的不懂技术,这样就不会很快很有效率的利用数据来帮助业务,所以让大数据可视化很重要,业务人员可以很方便的获取他们想要的数据,可以省去很多沟通的成本。
CSDN:在大数据领域,目前还有哪些技术是你正在观察和研究的,为什么你看好这些技术?
廖晓格:Storm,Streaming流式计算和Spark是我现在正在观察和研究的,互联网的竞争压力很大,所以很多东西要快,谁比较快就占领了优势,大数据也一样,数据早点出来,业务就可以早点做决策。我们也是不断改进,不断往这个目标前进。
CSDN:请谈谈你在这次大会上即将分享的话题。
廖晓格:我分享的是Make big data visualizable and real-time,让大数据更加实时和可视化,携程每天上T的数据都是实时从网站,手机等各种应用端流到服务端,如果没有可视化,根本不知道用户发生什么行为,哪个产品用户更加喜欢。如果计算很慢,我们将会不能给用户很好的反馈,不能及时发现和解决各种应用端遇到的各种问题,这样就不能给用户很好的体验,将会流失大量的用户。我们目标在第一时间为用户提供最优的服务。本文来源:CDA数据分析师官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04