京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据技术论坛(下):大数据时代的掘金术
2014年12月12-14日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中科院计算所与CSDN共同协办,以推进大数据科研、应用与产业发展为主旨的2014中国大数据技术大会(Big Data Technology Conference 2014,BDTC 2014)暨第二届CCF大数据学术会议在北京新云南皇冠假日酒店盛大开幕。
用友软件高级工程师 白小勇
2014中国大数据技术大会第二日上午的大数据技术论坛,用友软件高级工程师白小勇主持了下午的论坛。前通联数据首席战略官龙白滔、VMware高级产品线经理董波、亚信科技大数据事业部数据资产管理部门产品总监高伟、阿里巴巴数据平台事业部ODPS技术专家徐冬、携程资深软件工程师廖晓格、品友互动数据架构师廖海仁六位专家主要就大数据技术的相关问题展开了演讲。
前通联数据首席战略官 龙白滔
前通联数据首席战略官龙白滔,带来了名为“金融投资大数据实践分享”的主题演讲。龙白滔从金融大数据和传统大数据的区别;金融数据的生产过程;金融大数据的存储;金融大数据的分析和挖掘;分析在线交互式金融编程分析研究平台五个方面对金融大数据实践进行分享。
金融大数据和消费互联网大数据的区别体现在以下几个方面:
其中,他表示时间序列数据是未来最重要的数据类型,所以掌握时间序列数据的存储、处理以及关键算法是十分重要的。比如KDB是传统金融机构的标配,Cassandra在国外的物联网和能源领域已经得到了比较成功的应用。随后,龙白滔还介绍了如何把结构化、标准化数据形成有意义的金融行业数据。龙白滔还提到相比国外,国内对前言技术的掌握和应用还差得比较远。
VMware高级产品线经理 董波
VMware高级产品线经理董波,向大家分享了“VMware为大数据应用铺平道路 ”主题演讲。企业对大数据的应用通常要经历三个阶段:概念验证阶段,快速低成本的验证大数据技术带来的价值;生产应用阶段,满足应用SLA,满足系统扩容需求;以及Hadoop即服务阶段,快速敏捷高效的满足各个业务的差异化需求。
vSphere Big Data Extension能够帮你快速简便部署,让你全力关注业务,并且BDE可与第三方管理工具无缝集成。vRealize Operations Manager,能够实现系统全面监控,智能自动分析管理,基于预测主动运维。vSpherevMotion能够消除计划或非计划宕机时间,检测失效自动恢复。
董波在演讲中还提到,运用Hadoop集群管理平台,可平衡处理企业中各部门集群使用需求。他说,当多个部门需求Hadoop集群服务,并且需求各不相同时,需要建设自助服务平台来解决此类问题。VMware推出的VCAC产品,可弹性伸缩处理各部门的集群使用需求,并且减少IT管理人员处理压力。
亚信科技大数据事业部数据资产管理部门产品总监 高伟
亚信科技大数据事业部数据资产管理部门产品总监高伟,与现场参会者分享了主题为“数据资产管理——大数据时代的掘金术 ”。数据资产管理是企业或组织采取的各种管理活动,用以保证数据资产的安全完整,合理配置和有效利用,从而提高带来的经济效益,保障和促进各项事业发展。高伟表示尽管“数据是资产”概念已经广为人知,但“如何管理数据资产”仍然缺少成熟理论以及工具手段,存在市场空白。
传统数据管理方式不适合数据资产管理要求,亚信提倡建立一体化全流程的数据资产管理体系,具有以下关键特性:完善的数据治理与管控,高效的数据资产应用,以及创新的数据资产运营。最后,高伟总结道,数据资产管理已达到与CRM相同的高度,并呼吁数据资产管理技术人员,要考虑如何将技术与业务及商业相结合。
阿里巴巴数据平台事业部ODPS技术专家 徐冬
阿里巴巴数据平台事业部ODPS技术专家徐冬,分享了主题为“ODPS MapReduce 对外开放实践 ”。演讲中,徐冬主要谈到ODPS(Open Data Process System)在阿里云巴巴的使用情况;在ODPS上搭建LOT模型;MapReduce实现过程;MapReduce API介绍以及MapReduce API开放用户实践。ODPS作为阿里大规模数据处理的底层平台,每日提交数十万计任务,底层是跨数据中心的超大规模集群,支持多种编程模型、范式。
其中,徐冬提到MapReduce API在两个方面进行了调整,包括:取消对MapReduce自定义类型支持、希望将MapReduce API做成类似Hadoop。最后,他表示MapReduce作为开放服务,明年年初将会对用户开放。
携程资深软件工程师 廖晓格
携程资深软件工程师廖晓格,分享了主题为“让大数据更实时和可视化”。廖晓格主要介绍了携程大数据平台架构,HBase在携程的应用,携程产品的生态介绍,以及未来的挑战。
携程每天的日志量40T,总条数上千亿条,每天用户行为数据30T,并且业务数据飞速增长,所有数据都需要及时反馈给用户,应用或监控。携程大数据平台架构与Hadoop生态环境类似,底层使用HDFS,上面是调度系统,并且通过MapReduce、Spark做离线数据分析,Storm和HBase做在线数据分析。其中HBase是按业务划分,底层构建HBase门禁系统。携程还构建了一套Mobile监控系统和UBT(User Behavior Tracking)系统,用来跟踪用户行为和用户流量,并形成直观的可视化图像。
品友互动数据架构师 廖海仁
品友互动数据架构师廖海仁,带来了名为“DSP 基于数据的实时竞价优化”的主题演讲。首先,他首先介绍DSP优化中的五个特征:
随后,廖海仁重点介绍DSP优化过程中重要问题:第一,Ranking,搜索广告,每个广告有不同的KPI;第二,sample Selection bias,解决问题前需要进行CTR预估;第三,mobile optimization,mobile优化与PC有很大的差别,需要单独解决。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18小陈是某电商平台的数据分析师。老板交给他一个任务:“我们平台的注册用户已经突破1000万了,想了解一下用户的平均月消费金额。 ...
2026-05-18【专访摘要】本次CDA持证专访邀请到拥有丰富物流供应链数据分析经验的赖尧,他结合自身在京东、华莱士、兰格赛等企业的从业经历 ...
2026-05-15在数字化时代,企业的每一次业务优化、每一项技术迭代,都需要回答一个核心问题:这个动作到底能带来多少价值?是提升了用户转化 ...
2026-05-15在数据仓库建设中,事实表与维度表是两大核心组件,二者相互关联、缺一不可,共同构成数据仓库的基础架构。事实表聚焦“发生了什 ...
2026-05-15 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-05-15【核心关键词】互联网、机会、运营、关键词、账户、数字化、后台、客户、成本、网络、数据分析、底层逻辑、市场推广、数据反馈 ...
2026-05-14在Python数据分析中,Pandas作为核心工具库,凭借简洁高效的数据处理能力,成为数据分析从业者的必备技能。其中,基于两列(或多 ...
2026-05-14 很多人把统计学理解为“一堆公式和计算”,却忽略了它的本质——一门让数据“开口说话”的科学。真正的数据分析高手,不是会 ...
2026-05-14在零售行业存量竞争日趋激烈的当下,客户流失已成为侵蚀企业利润的“隐形杀手”——据行业数据显示,零售企业平均客户流失率高达 ...
2026-05-13