京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据技术论坛(下):大数据时代的掘金术
2014年12月12-14日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中科院计算所与CSDN共同协办,以推进大数据科研、应用与产业发展为主旨的2014中国大数据技术大会(Big Data Technology Conference 2014,BDTC 2014)暨第二届CCF大数据学术会议在北京新云南皇冠假日酒店盛大开幕。
用友软件高级工程师 白小勇
2014中国大数据技术大会第二日上午的大数据技术论坛,用友软件高级工程师白小勇主持了下午的论坛。前通联数据首席战略官龙白滔、VMware高级产品线经理董波、亚信科技大数据事业部数据资产管理部门产品总监高伟、阿里巴巴数据平台事业部ODPS技术专家徐冬、携程资深软件工程师廖晓格、品友互动数据架构师廖海仁六位专家主要就大数据技术的相关问题展开了演讲。
前通联数据首席战略官 龙白滔
前通联数据首席战略官龙白滔,带来了名为“金融投资大数据实践分享”的主题演讲。龙白滔从金融大数据和传统大数据的区别;金融数据的生产过程;金融大数据的存储;金融大数据的分析和挖掘;分析在线交互式金融编程分析研究平台五个方面对金融大数据实践进行分享。
金融大数据和消费互联网大数据的区别体现在以下几个方面:
其中,他表示时间序列数据是未来最重要的数据类型,所以掌握时间序列数据的存储、处理以及关键算法是十分重要的。比如KDB是传统金融机构的标配,Cassandra在国外的物联网和能源领域已经得到了比较成功的应用。随后,龙白滔还介绍了如何把结构化、标准化数据形成有意义的金融行业数据。龙白滔还提到相比国外,国内对前言技术的掌握和应用还差得比较远。
VMware高级产品线经理 董波
VMware高级产品线经理董波,向大家分享了“VMware为大数据应用铺平道路 ”主题演讲。企业对大数据的应用通常要经历三个阶段:概念验证阶段,快速低成本的验证大数据技术带来的价值;生产应用阶段,满足应用SLA,满足系统扩容需求;以及Hadoop即服务阶段,快速敏捷高效的满足各个业务的差异化需求。
vSphere Big Data Extension能够帮你快速简便部署,让你全力关注业务,并且BDE可与第三方管理工具无缝集成。vRealize Operations Manager,能够实现系统全面监控,智能自动分析管理,基于预测主动运维。vSpherevMotion能够消除计划或非计划宕机时间,检测失效自动恢复。
董波在演讲中还提到,运用Hadoop集群管理平台,可平衡处理企业中各部门集群使用需求。他说,当多个部门需求Hadoop集群服务,并且需求各不相同时,需要建设自助服务平台来解决此类问题。VMware推出的VCAC产品,可弹性伸缩处理各部门的集群使用需求,并且减少IT管理人员处理压力。
亚信科技大数据事业部数据资产管理部门产品总监 高伟
亚信科技大数据事业部数据资产管理部门产品总监高伟,与现场参会者分享了主题为“数据资产管理——大数据时代的掘金术 ”。数据资产管理是企业或组织采取的各种管理活动,用以保证数据资产的安全完整,合理配置和有效利用,从而提高带来的经济效益,保障和促进各项事业发展。高伟表示尽管“数据是资产”概念已经广为人知,但“如何管理数据资产”仍然缺少成熟理论以及工具手段,存在市场空白。
传统数据管理方式不适合数据资产管理要求,亚信提倡建立一体化全流程的数据资产管理体系,具有以下关键特性:完善的数据治理与管控,高效的数据资产应用,以及创新的数据资产运营。最后,高伟总结道,数据资产管理已达到与CRM相同的高度,并呼吁数据资产管理技术人员,要考虑如何将技术与业务及商业相结合。
阿里巴巴数据平台事业部ODPS技术专家 徐冬
阿里巴巴数据平台事业部ODPS技术专家徐冬,分享了主题为“ODPS MapReduce 对外开放实践 ”。演讲中,徐冬主要谈到ODPS(Open Data Process System)在阿里云巴巴的使用情况;在ODPS上搭建LOT模型;MapReduce实现过程;MapReduce API介绍以及MapReduce API开放用户实践。ODPS作为阿里大规模数据处理的底层平台,每日提交数十万计任务,底层是跨数据中心的超大规模集群,支持多种编程模型、范式。
其中,徐冬提到MapReduce API在两个方面进行了调整,包括:取消对MapReduce自定义类型支持、希望将MapReduce API做成类似Hadoop。最后,他表示MapReduce作为开放服务,明年年初将会对用户开放。
携程资深软件工程师 廖晓格
携程资深软件工程师廖晓格,分享了主题为“让大数据更实时和可视化”。廖晓格主要介绍了携程大数据平台架构,HBase在携程的应用,携程产品的生态介绍,以及未来的挑战。
携程每天的日志量40T,总条数上千亿条,每天用户行为数据30T,并且业务数据飞速增长,所有数据都需要及时反馈给用户,应用或监控。携程大数据平台架构与Hadoop生态环境类似,底层使用HDFS,上面是调度系统,并且通过MapReduce、Spark做离线数据分析,Storm和HBase做在线数据分析。其中HBase是按业务划分,底层构建HBase门禁系统。携程还构建了一套Mobile监控系统和UBT(User Behavior Tracking)系统,用来跟踪用户行为和用户流量,并形成直观的可视化图像。
品友互动数据架构师 廖海仁
品友互动数据架构师廖海仁,带来了名为“DSP 基于数据的实时竞价优化”的主题演讲。首先,他首先介绍DSP优化中的五个特征:
随后,廖海仁重点介绍DSP优化过程中重要问题:第一,Ranking,搜索广告,每个广告有不同的KPI;第二,sample Selection bias,解决问题前需要进行CTR预估;第三,mobile optimization,mobile优化与PC有很大的差别,需要单独解决。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在金融行业的数字化转型进程中,SQL作为数据处理与分析的核心工具,贯穿于零售银行、证券交易、保险理赔、支付结算等全业务链条 ...
2025-12-24在数据分析领域,假设检验是验证“数据差异是否显著”的核心工具,而独立样本t检验与卡方检验则是其中最常用的两种方法。很多初 ...
2025-12-24在企业数字化转型的深水区,数据已成为核心生产要素,而“让数据可用、好用”则是挖掘数据价值的前提。对CDA(Certified Data An ...
2025-12-24数据分析师认证考试全面升级后,除了考试场次和报名时间,小伙伴们最关心的就是报名费了,报 ...
2025-12-23CDA中国官网是全国统一的数据分析师认证报名网站,由认证考试委员会与持证人会员、企业会员以及行业知名第三方机构共同合作,致 ...
2025-12-23在Power BI数据可视化分析中,矩阵是多维度数据汇总的核心工具,而“动态计算平均值”则是矩阵分析的高频需求——无论是按类别计 ...
2025-12-23在SQL数据分析场景中,“日期转期间”是高频核心需求——无论是按日、周、月、季度还是年度统计数据,都需要将原始的日期/时间字 ...
2025-12-23在数据驱动决策的浪潮中,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越“整理数据、输出报表”的基础层面,转 ...
2025-12-23在使用Excel数据透视表进行数据分析时,我们常需要在透视表旁添加备注列,用于标注数据背景、异常说明、业务解读等关键信息。但 ...
2025-12-22在MySQL数据库的性能优化体系中,索引是提升查询效率的“核心武器”——一个合理的索引能将百万级数据的查询耗时从秒级压缩至毫 ...
2025-12-22在数据量爆炸式增长的数字化时代,企业数据呈现“来源杂、格式多、价值不均”的特点,不少CDA(Certified Data Analyst)数据分 ...
2025-12-22在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17