
张溪梦:拿什么拯救你,疲于污水处理的数据分析师
大数据时代,数据成为企业决策最为重要的参考之一。尽管数据源的生成量正以几何倍数的速度增加,尽管各行各业都在标榜自己生产了多少有价值的数据,但究竟哪些数据可以为企业所用,如何基于高效的数据分析创造商业价值,仍是非常具有挑战性的话题。
对于以上问题,【WOT2015"互联网+"时代大数据技术峰会】特邀讲师、GrowingIO创始人张溪梦分别基于企业运营需求及技术发展角度进行了分析,下面就让我们一起学习,最新一代的数据分析技术将如何帮助企业最大限度发挥数据运营效率。
【WOT2015"互联网+"时代大数据技术峰会】特邀嘉宾 张溪梦
张溪梦,GrowingIO创始人、CEO,前LinkedIn分析部高级总监。美国Data Science Central评选其为"世界前十位前沿数据科学家",前LinkedIn美国商业分析部高级总监,亲手建立了LinkedIn将近90人商业数据分析和数据科学团队,支撑了LinkedIn公司所有与营收相关业务的高速增长。 2015年5月,创立新一代网站和移动端数据分析平台GrowingIO,创始团队来自LinkedIn 、eBay 、Coursera、亚信等国内外顶级互联网及数据公司,具有强大的商业分析、数据产品、企业软件研发以及机器学习等专业背景、先进的数据分析技术和丰富的实战经验。
数据分析创造商业价值
现在,几乎再没有人会质疑数据驱动对于企业运营和商业价值的重要性,工业4.0都将大数据的存储、剖析、安全保障和数据价值的呈现和利用,列为未来三大核心诉求之一。
为什么数据化运营如此重要?因为基于证据的决策更可靠。依照数据分析得到的结论,企业可以快速发现问题、判断趋势、有效行动,从而指导公司未来的发展方向。
张溪梦认为,企业中的每一位员工都应该参与到数据化运营的工作中来。数据可以直观的将一些原本无形的标准进行量化,从而帮助员工发现自己的工作与业务结果之间的联系,有针对性的开展工作。
可让这个想法落地并不简单,因为这不仅仅是收集收据、定期查看而已。培养专业人才、在更短的时间内处理更多的数据、保证处理数据的质量和性能、让合适的人员使用合适的工具……有太多太多困难都在拖慢企业数据化运营的进程。
企业数据分析流程的90%耗费于初级阶段
互联网技术的发展为企业加速创新提供前所未有的机遇。在快速变化的商业格局下,企业是否有迅速做出决策的能力,成为影响未来生存和发展的关键。
然而现实往往是残酷而无奈的。张溪梦告诉我们:“去年美国某研究机构做过一份关于企业数据分析流程的调查,结果显示,仅仅是在数据收集阶段,就要花费5个星期的时间”。
造成这种局面的关键因素之一,是目前的大数据分析需要专业技术人员同时具备编程和数据分析两种能力。张溪梦将数据分析的流程形象地比喻为将一条被污染的河水变清的过程。我们收集的大量数据就像流入源头的污水,需要人力进行各种监控,然后放入一个池子里进行沉淀。之后则要开展各种清洗、聚合、再清洗、再消毒,再传输等庞大、繁杂的工作,这个过程占用了数据工程和分析师几乎90%的时间。企业急需更加先进的技术和更具指导性的方法论,来提升数据化运营的效率。
“自动化”是下一代数据分析技术的核心
要想突破目前企业数据分析中的瓶颈,关键要对现有的业务的数据分析流程进行大规模的简化,将人类的智慧集中到最能够创造商业价值的环节中。
张梦溪认为,取代今天这种功能化的数据分析的下一代数据分析技术,一定是基于以自动化为核心的一套框架。这需要企业对沉淀多年的传统技术框架进行革新。过去,为了应对基础设施在计算、存储等能力上的缺陷,往往需要将来源不同、类型不同的数据制成多维度的各种表格,来达到减少存储量的目的,这会大大拖慢企业数据处理效率。
对于未来数据分析技术趋势,张溪梦主要提到以下两个方面:
流式处理框架:这是企业实现数据自动化的核心技术。流处理的优势是可以任意数据格式进行转换,实现近乎实时的数据处理能力。
数据分析云化:云计算技术为企业IT的基础设施带来革命性的力量。将数据分析做成云端的SaaS服务后,开发人员将不再需要维护大量系统和工作流。最重要的一点,我们大幅度的降低数据分析埋点才可以详细地收集用户数据的这个巨大的限制,只需要结合业务需求,进行简单的拖拽实现定制化的数据采集规则。
流处理和云两种技术的结合,会使数据像雨滴一样,慢慢聚集在云端的服务器里面开始积累,用户将不再需要做大量的IT的基础设施的工作,或者是做各种数据清洗、整合、线上、线下聚合。
张梦溪表示,“在未来分工化、协作化的格局下,企业应该将一些相对支持性的功能外包给真正的专家或者是产品,专注做好自己最擅长的事情,所以数据分析云端化这是一个必然的趋势。”
WOT峰会将分享如何用数据化运营创造商业价值
在11月28-29日由主办位于深圳的【“互联网+”时代大数据技术峰会】中,张溪梦将带来目前最先进的全自动化数据分析的相关技术和方法论,并与大家探讨何利用实时数据分析,帮助企业最大程度地创造商业价值。
采访最后,张溪梦描述了这样的愿景:“我希望现在的企业家们都能看到云端数据分析自动化的趋势,未来每一家企业和个人都可以做自己最擅长和关注的工作,一起来把这个世界构建的更美好。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29