京公网安备 11010802034615号
经营许可证编号:京B2-20210330
实现挖掘大数据价值的三大因素_数据分析师培训
很多公司都在探索如何挖掘大数据的价值,但有一类公司不得不擅长做这项工作,那就是:数据分析提供商。这些公司的商业模式决定了其必须能够有效、持续地提供客户愿意买单的数据产品和服务。
下面将分享一家伟大的数据分析提供商- ComScore,如何通过3个关键因素(一个便捷、可扩展的平台,一支深悟数据分析的员工团队,以及对客户的深刻理解)来实现对大数据价值的挖掘。
1个便捷、可扩展的数据平台
ComScore提供服务的基础是14个PB的多种来源在线数据,这些数据实时地从全球范围收集,这就是公司现在称之为大数据的东西。
数据的来源有4个主要渠道。第一个来源是样本库数据,来自200万个互联网用户,美国境内和境外用户各有100万人。样本库成员允许ComScore秘密地采集用户行为和人口特征。人口调查数据是第二个来源,从获准安放在大约90%的美国数字媒体机构百强公司里面的传感器获得数据。第三个数据来源是采用专属调查的方式,从样本库成员获得的认知数据。第四个来源是从战略合作伙伴获得的数据。比如,ComScore采用会员卡店内购买数据,来帮助客户将在线广告活动与线下商店购买行为紧密结合在一起。
在上世纪90年代后期,可管理ComScore数据工厂的主流商业技术解决方案还没有出现。ComScore就开发了一个高效、获专利保护的技术平台来存储和管理大数据。
到2013年,技术团队已经将平台从一个专有的解决方案进化为一种面向服务的架构,支持在MapR的Hadoop和Pivotal Greenplum数据库上运行的3个关键系统,每个系统都有独立的工作任务和扩展需求。ComScore需要不间断地呆在平台的顶端,在过去的12个月里,数据量大约增长了80%。
一支深悟数据分析的员工团队
ComScore依赖它出众的员工来掌握大数据的艺术和科学。它已经成长为一支1200人的全球团队,每个人都拥有不同水平的"数据科学家"能力。为了跟上公司成长步伐而选择和开发这些员工,公司领导实施了许多人才管理战略。
其中一项战略是:首先从大学的商学院和数学专业招聘分析人才,并给她(他)们提供更多的分析培训。ComScore有一个正在进行的公司内部范围培训项目-ComS core大学,大部分员工都参加。
另一项实践是旨在培养一支领域广泛、深悟数据分析的工作团队,根据员工的不同技能水平在整个公司成立不同的小组,但与此同时,员工必须具备足以确保这些小组能顺利沟通的基本技能。而这些需要沟通的团队通常都在同一个地方办公。
公司领导层还利用矩阵式组织架构,将具备不同技能组合的人才结合在一起。比如,ComScore同时运行了好几个并列的团队,每支团队都有一个商业产品经理来理解产品的开发路线图,以及分析师们来监控数据质量和分析方法论。这种方式被认为对产品开发流程尤为重要。
对客户的深刻理解获得行动的洞察力
ComScore每天发布大约15万份在线报告。其中的挑战在于如何传播优秀的报告,让客户不仅能获取洞察力,而且还能将这种洞察力与工作任务紧密结合。当客户将所获得的洞察力付诸行动时,比如改变一次广告活动的策略或定位一个新的细分客户群,她们可以从ComScore的产品和服务中取得价值。但是作为一个数据分析提供商,ComScore对于客户使用数据的方式缺乏控制力。
ComScore能够控制的是它自己对客户需求的理解。该公司致力于在专业知识领域深度挖掘,并理解其客户想要解决的难题。具备了这些知识之后,ComScore就使大数据变得"可消费",并且可以积极主动地帮助客户识别哪些是可付诸行动的洞察力。不得不承认,数据可以在短时间内压倒一切,激励客户聚焦于解决一些关键问题,然后反复适用。
ComScore给它的客户提供拥有图形界面、整合可视化和图表呈现的软件工具;通过向导和模板报告的大量使用来支持客户的自助服务;当需要即时决策时,通过控制面板提供数据的实时访问;以及创建知识门户来支持知识的分享。更进一步,公司还专门成立了一个组织单位,来为其产品和服务的可消费性提供支持。
(图为,ComScore的典型客户)
一切都归于数据
在大数据的空间领域,必须不断地适应才能跟上其迅猛发展。
多年以前,ComScore还仅仅期望测量挂有客户广告的网页的访问者数量;今天,它则必须报告这个广告是否被真正看过。在早期,公司客户对非美国数据还没有多大兴趣;全球化的发展催生了对ComScore覆盖全球数据的市场需求。
此外,ComScore还需要对技术相关的变化保持跟进。比如,客户可能会需要分析类似来自视频和智能手机的数据流这样的突发性数据类型。另一个重要的变化例子是,使用大量不同设备访问在线内容的用户数在持续增长。这样,公司客户就需要能识别跨多个设备的独立用户。
ComScore的平台、人才和深刻客户理解赋予公司足够的能量,来应对大数据产业环境的风云变幻。其便捷、可扩展的数据平台使得ComScore能够适应数据量的迅速增长,并获取新的数据类型。交叉组合的团队和技能,与拥有深厚分析技能的工作团队相结合,使它能够顺畅地适应需求的变化。对客户使用分析工具的良好培训,允许公司能够预期未来发展趋势,并据此调整其产品和服务。CISR(MIT信息系统研究中心)相信,对借助大数据发展自己感兴趣的公司可以考虑采用ComScore的方法,以获取良好的服务。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22