京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据分析提升实时营销竞争力
数据集成、列式数据库解决方案能够让营销代理机构处理数百太字节,对消费者进行360度的全方位评估。
Merkle是一家领先的客户关系营销代理机构,目前拥有1600名员工,年营收额超过3亿美元。戴尔、Geico、DirecTV和Chase等知名厂商都是Merkle的客户。由于Merkle通过ParAccel的大数据分析平台对消费者进行360度的全方位评估,因此该公司的客户能够展开实时营销活动,并且能够更高效、更精准地调整这些活动。
在收集客户信息,然后再针对营销目标提供“数据即服务”(data as a service)方面,Merkle有着丰富的经验。以往Merkle会每月批量处理这些海量数据。为了从营销数据库公司向客户关系营销公司转型,Merkle需要调整和整合大数据来源。IP地址、Cookies和电子邮件等数字化消费者信息必须与其姓名、住址和电话号码等传统的离线信息结合在一起。最终,客户需要更深层次的营销互动,例如针对特定消费者的电子邮件和横幅广告。
实现实时性
为了实现这些目标,Merkle需要具备整合所有互动活动,以及能够对每名消费者的行为进行360度全方位评估的能力,同时将每月批量处理这些海量数据的模式调整为近实时处理的模式。为了具备这一能力,Merkle创建了专门用于大数据分析的数据仓库,其中一些部署在客户那里,另一些则由Merkle托管。
在选择适宜的技术方面,Merkle面临的挑战包括大数据分析环境的成本、可预测的高性能和扩展性,以及目前分析解决方案无法满足的特殊需求。最终,Merkle为其大规模并行处理(MPP)列式分析数据库选择了ParAccel分析平台。Merkel的技术副总裁Peter Rogers说:“Merkle选择ParAccel的原因是,因为它拥有优异的执行速度和性价比。”
为了实时分析结构化的大数据,MPP列式分析数据库成为一个普遍的选择。列式存储指关系型数据库将数据以列的方式进行存储,而不是以行的方式进行存储。这样做的优点是获得了更快的查询速度。此外,数据经过压缩后可以进一步地提升查询效率。与此同时,由于MPP的特性使然,用户可只需简单地添加一些商用硬件即可对MPP进行线性扩展。
掘金大数据
经济上的可承担性也是Merkle做出这一选择的重要原因。ParAccel分析平台处理每太数据的价格约为4500美元,这一价格远远低于其他竞争者所给出的价格。成本优势让存储和分析数据具有更大的成本可负担性。自从迁移到ParAccel平台后,Merkle的数据处理量提升了三倍。此外,ParAccel平台还具有更大的容量和500多个先进易用的分析功能。这使得Merkle能够为他们的客户提供更具竞争力的解决方案。
Merkle的一个特殊需求是使用已有的T-SQL技能。T-SQL为微软SQL Server所使用的查询语言。Merkel此前已经广泛使用了微软SQL Server,他们希望公司的数据管理员经过最低限度的培训就能够使用ParAccel平台。ParAccel的专业服务提供了一个T-SQL解析器,开发人员可以用T-SQL编程,然后再将编好的程序翻译成能够在ParAccel平台上高效运行的SQL语言。
在前端,Merkle使用MicroStrategy实现虚拟化和商业智能。数据集成方面,Merkle使用原生的ParAccel工具加载数据。这样一来,所有的转换都能在ParAccel上执行。
目前,Merkel已经部署了五个ParAccel集群,这些集群维护着总计50太压缩数据(相当于200太的原始数据)。Merkel每天根据用户需求处理1至250GB的原始数据。这些客户对Merkel的服务非常满意,这要归功于基于实时互动的360度全方位消费者综合评估。此外,大数据分析还让这些客户能够展开更加精准和有效的营销活动。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21