
文:常国珍 CDA金牌讲师
大数据是什么,还没有人能说得清,这很好,说明这大有搞头。既然没有人可以给出明确的定义,那不妨认为是“社会化”的数据。在说大数据的用处之前,首先让我们回顾一下自己。
我们真的知道自己吗?就拿我来说吧。我心目中的我是一个年富力强、神采奕奕、思维敏捷的人,自我感觉良好,但是当我看到镜子中的自己时,我无非是一个黑着眼圈、身形颓废的男人。这是我会提醒自己,该洗洗睡了。这就是“镜中自己”,镜中自己是一个被外界认可的“自己”。一个人之所以为人,就是体现在外部环境和社会对其定义。老马不是也说人是社会关系的集合嘛。作为个人,父母眼中我可能是一个孝顺或不孝顺的儿子;在老婆心里,我可能是顾家或不顾家的丈夫;在领导心目中,我可能是能干或平庸的员工。这些所有身边人的看法反映了“我是谁”,知道了“我自己”,才知道如何去行事。作为一家企业,也需要时时了解客户、供应商、竞争者、员工、政府和其他利益相关者对其评价。过去这种信息多来自专业的咨询机构,自然是花费不菲,因此只有资金实力雄厚的企业消费的起。大数据技术的运用大大降低了这类运用的成本。以下是两个大数据运用的例子。
某快餐专业咨询公司的张先生一直在为国际知名快餐连锁公司进行开店的前期咨询,获取可选地址的人流量数据一直是成本很高的事情。张先生参加了一次大数据的交流会,遇到了某手机地图APP的开发者小王,无意间聊到了这件事。小王说“这简单啊,您需要什么时间的,统计一份给你,有地名就行。”“那多少钱呢?”张先生一是欣喜,又担心价格过高。小王笑了笑“什么钱不钱,分分钟搞定的事”。
王总是某知名公关公司总监,一直致力于为客户提供差异化宣传服务。早上刚接到了某汽车品牌客户的投诉,原因是客户发现该公司一款运动品牌的广告居然出现在网络视频中的一个戏曲视频的片头。对方态度很不好“拜托,用心一点好吗,你觉得看这个视频的人会关系我们的品牌吗?我要求你们提供一份观看过我们公司广告的观众画像给我”。王总很为难“我们只能区分视频的类型,广告投放在戏曲视频上是我们的疏漏,但是要观众的情况,这办不到”。“是吗?前几天有一家新创业的公司说可以,我已经看到了实物演示,很不错。他们的项目预算只是你们的十分之一,你考虑一下吧”。
从上面的例子中,我们可以发现大数据运用解决了已有的一些实际问题,他更方便、更廉价。大数据就是用低成本的方式获取外部社会的信息,落脚在一个个具体的,细小的运用上。这让企业更了解自己的客户,明白他的诉求,对企业产品或服务的期望,甚至是建议。让企业了解供应商是否会出现问题,有没有摊上法律麻烦,是否会及时供货。让企业知道在政府和周围的民众心目中,该企业是什么形象。
大数据在实际中实实在在的为企业创利,比如移动通讯公司利用交友圈进行口碑营销,游戏公司根据客户行为信息设计更有吸引力的场景和道具,电商公司为每个上网的人推送个性化的广告。也为企业度过难关出力,比如“丰田门”事件中,该公司及时获取社会舆论,制定应急策略。其实大数据本身只是生产对象,本身没有价值,只有我们加工之后才有价值。这需要与一些旧的运用进行一些结合。
在大数据时代其实让然需要处理小数据的能力。笔者在大数据公司有过从业经历,发现真正的落地项目是有具体需求的,和用户实际业务结合的,而且由有过以往小数据分析从业经验的人主导是项目成功的关键。不能想想一个没有业务经验的人可以脱离需求开发出一个划时代的数据产品。这也是为什么最近互联网巨头在拼抢传统行业的专家、咨询顾问的原因。所以成为面向小数据的业务分析人员是在大数据时代成为成功从业者的前提。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23CDA 数据分析师:以指标为钥,解锁数据驱动价值 在数字化转型的浪潮中,“用数据说话” 已成为企业决策的共识。但数据本身是零散 ...
2025-09-23当 “算法” 成为数据科学、人工智能、业务决策领域的高频词时,一种隐形的认知误区正悄然蔓延 —— 有人将分析结果不佳归咎于 ...
2025-09-22在数据分析、金融计算、工程评估等领域,“平均数” 是描述数据集中趋势最常用的工具之一。但多数人提及 “平均数” 时,默认指 ...
2025-09-22CDA 数据分析师:参数估计助力数据决策的核心力量 在数字化浪潮席卷各行各业的当下,数据已成为驱动业务增长、优化运营效率的核 ...
2025-09-22训练与验证损失骤升:机器学习训练中的异常诊断与解决方案 在机器学习模型训练过程中,“损失曲线” 是反映模型学习状态的核心指 ...
2025-09-19解析 DataHub 与 Kafka:数据生态中两类核心工具的差异与协同 在数字化转型加速的今天,企业对数据的需求已从 “存储” 转向 “ ...
2025-09-19