
大数据把握变迁可以预测未来
大数据是什么,有什么特点。我们看到大数据有四个特征:容量大、增长速度快、类别多、价值密度低。
具体来讲,互联网每天产生大量的互联网行为数据,这些大量的数据,从类别上看有结构性数据,非结构性数据。然后我们在谈大数据的时候很少注意到价值密度低。大数据不是万能的,怎样提炼,提炼纯度有多高,是50%,还是70%、或者是99%,这些因素都很重要。所以大数据只是原材料,这是对大数据基本的定义。
我们未来的发展可能就是数据时代的到来。大数据的未来,关系到是下一代互联网的基本生态,是下一代创新体系,以及下一代制造业的形态、下一代社会治理结构等等方面都跟大数据密切相关。这里面对于在国家的层面就特别重视,新华社9月5号的时候,报道李克强总理签批国务院印发了《促进大数据发展的行动纲要》。纲要强调要紧扣全面建成社会目标,科学编制十三五大数据的纲要。
11月17号,中共中央政治局常委、国务院总理李克强,组织召开了十三五的促进大数据发展行动纲要。这一块里面就越来越落到实处,大数据行为已经是国家层面的战略。
具体汽车行业而言,我们可以从宏观和微观两个层面分享下之前腾讯汽车和北京师范大学传播效果实验室一起推出的腾讯汽车指数,从2012年到2014年的时候,北京师范大学传播效果实验室帮助腾讯汽车做了腾讯汽车指数。 我们用了计划行为理论模型(TPP),TPP理论模型在管理学里面是研究互联网产生行为的预测比较好的理论模型。指数可以在宏观上预测整个汽车行业的变化,趋势是怎么样的,每个月会提交一份整个大盘的走势,就像我们上证指数或深指的预测;第二,可以看出细分市场变化,比如小型车、中型车或豪华车每个月的市场变化;第三,指数可以关注国别细分市场,比如德系车、日系车、韩系车、美系车是怎么迁移的。车主二次购车时怎么转移,车主置换的转移对车企和经销商是极其重要的领域。比如德系车主有多大比例的人群会保留在德系阵营,还有多少人转移到自主品牌,还有多少人转移到日系车等等,我们都做了一系列的分析,这是在宏观上可以来把握整个汽车行业的变化。
在微观的层面,大数据能够帮助我们把握具体汽车企业、车型和车款的市场状况。具体在宏观里面,我们有很多的预测数据,都知道宏观经济学是只要有数据,含量不是特别高。宏观产业的数据,只要是一个人,简单的百分比和趋势谁都可以说。宏观经济学其实门槛是很低的。我们对于汽车企业宏观层面的分析也是很容易做的,只要有上牌数量、消费数量就可以预测。
但是关键的核心是微观的,每个月车型、每一个车款的市场竞争是怎么样的,有什么短板,该怎么去竞争,这一块是非常具体的,也是考验我们水平的。细分到区域市场,在不同区域是怎么样的也可以来解决。每个省的重点区域是怎么样,还有一个是具体的品牌,或者说具体的车款。现在保有车主是市场竞争非常重要的方面,我这个品牌、这个车型现在保有车主会不会流行,有多大的维持率,70%还是60%?我们能够维持到50%就不错了。
那么流到什么地方去了?比如说A品牌车主流失了17.7%到B品牌的时候,是什么人流失的。17.7%怎么追回来,他们接触的是什么媒体,他们的评论是什么样的,哪些是负面的。他们在评论的时候,哪些是负面的评论,我们怎么样去改进,怎么把改进信息传递给他们来改变态度和关紧,这都是很精确化的营销。
大数据最核心的分析的数据对象本身有市场意义和市场价值。不像样本数据,样本数据本身是必须做推动才能产生意义。大数据里面,本身分析的数据就有市场的价值和市场的意义,所以把这些数据反复分析,也可以深入分析下去,可以照准消费者怎么样变迁。
最后谈谈大数据最大的特点,它是实时动态的资源。什么叫实时动态?比如说我们产生一个数据报告,要产数据,然后形成报告。但是汽车市场的变化是很快的,不停的有新车在发布,不停地在产生新的变量在冲击市场。而我们用互联网大数据的时候,就是源源不断地在告诉我们新的变量在加入的时候,对于我们会有什么的冲击,对于我们会有什么样的影响,所以是一种实时动态的资源。这种动态资源是可以随时把握变迁是怎么样的,及时地做出我们的决策,这是我们在市场竞争里面非常重要的一点。
消费者的行为、态度、认证正在发生变迁,我们该怎么样来预测。预测比事后治病更重要,这是大数据里面相对一般的报告而言非常重要的特质,就是在没有发作的、正在发作的时候能够把握病脉。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23