
关于数据挖掘和数据分析
1、很多关于数据挖掘的帖子和文章都在强调工具、算法和架构等,但其实这些都不是数据挖掘的核心,数据挖掘的最重要的环节如下:
数据来源:通过无论是公开的数据还是合作方式、第三方的方式获得数据;
获取标签:对标的物无论是用户、商品、文章分析,以获取足够定义这些标的物的标签,并对标签进行指标化和定义权重,通过这些标签对;
定义特征:通过标的物的个体画像以及标的物间的关系定义个体和整体的特征;
评估模型:通过定义的特征定义并评估一系列数据模型;
应用模型:模型数据可视化、基于有效模型数据价值应用。
2、为什么把数据挖掘和数据分析放在一起说,是因为数据挖掘本身是一个数据应用化的过程,而应用化的过程某种意义上就是一个数据分析的过程,而这个数据分析可以是人为定义的、AI人工智能辅助的等等。
所以,我们可以暂且这样定数据挖掘和数据分析的关系:通过不断优化的数据分析方法,并利用数据挖掘才能够得出数据应用价值的最大化的结果。
数据挖掘是数据价值结果导向的过程集合,而数据应用价值到底有多大?者就是通过数据分析来评估的,其来自于数据分析的过程以及得出的结论。
3、数据挖掘并不局限。就狭义而言,它就是一个在海量数据中挖掘数据价值的过程;而就广义而言,只要是有数据来源的,并能够通过数据分析方法论得到一数据价值结果为导向的过程,都可以称作数据挖掘。
4、产品运营经常会涉及到数据分析,从某种意义上而言,也是一个以数据价值为结果导向的过程:
数据来源:产品运营过程中的产生和收集的一系列数据,如图:
获取标签:通过基本信息和一系列行为数据获取分析得到关键标签,并定义标签的权重和指标,以对基本用户、商品、文章等等标的物进行画像;
定义特征:通过标的物个体的统计数据和画像分析个体间关系的特征和整体性特征,比如电商类用户就可以根据性别和消费能力、消费周期等标签指标,定义其相应的特征;再比如对UV、PV等一系列数据进行整体性的特征判断,以判断产品本身目前的运营特征和情况;等等...
评估模型:通过提取的特征,定义一系列的可用模型,使得从数据来源到标签再到特征以及画像的数据通过模型更直观的展现出来;
应用模型:比如招聘网站按照不同职能区分的用户对于网站的使用情况,产品对于90后用户的运营情况等,以在某种程度上帮助改进产品和提升以及验证运营工作对于目前产品运营的有效性。
5、举个商业化应用的例子,比如EverString这个产品,去年年底刚刚融了B轮65m美刀。这是一家通过大数据技术提供B2B Marketing领域企业智能解决方案的公司,通过挖掘企业数据与结合企业CRM,并建立模型,再利用这些模型帮助企业来预测谁是他们下一个客户。以下是对于这家公司业务的分析:
数据来源:通过爬虫来抓取全网数据并结合企业CRM获取与企业相关的数据,EverString自称有1100万家企业的海量数据库;
获取标签:它们拥有丰富的公司标签,以及合理的指标与权重;
定义特征:与公司业务和规模相关的特征,更加个性化并增加精准性;
评估模型:定义无论是公司层面的营销运营模型,还是基于公司业务本身的数据模型,以关注数据应用价值和更加符合业务应用价值效果的数据模型;
应用模型:将模型应用在整体的业务流程当中,比如通过对历史大量积累的数据进行分析和建模,从而对未来事件的决策的预测。
6、关于数据分析,并不可以简单理解为对于对于数据进行定量、定性的分析和得出一个可用的数据结果的过程集合,这也是我为什么把数据挖掘和数据分析放在一起说的原因。数据分析一定是伴随着数据从采集到定义,再到应用,最后通过分析数据应用的价值,并不断自我过程优化。
从某种意义上而言,数据分析会用到的很多工具。我们会发现无论是用GA、百度统计、友盟等等,它们同样在做着:从采集数据、获取标签(机型、地理位置、用户画像等)、定义特征(转换率、客单价等)和模型(漏斗模型等)到应用模型(可视化图表等)。这个过程同样可以理解为一个数据分析方法结合数据挖掘的过程,即对可获取的数据进行价值挖掘和应用的过程。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“纲举目张,执本末从。”若想在数据分析领域有所收获,一套合适的学习教材至关重要。一套优质且契合需求的学习教材无疑是那关键 ...
2025-06-092025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27