京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据挖掘与预测分析术语总结
数据挖掘目前在各类企业和机构中蓬勃发展。因此我们制作了一份此领域常见术语总结,希望你喜欢。
分析型客户关系管理(Analytical CRM/aCRM): 用于支持决策,改善公司跟顾客的互动或提高互动的价值。针对有关顾客的知识,和如何与顾客有效接触的知识,进行收集、分析、应用。参见>>>
大数据(Big Data): 大数据既是一个被滥用的流行语,也是一个当今社会的真实趋势。此术语指代总量与日俱增的数据,这些数据每天都在被捕获、处理、汇集、储存、分析。维基百科是这样描述“大数据”的:“数据集的总和如此庞大复杂,以至于现有的数据库管理工具难以处理(…)”。
商业智能(Business Intelligence): 分析数据、展示信息以帮助企业的执行者、管理层、其他人员进行更有根据的商业决策的应用、设施、工具、过程。
流失分析(Churn Analysis/Attrition Analysis): 描述哪些顾客可能停止使用公司的产品/业务,以及识别哪些顾客的流失会带来最大损失。流失分析的结果用于为可能要流失的顾客准备新的优惠。
联合分析/权衡分析(Conjoint Analysis/ Trade-off Analysis): 在消费者实际使用的基础上,比较同一产品/服务的几个不同变种。它能预测产品/服务上市后的接受度,用于产品线管理、定价等活动。
信用评分(Credit Scoring): 评估一个实体(公司或个人)的信用值。银行(借款人)以此判断借款者是否会还款。
配套销售/增值销售(Cross / Up selling): 一个营销概念。根据特定消费者的特征和过往行为,向其销售补充商品(配套销售)或附加商品(增值销售)。
顾客细分&画像(Customer Segmentation & Profiling): 根据现有的顾客数据,将特征、行为相似的顾客归类分组。描述和比较各组。
数据集市(Data Mart): 特定机构所储存的,关于一个特定主题或部门的数据,如销售、财务、营销数据。
数据仓库(Data Warehouse): 数据的中央存储库,采集、储存来自一个企业多个商业系统的数据。
数据质量(Data Quality): 有关确保数据可靠性和实用价值的过程和技术。高质量的数据应该忠实体现其背后的事务进程,并能满足在运营、决策、规划中的预期用途。
抽取-转换-加载 ETL (Extract-Transform-Load): 数据仓储中的一个过程。从一个来源获取数据,根据需求转换数据以便接下来使用,之后把数据放置在正确的目标数据库。
欺诈检测(Fraud Detection): 识别针对特定组织或公司的疑似欺诈式转账、订购、以及其他非法活动。在IT系统预先设计触发式警报,尝试或进行此类活动会出现警告。
Hadoop: 另一个当今大数据领域的热门。Apache Hadoop是一个在已有商业硬件组成的计算机集群上,分布式存储、处理庞大数据集的开源软件架构。它使得大规模数据储存和更快速数据处理成为可能。
物联网(Internet of Things, IoT): 广泛分布的网络,由诸多种类(个人、家庭、工业)诸多用途(医疗、休闲、媒体、购物、制造、环境调节)的电子设备组成。这些设备通过互联网交换数据,彼此协调活动。
顾客的生命周期价值 (Lifetime Value, LTV): 顾客在他/她的一生中为一个公司产生的预期折算利润。
机器学习(Machine Learning): 一个学科,研究从数据中自动学习,以便计算机能根据它们收到的反馈调整自身运行。与人工智能、数据挖掘、统计方法关系密切。
购物篮分析(Market Basket Analysis): 识别在交易中经常同时出现的商品组合或服务组合,例如经常被一起购买的产品。此类分析的结果被用于推荐附加商品,为陈列商品的决策提供依据等。
联机分析处理(On-Line Analytical Processing, OLAP): 能让用户轻松制作、浏览报告的工具,这些报告总结相关数据,并从多角度分析。
预测分析(Predictive Analytics): 从现存的数据集中提取信息以便识别模式、预测未来收益和趋势。在商业领域,预测模型及分析被用于分析当前数据和历史事实,以更好了解消费者、产品、合作伙伴,并为公司识别机遇和风险。
实时决策(Real Time Decisioning, RTD): 帮助企业做出实时(近乎无延迟)的最优销售/营销决策。比如,实时决策系统(打分系统)可以通过多种商业规则或模型,在顾客与公司互动的瞬间,对顾客进行评分和排名。
留存/顾客留存(Retention / Customer Retention): 指建立后能够长期维持的客户关系的百分比。
社交网络分析(Social Network Analysis, SNA): 描绘并测量人与人、组与组、机构与机构、电脑与电脑、URL与URL、以及其他种类相连的信息/知识实体之间的关系与流动。这些人或组是网络中的节点,而它们之间的连线表示关系或流动。SNA为分析人际关系提供了一种方法,既是数学的又是视觉的。
生存分析(Survival Analysis): 估测一名顾客继续使用某业务的时间,或在后续时段流失的可能性。此类信息能让企业判断所要预测时段的顾客留存,并引入合适的忠诚度政策。
文本挖掘(Text Mining): 对包含自然语言的数据的分析。对源数据中词语和短语进行统计计算,以便用数学术语表达文本结构,之后用传统数据挖掘技术分析文本结构。
非结构化数据(Unstructured Data):数据要么缺乏事先定义的数据模型,要么没按事先定义的规范进行组织。这个术语通常指那些不能放在传统的列式数据库中的信息,比如电子邮件信息、评论。
网络挖掘/网络数据挖掘(Web Mining / Web Data Mining) : 使用数据挖掘技术从互联网站点、文档或服务中自动发现和提取信息。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11