京公网安备 11010802034615号
经营许可证编号:京B2-20210330
《ibm spss modeler数据与文本挖掘实战》_数据分析师书籍推荐
《ibm spss modeler数据与文本挖掘实战》
图书简介:
本书主要包括两部分内容:在数据挖掘部分,重点介绍了各种数据挖掘方法的基本原理及应用,包括回归分析、时间序列分析、因子分析、决策树分析、判别分析、聚类分析、人工神经网络、贝叶斯网络以及社交网络分析等;在文本挖掘部分,重点介绍了文本挖掘的节点,以及具体的实现过程。每一章都详细介绍了数据和文本挖掘的基本原理和分析过程,同时在实例中也介绍了SPSS Modeler中大部分节点的使用方法及应用步骤。
本书与同类书籍相比,安排了较多的实例,使读者能够边学边练,在短时间内就可以有一个较大的提高,方便读者熟悉SPSS Modeler的基本操作,并通过系统的案例使读者掌握应用技巧。
本书对于高校理工学科、经济金融学科及数量分析方面的学生,以及数据挖掘和分析方面的研究人员和从业人员等,具有很强的可读性、可操作性与可使用性,尤其适合商业销售、经济管理、社会研究和人文教育等行业的相关人员阅读。
目录
第1部分数据挖掘篇
第1章数据挖掘概述 3
1.1什么是数据挖掘 3
1.1.1数据挖掘的定义 4
1.1.2数据挖掘的发展阶段 5
1.2与传统技术的比较 8
1.2.3数据挖掘和OLAP 9
1.2.4数据挖掘和Web挖掘 10
1.3常用的数据挖掘软件 11
1.3.1SAS EM 12
1.3.2SPSS Modeler 13
1.3.3Intelligent Miner 13
1.4应用实例:目标客户分析 15
1.4.1研究方法 15
1.4.2数据分析 15
1.4.3研究结论 26
第2章SPSS Modeler软件概述 27
2.1软件简介 27
2.1.1软件发展 28
2.1.2软件界面 30
2.1.3软件特点 35
2.1.4软件功能 37
2.1.5软件算法 39
2.1.6高级功能 41
2.1.7软件安装 42
2.2行业应用 50
2.2.1通信行业 50
2.2.2ZF行业 52
2.2.3金融行业 53
2.2.4制造行业 54
2.2.5医药行业 56
2.2.6教育科研 56
2.2.7市场调研 57
2.2.8连锁零售 57
2.3数据挖掘流程 58
2.3.1业务理解 58
2.3.2数据理解 59
2.3.3数据准备 60
2.3.4建立模型 61
2.3.5评估模型 61
2.3.6应用模型 62
2.4应用实例:药物效果研究 62
2.4.1研究方法 63
2.4.2数据分析 63
2.4.3研究结论 69
第3章SPSS Modeler基础操作 70
3.1数据输入 70
3.1.1数据库 71
3.1.2可变文件 73
3.1.3固定文件 75
3.1.4SAS文件 76
3.1.5Statistics文件 77
3.1.6Excel文件 77
3.2数据流操作 78
3.2.1生成数据流 78
3.2.2添加和删除节点 79
3.2.3连接数据流 79
3.2.4修改连接节点 80
3.2.5执行数据流 81
3.3图形制作 82
3.3.1散点图 82
3.3.2直方图 84
3.3.3网络图 85
3.3.4评估图 87
3.4应用实例:产品销售预测 88
3.4.1研究方法 88
3.4.2数据分析 88
3.4.3研究结论 99
第4章回归分析 100
4.1回归分析模型概述 100
4.1.1模型定义 101
4.1.2模型应用 102
4.1.3建模步骤 103
4.1.4注意事项 103
4.2应用实例:客户流失因素分析 104
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09