图书介绍
小白学数据挖掘与机器学习 SPSS Modeler案例篇【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

- 张浩彬著 著
- 出版社: 北京:电子工业出版社
- ISBN:9787121338434
- 出版时间:2018
- 标注页数:216页
- 文件大小:79MB
- 文件页数:234页
- 主题词:数据采集;机器学习
PDF下载
下载说明
小白学数据挖掘与机器学习 SPSS Modeler案例篇PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 数据挖掘那些事儿1
1.1当我们在谈数据挖掘时,其实在讨论什么2
1.2从CRISP-DM开启数据挖掘实践7
第2章 数据挖掘之利器:SPSS Modeler17
2.1 SPSS Modeler简介18
2.2 SPSS Modeler的下载与安装21
2.3 SPSS Modeler的主界面及基本操作23
2.3.1 SPSS Modeler主界面介绍23
2.3.2鼠标基本操作31
2.4将SPSS Modeler连接到服务器端31
第3章 巧妇难为无米之炊:数据,数据!34
3.1数据的身份35
3.1.1变量的测量级别35
3.1.2变量的角色36
3.2数据的读取37
3.2.1读取Excel文件数据37
3.2.2读取变量文件数据38
3.2.3读取SPSS Statistics(.sav)文件数据40
3.2.4读取数据库数据42
3.3数据的基本设定45
3.3.1变量角色的设定45
3.3.2字段的筛选及命名46
3.4数据的集成47
3.4.1数据的变量集成:合并节点47
3.4.2数据的记录集成:追加节点50
第4章 一点都不简单的描述性统计分析53
4.1分类变量的基本分析:“矩阵”节点54
4.2连续变量的基本分析:数据审核节点57
4.2.1连续变量基本分析指标介绍57
4.2.2“数据审核”节点63
第5章 何为足够大的差异:常用的统计检验67
5.1假设检验68
5.1.1假设检验的基本原理68
5.1.2假设检验的一般步骤69
5.2连续变量与分类变量之间的关系:t检验70
5.2.1两组独立样本均值比较71
5.2.2两组配对样本均值比较72
5.2.3使用t检验的前提条件73
5.2.4案例:使用均值比较分析电信客户的流失情况73
5.3两个连续变量之间的关系:相关分析75
5.3.1相关分析理论76
5.3.2案例:使用相关分析研究居民消费水平与国内生产总值的相关关系77
5.4两个分类变量之间的关系:卡方检验80
5.4.1卡方检验的原理80
5.4.2卡方检验的前提条件82
5.4.3案例:使用卡方检验研究两个分类字段之间的关系82
第6章 从身高和体重的关系谈起:回归分析84
6.1一元线性回归分析85
6.1.1分析因变量与自变量的关系,构建回归模型85
6.1.2估计模型系数,求解回归模型87
6.1.3对模型系数进行检验,确认模型有效性88
6.1.4拟合优度检验,判断模型解释能力89
6.1.5借助回归模型进行预测90
6.2多元线性回归分析90
6.2.1估计模型系数,求解回归模型91
6.2.2对模型参数进行检验,确认模型有效性92
6.2.3拟合优度检验,判断模型解释能力94
6.2.4模型的变量选择95
6.3使用线性回归分析的注意事项97
6.4案例:使用回归分析研究影响房屋价格的重要因素98
第7章 回归岂止这么简单:回归模型的进一步扩展102
7.1曲线回归103
7.2 Logistic回归110
7.2.1 Logistic回归理论110
7.2.2案例:使用Logistic回归模型分析个人收入水平影响因素112
第8章 模型评估那些事儿:过拟合与欠拟合117
8.1过拟合与欠拟合118
8.2留出法与交叉验证122
8.2.1留出法与分层抽样122
8.2.2交叉验证124
第9章 从看电影的思考到决策树的生成126
9.1决策树概述127
9.2决策树生成129
9.2.1从ID3算法到C5.0算法131
9.2.2 CART算法134
9.3决策树的剪枝136
9.3.1预剪枝策略137
9.3.2后剪枝策略137
9.3.3代价敏感学习138
9.4案例:用决策树分析客户违约情况140
9.5关于信息熵的扩展147
第10章 人工神经网络:从人脑神经元开始151
10.1从人脑神经元到人工神经网络152
10.2感知机154
10.3人工神经网络159
10.3.1隐藏层的作用159
10.3.2人工神经网络算法160
10.4案例:利用人工神经网络分析某电信运营商的客户流失情况164
第11章 物以类聚,人以群分:聚类分析172
11.1聚类思想的概述173
11.2聚类方法的关键:距离175
11.3 K-Means算法176
11.3.1 K-Means算法原理176
11.3.2轮廓系数(Silhouette coefficient)177
11.4案例:利用K-Means算法对不同型号汽车的属性进行聚类分群研究179
第12章 啤酒+尿布=关联分析?186
12.1一个关于关联分析的传说187
12.2关联分析的基本概念188
12.3关联规则的有效性指标190
12.4 Apriori算法192
12.4.1生成频繁项集193
12.4.2生成关联规则195
12.5案例:利用Apriori算法对顾客的个人信息及购买记录进行关联分析195
第13章 三个臭皮匠,赛过诸葛亮:集成学习算法199
13.1集成学习算法概述200
13.2 3种不同的集成学习算法201
13.2.1 Bagging算法201
13.2.2 Boosting算法203
13.2.3随机森林204
13.3集成学习算法实践205
13.3.1 Bagging算法和Boosting算法205
13.3.2随机森林211
13.3.3集成学习算法结果比较214
热门推荐
- 1784670.html
- 1949023.html
- 1423412.html
- 2346899.html
- 196853.html
- 1368702.html
- 2211198.html
- 1011598.html
- 2042021.html
- 972962.html
- http://www.ickdjs.cc/book_697762.html
- http://www.ickdjs.cc/book_852345.html
- http://www.ickdjs.cc/book_2577815.html
- http://www.ickdjs.cc/book_359873.html
- http://www.ickdjs.cc/book_1054156.html
- http://www.ickdjs.cc/book_1344861.html
- http://www.ickdjs.cc/book_3873539.html
- http://www.ickdjs.cc/book_1983247.html
- http://www.ickdjs.cc/book_3553619.html
- http://www.ickdjs.cc/book_117086.html