图书介绍
Python数据挖掘入门与实践【2025|PDF下载-Epub版本|mobi电子书|kindle百度云盘下载】

- (澳)RobertLayton著;杜春晓译 著
- 出版社: 北京:人民邮电出版社
- ISBN:9787115427106
- 出版时间:2016
- 标注页数:236页
- 文件大小:31MB
- 文件页数:243页
- 主题词:数据处理软件-程序设计
PDF下载
下载说明
Python数据挖掘入门与实践PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 开始数据挖掘之旅1
1.1 数据挖掘简介1
1.2 使用Python和IPython Notebook2
1.2.1 安装Python2
1.2.2 安装IPython4
1.2.3 安装scikit-learn库5
1.3 亲和性分析示例5
1.3.1 什么是亲和性分析5
1.3.2 商品推荐6
1.3.3 在NumPy中加载数据集6
1.3.4 实现简单的排序规则8
1.3.5 排序找出最佳规则10
1.4 分类问题的简单示例12
1.5 什么是分类12
1.5.1 准备数据集13
1.5.2 实现OneR算法14
1.5.3 测试算法16
1.6 小结18
第2章 用scikit-learn估计器分类19
2.1 scikit-learn估计器19
2.1.1 近邻算法20
2.1.2 距离度量20
2.1.3 加载数据集22
2.1.4 努力实现流程标准化24
2.1.5 运行算法24
2.1.6 设置参数25
2.2 流水线在预处理中的应用27
2.2.1 预处理示例28
2.2.2 标准预处理28
2.2.3 组装起来29
2.3 流水线29
2.4 小结30
第3章 用决策树预测获胜球队31
3.1 加载数据集31
3.1.1 采集数据31
3.1.2 用pandas加载数据集32
3.1.3 数据集清洗33
3.1.4 提取新特征34
3.2 决策树35
3.2.1 决策树中的参数36
3.2.2 使用决策树37
3.3 NBA比赛结果预测37
3.4 随机森林41
3.4.1 决策树的集成效果如何42
3.4.2 随机森林算法的参数42
3.4.3 使用随机森林算法43
3.4.4 创建新特征44
3.5 小结45
第4章 用亲和性分析方法推荐电影46
4.1 亲和性分析46
4.1.1 亲和性分析算法47
4.1.2 选择参数47
4.2 电影推荐问题48
4.2.1 获取数据集48
4.2.2 用pandas加载数据49
4.2.3 稀疏数据格式49
4.3 Apriori算法的实现50
4.3.1 Apriori算法51
4.3.2 实现52
4.4 抽取关联规则54
4.5 小结60
第5章 用转换器抽取特征62
5.1 特征抽取62
5.1.1 在模型中表示事实62
5.1.2 通用的特征创建模式64
5.1.3 创建好的特征66
5.2 特征选择67
5.3 创建特征71
5.4 创建自己的转换器75
5.4.1 转换器API76
5.4.2 实现细节76
5.4.3 单元测试77
5.4.4 组装起来79
5.5 小结79
第6章 使用朴素贝叶斯进行社会媒体挖掘80
6.1 消歧80
6.1.1 从社交网站下载数据81
6.1.2 加载数据集并对其分类83
6.1.3 Twitter数据集重建87
6.2 文本转换器90
6.2.1 词袋91
6.2.2 N元语法92
6.2.3 其他特征93
6.3 朴素贝叶斯93
6.3.1 贝叶斯定理93
6.3.2 朴素贝叶斯算法94
6.3.3 算法应用示例95
6.4 应用96
6.4.1 抽取特征97
6.4.2 将字典转换为矩阵98
6.4.3 训练朴素贝叶斯分类器98
6.4.4 组装起来98
6.4.5 用F1值评估99
6.4.6 从模型中获取更多有用的特征100
6.5 小结102
第7章 用图挖掘找到感兴趣的人104
7.1 加载数据集104
7.1.1 用现有模型进行分类106
7.1.2 获取Twitter好友信息107
7.1.3 构建网络110
7.1.4 创建图112
7.1.5 创建用户相似度图114
7.2 寻找子图117
7.2.1 连通分支117
7.2.2 优化参数选取准则119
7.3 小结123
第8章 用神经网络破解验证码124
8.1 人工神经网络124
8.2 创建数据集127
8.2.1 绘制验证码127
8.2.2 将图像切分为单个的字母129
8.2.3 创建训练集130
8.2.4 根据抽取方法调整训练数据集131
8.3 训练和分类132
8.3.1 反向传播算法134
8.3.2 预测单词135
8.4 用词典提升正确率138
8.4.1 寻找最相似的单词138
8.4.2 组装起来139
8.5 小结140
第9章 作者归属问题142
9.1 为作品找作者142
9.1.1 相关应用和使用场景143
9.1.2 作者归属143
9.1.3 获取数据144
9.2 功能词147
9.2.1 统计功能词148
9.2.2 用功能词进行分类149
9.3 支持向量机150
9.3.1 用SVM分类151
9.3.2 内核151
9.4 字符N元语法152
9.5 使用安然公司数据集153
9.5.1 获取安然数据集153
9.5.2 创建数据集加载工具154
9.5.3 组装起来158
9.5.4 评估158
9.6 小结160
第10章 新闻语料分类161
10.1 获取新闻文章161
10.1.1 使用Web API获取数据162
10.1.2 数据资源宝库reddit164
10.1.3 获取数据165
10.2 从任意网站抽取文本167
10.2.1 寻找任意网站网页中的主要内容167
10.2.2 组装起来168
10.3 新闻语料聚类170
10.3.1 k-means算法171
10.3.2 评估结果173
10.3.3 从簇中抽取主题信息175
10.3.4 用聚类算法做转换器175
10.4 聚类融合176
10.4.1 证据累积176
10.4.2 工作原理179
10.4.3 实现180
10.5 线上学习181
10.5.1 线上学习简介181
10.5.2 实现182
10.6 小结184
第11章 用深度学习方法为图像中的物体进行分类185
11.1 物体分类185
11.2 应用场景和目标185
11.3 深度神经网络189
11.3.1 直观感受189
11.3.2 实现189
11.3.3 Theano简介190
11.3.4 Lasagne简介191
11.3.5 用nolearn实现神经网络194
11.4 GPU优化197
11.4.1 什么时候使用GPU进行计算198
11.4.2 用GPU运行代码198
11.5 环境搭建199
11.6 应用201
11.6.1 获取数据201
11.6.2 创建神经网络202
11.6.3 组装起来204
11.7 小结205
第12章 大数据处理206
12.1 大数据206
12.2 大数据应用场景和目标207
12.3 MapReduce208
12.3.1 直观理解209
12.3.2 单词统计示例210
12.3.3 Hadoop MapReduce212
12.4 应用212
12.4.1 获取数据213
12.4.2 朴素贝叶斯预测215
12.5 小结226
附录 接下来的方向227
热门推荐
- 181546.html
- 922435.html
- 2889879.html
- 63758.html
- 1787678.html
- 3316973.html
- 1011280.html
- 3651281.html
- 2007208.html
- 1854609.html
- http://www.ickdjs.cc/book_1957726.html
- http://www.ickdjs.cc/book_1708799.html
- http://www.ickdjs.cc/book_2729323.html
- http://www.ickdjs.cc/book_2918594.html
- http://www.ickdjs.cc/book_2378185.html
- http://www.ickdjs.cc/book_839354.html
- http://www.ickdjs.cc/book_1347198.html
- http://www.ickdjs.cc/book_1395754.html
- http://www.ickdjs.cc/book_2221534.html
- http://www.ickdjs.cc/book_356557.html