赞
踩
今天给大家推荐两本清华大学出版社刚刚出版的数据分析&挖掘类书籍,都是比较适合初学者入门的图书书,闲话少说,直接看两本书的介绍吧。
第一本是《Python+Tensorflow机器学习实战》,通过开发实例和项目案例,详细介绍TensorFlow 开发所涉及的主要内容。书中的每个知识点都通过实例进行通俗易懂的讲解,便于读者轻松掌握有关TensorFlow 开发的内容和技巧,并能够得心应手地使用TensorFlow 进行开发。
Python+Tensorflow机器学习实战》内容共分为11章,首先介绍TensorFlow 的基本知识,通过实例逐步深入地讲解线性回归、支持向量机、神经网络算法和无监督学习等常见的机器学习算法模型。然后通过TensorFlow 在自然语言文本处理、语音识别、图形识别和人脸识别等方面的成功应用讲解TensorFlow 的实际开发过程。
图书特点:
很系统:讲解19种机器学习经典算法,依次击破重难点
很图示:书中包括113张图解说明,方便读者理解
很实用:囊括文本识别、语音识别、图形识别、人脸认识等
很实战:31个实例、13个案例,详解TensorFlow机器学习
目录(上下滑动显示更多内容)
第1章 机器学习概述
1.1 人工智能 1
1.2 机器学习 2
1.2.1 机器学习的发展 2
1.2.2 机器学习的分类 3
1.2.3 机器学习的经典算法 4
1.2.4 机器学习入门 6
1.3 TensorFlow简介 6
1.3.1 主流框架的对比 7
1.3.2 TensorFlow的发展 9
1.3.3 使用TensorFlow的公司 10
1.4 TensorFlow环境准备 10
1.4.1 Windows环境 11
1.4.2 Linux环境 21
1.4.3 Mac OS环境 22
1.5 常用的第三方模块 22
1.6 本章小结 23
第2章 TensorFlow基础
2.1 TensorFlow基础框架 24
2.1.1 系统框架 24
2.1.2 系统的特性 26
2.1.3 编程模型 27
2.1.4 编程特点 28
2.2 TensorFlow源代码结构分析 30
2.2.1 源代码下载 30
2.2.2 TensorFlow目录结构 30
2.2.3 重点目录 31
2.3 TensorFlow基本概念 33
2.3.1 Tensor 33
2.3.2 Variable 34
2.3.3 Placeholder 35
2.3.4 Session 36
2.3.5 Operation 36
2.3.6 Queue 37
2.3.7 QueueRunner 38
2.3.8 Coordinator 39
2.4 第一个TensorFlow示例 40
2.4.1 典型应用 41
2.4.2 运行TensorFlow示例 43
2.5 TensorBoard可视化 45
2.5.1 SCALARS面板 45
2.5.2 GRAPHS面板 47
2.5.3 IMAGES面板 48
2.5.4 AUDIO面板 49
2.5.5 DISTRIBUTIONS面板 49
2.5.6 HISTOGRAMS面板 49
2.5.7 PROJECTOR面板 50
2.6 本章小结 50
第3章 TensorFlow进阶
3.1 加载数据 51
3.1.1 预加载数据 51
3.1.2 填充数据 51
3.1.3 从CSV文件读取数据 52
3.1.4 读取TFRecords数据 54
3.2 存储和加载模型 58
3.2.1 存储模型 58
3.2.2 加载模型 59
3.3 评估和优化模型 60
3.3.1 评估指标的介绍与使用 60
3.3.2 模型调优的主要方法 61
3.4 本章小结 63
第4章 线性模型
4.1 常见的线性模型 64
4.2 一元线性回归 65
4.2.1 生成训练数据 65
4.2.2 定义训练模型 66
4.2.3 进行数据训练 66
4.2.4 运行总结 67
4.3 多元线性回归 68
4.3.1 二元线性回归算法简介 68
4.3.2 生成训练数据 69
4.3.3 定义训练模型 70
4.3.4 进行数据训练 70
4.3.5 运行总结 70
4.4 逻辑回归 71
4.4.1 逻辑回归算法简介 71
4.4.2 生成训练数据 73
4.4.3 定义训练模型 74
4.4.4 进行数据训练 74
4.4.5 运行总结 75
4.5 本章小结 76
第5章 支持向量机
5.1 支持向量机简介 77
5.1.1 SVM基本型 77
5.1.2 SVM核函数简介 79
5.2 拟合线性回归 80
5.2.1 生成训练数据 80
5.2.2 定义训练模型 81
5.2.3 进行数据训练 81
5.2.4 运行总结 82
5.3 拟合逻辑回归 83
5.3.1 生成训练数据 83
5.3.2 定义训练模型 84
5.3.3 进行数据训练 85
5.3.4 运行总结 86
5.4 非线性二值分类 87
5.4.1 生成训练数据 87
5.4.2 定义训练模型 88
5.4.3 进行数据训练 89
5.4.4 运行总结 89
5.5 非线性多类分类 91
5.5.1 生成训练数据 91
5.5.2 定义训练模型 92
5.5.3 进行数据训练 93
5.5.4 运行总结 94
5.6 本章小结 95
第6章 神经网络
6.1 神经网络简介 96
6.1.1 神经元模型 97
6.1.2 神经网络层 100
6.2 拟合线性回归问题 102
6.2.1 生成训练数据 102
6.2.2 定义神经网络模型 102
6.2.3 进行数据训练 103
6.2.4 运行总结 104
6.3 MNIST数据集 104
6.3.1 MNIST数据集简介 105
6.3.2 数据集图片文件 105
6.3.3 数据集标记文件 106
6.4 全连接神经网络 106
6.4.1 加载MNIST训练数据 106
6.4.2 构建神经网络模型 107
6.4.3 进行数据训练 108
6.4.4 评估模型 109
6.4.5 构建多层神经网络模型 110
6.4.6 可视化多层神经网络模型 111
6.5 卷积神经网络 113
6.5.1 卷积神经网络简介 114
6.5.2 卷积层 115
6.5.3 池化层 119
6.5.4 全连接神经网络层 121
6.5.5 卷积神经网络的发展 121
6.6 通过卷积神经网络处理MNIST 122
6.6.1 加载MNIST训练数据 122
6.6.2 构建卷积神经网络模型 123
6.6.3 进行数据训练 127
6.6.4 评估模型 127
6.7 循环神经网络 128
6.7.1 循环神经网络简介 128
6.7.2 基本循环神经网络 129
6.7.3 长短期记忆网络 131
6.7.4 双向循环神经网络简介 134
6.8 通过循环神经网络处理MNIST 135
6.8.1 加载MNIST训练数据 136
6.8.2 构建神经网络模型 136
6.8.3 进行数据训练及评估模型 137
6.9 递归神经网络 138
6.9.1 递归神经网络简介 138
6.9.2 递归神经网络的应用 139
6.10 本章小结 140
第7章 无监督学习
7.1 无监督学习简介 141
7.1.1 聚类模型 141
7.1.2 自编码网络模型 142
7.2 K均值聚类 142
7.2.1 K均值聚类算法简介 142
7.2.2 K均值聚类算法实践 144
7.3 自编码网络 147
7.3.1 自编码网络简介 147
7.3.2 自编码网络实践 148
7.4 本章小结 151
第8章 自然语言文本处理
8.1 自然语言文本处理简介 152
8.1.1 处理模型的选择 152
8.1.2 文本映射 153
8.1.3 TensorFlow文本处理的一般步骤 156
8.2 学写唐诗 157
8.2.1 数据预处理 157
8.2.2 生成训练模型 158
8.2.3 评估模型 160
8.3 智能影评分类 163
8.3.1 CBOW嵌套模型 163
8.3.2 构建影评分类模型 167
8.3.3 训练评估影评分类模型 169
8.4 智能聊天机器人 170
8.4.1 Attention机制的Seq2Seq模型 170
8.4.2 数据预处理 173
8.4.3 构建智能聊天机器人模型 174
8.4.4 训练模型 177
8.4.5 评估模型 179
8.5 本章小结 180
第9章 语音处理
9.1 语音处理简介 181
9.1.1 语音识别模型 181
9.1.2 语音合成模型 183
9.2 听懂数字 183
9.2.1 数据预处理 184
9.2.2 构建识别模型 185
9.2.3 训练模型 185
9.2.4 评估模型 185
9.3 听懂中文 185
9.3.1 数据预处理 186
9.3.2 构建识别模型 188
9.3.3 训练模型 191
9.3.4 评估模型 191
9.4 语音合成 192
9.4.1 Tacotron模型 192
9.4.2 编码器模块 193
9.4.3 解码器模块 196
9.4.4 后处理模块 197
9.5 本章小结 197
第10章 图像处理
10.1 机器学习的图像处理简介 198
10.1.1 图像修复 198
10.1.2 图像物体识别与检测 199
10.1.3 图像问答 201
10.2 图像物体识别 201
10.2.1 数据预处理 201
10.2.2 生成训练模型 203
10.2.3 训练模型 205
10.2.4 评估模型 206
10.3 图片验证码识别 208
10.3.1 验证码的生成 208
10.3.2 数据预处理 209
10.3.3 生成训练模型 211
10.3.4 训练模型 212
10.3.5 评估模型 213
10.4 图像物体检测 214
10.4.1 物体检测系统 214
10.4.2 物体检测系统实践 215
10.5 看图说话 217
10.5.1 看图说话原理 218
10.5.2 看图说话模型的构建 218
10.5.3 看图说话模型的训练 220
10.5.4 评估模型 221
10.6 本章小结 222
第11章 人脸识别
11.1 人脸识别简介 223
11.1.1 人脸图像采集 223
11.1.2 人脸检测 224
11.1.3 人脸图像预处理 224
11.1.4 人脸关键点检测 224
11.1.5 人脸特征提取 224
11.1.6 人脸比对 225
11.1.7 人脸属性检测 225
11.2 人脸验证 225
11.2.1 数据预处理 226
11.2.2 运行FaceNet模型 226
11.2.3 实现人脸验证 229
11.3 性别和年龄的识别 231
11.3.1 Adience数据集 231
11.3.2 数据预处理 232
11.3.3 生成训练模型 233
11.3.4 训练模型 235
11.3.5 评估模型 236
11.4 本章小结 237
第二本书是《R统计数据清洗及应用》,该书是统计数据自动清洗的全面指南,利用数理统计、数据挖掘或预定义的清洗规则等技术,从大量数据中筛选出满足质量要求的那些有用数据。重点关注数据清洗方法的自动化,既包括理论知识,也包括使用R语言编写的应用。使读者能够设计数据清洗过程,用于进行一次性分析或者设置生产系统以便定期进行数据清洗。
要生成干净的数据,需要经历一个纷繁复杂且耗费时间的过程,不仅需要了解相关的技术诀窍,还需要具备统计方面的专业知识。《R统计数据清洗及应用》介绍大量文字、数值或分类数据的清洗技术,涵盖有关数据表示和数据结构的各种技术数据清洗方法。书中重点介绍了统计数据验证,基于预定义限制的数据清理和数据清洗策略。
目录(上下滑动显示更多内容)
第1章 数据清洗 1
1.1 统计价值链 1
1.1.1 原始数据 2
1.1.2 输入数据 2
1.1.3 有效数据 3
1.1.4 统计数据 3
1.1.5 输出 3
1.2 《R统计数据清洗及应用》使用的表示法和约定 3
第2章 R语言简介 5
2.1 命令行中的R语言 5
2.2 向量 7
2.2.1 向量计算 9
2.2.2 数组和矩阵 10
2.3 数据帧 11
2.3.1 公式-数据接口 12
2.3.2 选择行和列,布尔运算符 13
2.3.3 使用索引进行选择 13
2.3.4 数据帧操纵:dplyr软件包 15
2.4 特殊值 16
2.5 在R中导入和导出数据 19
2.5.1 R中的文件路径 20
2.5.2 软件包提供的格式 20
2.5.3 从数据库读取数据 21
2.5.4 处理R外部的数据 21
2.6 函数 22
2.6.1 使用函数 22
2.6.2 编写函数 23
2.7 《R统计数据清洗及应用》中使用的软件包 24
第3章 数据的技术表示 27
3.1 数值数据 28
3.1.1 整数 28
3.1.2 R中的整数 30
3.1.3 实数 31
3.1.4 双精度数 31
3.1.5 机器精度的概念 33
3.1.6 处理浮点数的不良结果 34
3.1.7 处理不良结果 35
3.1.8 R中的数值数据 37
3.2 文本数据 38
3.2.1 术语和编码 38
3.2.2 Unicode 39
3.2.3 一些常见的编码方案 40
3.2.4 R中的文本数据:character类的对象 43
3.2.5 R中的编码方案 45
3.2.6 使用非本地编码方案进行数据的读取和写入 46
3.2.7 检测编码方案 48
3.2.8 排序规则和排序 49
3.3 时间和日期 51
3.3.1 TAI、UTC以及POSIX从Epcoch开始的秒数 51
3.3.2 时间和日期表示法 52
3.3.3 R中的时间和日期存储 54
3.3.4 R中的时间和日期转换 55
3.3.5 闰日、时区和夏令时 57
3.4 区域设置注意事项 58
第4章 数据结构 61
4.1 简介 61
4.2 表格数据 61
4.2.1 data.frame对象 62
4.2.2 数据库 62
4.2.3 dplyr 64
4.3 矩阵数据 65
4.4 时间序列 66
4.5 图表数据 68
4.6 Web数据 70
4.6.1 网页爬取 70
4.6.2 Web API 70
4.7 其他数据 73
4.8 整理表格数据 73
4.8.1 每列变量 75
4.8.2 单个观测值存储在多个表中 75
第5章 清洗文本数据 77
5.1 字符规范化 78
5.1.1 编码转换和Unicode规范化 78
5.1.2 字符转换和音译 80
5.2 使用正则表达式进行模式匹配 82
5.2.1 基本正则表达式 82
5.2.2 实用的正则表达式 85
5.2.3 在R中生成正则表达式 93
5.3 R中的常见字符串处理任务 94
5.4 近似文本匹配 99
5.4.1 字符串指标 101
5.4.2 R中的字符串指标和近似文本匹配 110
第6章 数据验证 121
6.1 简介 121
6.2 初识validate软件包 122
6.2.1 使用check_that快速检查 122
6.2.2 基本工作流程:validator和confront 124
6.2.3 validate和DSL背景简介 126
6.3 定义数据验证 127
6.3.1 数据验证的正式定义 128
6.3.2 验证函数的运算 130
6.3.3 验证和缺失值 132
6.3.4 验证函数的结构 133
6.3.5 界定validate中的验证规则 134
6.4 数据验证函数的形式类型 135
6.4.1 深入了解测量 135
6.4.2 验证规则的分类 137
6.5 使用validate软件包验证数据 139
6.5.1 控制台和validator对象中的验证规则 139
6.5.2 在管道中验证 141
6.5.3 抛出错误或警告 141
6.5.4 测试线性方程式的公差 142
6.5.5 设置和重置选项 143
6.5.6 从文件导入验证规则/将验证规则导出到文件 144
6.5.7 检查变量类型和元数据 146
6.5.8 检查值范围和代码列表 147
6.5.9 检查记录中一致性规则 148
6.5.10 检查跨记录验证规则 150
6.5.11 检查函数依赖 151
6.5.12 跨数据集验证 152
6.5.13 宏、变量组、键 153
6.5.14 分析输出:validation对象 154
6.5.15 输出维度和输出选择 156
第7章 在数据记录中定位错误 159
7.1 错误定位 159
7.2 使用R进行错误定位 162
7.3 以MIP问题的形式进行错误定位 164
7.3.1 错误定位和混合整数规划 165
7.3.2 线性限制 166
7.3.3 分类限制 167
7.3.4 混合类型限制 169
7.4 数值稳定性问题 171
7.4.1 解决MIP问题 172
7.4.2 缩放数值记录 174
7.4.3 设置数值阈值 174
7.5 实际问题 176
7.5.1 设置可靠性权重 176
7.5.2 简化条件验证规则 177
7.6 结论 181
第8章 规则集的维护和简化 185
8.1 验证规则的质量 185
8.1.1 完备性 185
8.1.2 多余的规则和不可行性 186
8.2 以逻辑语言表述规则 186
8.3 规则集问题 188
8.3.1 不可行规则集 188
8.3.2 固定值 190
8.3.3 冗余规则 191
8.3.4 非松弛子句 191
8.3.5 非约束子句 191
8.4 检测和简化过程 192
8.4.1 混合整数规划 193
8.4.2 检测可行性 193
8.4.3 查找导致不可行的规则 193
8.4.4 检测冲突规则 194
8.4.5 检测部分不可行性 194
8.4.6 检测固定值 194
8.4.7 检测非松弛子句 195
8.4.8 检测非约束子句 195
8.4.9 检测冗余规则 195
8.5 结论 196
第9章 基于领域知识模型的方法 197
9.1 使用数据修改规则进行校正 197
9.1.1 修改函数 198
9.1.2 针对数值数据的一类修改函数 202
9.2 使用dcmodify进行基于规则的校正 206
9.2.1 从文件中读取规则 207
9.2.2 修改规则语法 208
9.2.3 缺失值 209
9.2.4 顺序执行和与顺序无关的执行 209
9.2.5 选项设置管理 210
9.3 演绎校正 210
9.3.1 校正数值数据中的键入错误 211
9.3.2 使用线性限制进行演绎插补 214
第10章 插补和调整 221
10.1 缺失数据 221
10.1.1 缺失数据机制 221
10.1.2 使用R可视化和测试缺失数据中的模式 222
10.2 基于模型的插补 226
10.3 R中基于模型的插补 228
10.3.1 使用simputation指定插补方法 228
10.3.2 基于线性回归的插补 229
10.3.3 M估计 231
10.3.4 Lasso回归、岭回归和弹性网络回归 233
10.3.5 分类和回归树 233
10.3.6 随机森林 236
10.4 使用R进行赋值元素插补 237
10.4.1 随机和顺序热卡插补 238
10.4.2 k最近邻和预测均值匹配 239
10.5 simputation软件包中的其他方法 240
10.6 基于EM算法的插补 241
10.6.1 EM算法 242
10.6.2 假定多变量正态分布情况下的EM插补 244
10.7 插补下的抽样方差 245
10.8 多重插补 246
10.8.1 基于EM算法的多重插补 249
10.8.2 Amelia软件包 249
10.8.3 基于链式方程的多变量插补 253
10.8.4 使用mice软件包进行插补 254
10.9 用于估计插补方差的分析方法 257
10.10 选择插补方法 257
10.11 约束值调整 260
10.11.1 形式化描述 260
10.11.2 对插补数据的应用 263
10.11.3 使用rspa软件包调整插补值 263
第11章 示例:一个小型数据清洗系统 265
11.1 设置 266
11.1.1 确定性方法 267
11.1.2 错误定位 268
11.1.3 插补 269
11.1.4 调整插补数据 271
11.2 监控数据更改 273
11.2.1 数据差异(Daff) 273
11.2.2 汇总单元格更改 275
11.2.3 按照验证规则汇总更改 276
11.2.4 使用lumberjack自动跟踪数据更改 278
11.3 集成和自动化 282
11.3.1 使用RScript 282
11.3.2 docopt软件包 283
11.3.3 自动化数据清洗 283
以上两本的详细信息都可以扫码了解哦!
接下来重点来了!!为了回馈一直以来支持我们的粉丝,我们联系了5位IT圈知名大佬组织一场送书活动,每人免费赠送 4 本(两本书各两本),一共送出20 本!包邮到家!
亲爱的读者朋友,只需关注下方的大佬公众号,并回复【清华】,就可以获得抽奖二维码。本次活动将于6月16日晚上8点结束,中奖的读者请在 24 小时内填写收货地址及电话号码,并备注一本你所喜爱的书籍名称,祝君好运哦~
扫码回复清华?
『恋习python』送4本
扫码回复清华?
『数据森麟』送4本
扫码回复清华?
『AI派』送4本
扫码回复清华?
『程序员小王』送4本
扫码回复清华?
『表哥有话讲』送4本
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。