当前位置:   article > 正文

包邮送几本Python和R语言的数据分析&挖掘书籍

《r语言数据分析与挖掘实战》——图书配套资料下载

今天给大家推荐两本清华大学出版社刚刚出版的数据分析&挖掘类书籍,都是比较适合初学者入门的图书书,闲话少说,直接看两本书的介绍吧。


第一本是《Python+Tensorflow机器学习实战》,通过开发实例和项目案例,详细介绍TensorFlow 开发所涉及的主要内容。书中的每个知识点都通过实例进行通俗易懂的讲解,便于读者轻松掌握有关TensorFlow 开发的内容和技巧,并能够得心应手地使用TensorFlow 进行开发。


640?wx_fmt=png


Python+Tensorflow机器学习实战》内容共分为11章,首先介绍TensorFlow 的基本知识,通过实例逐步深入地讲解线性回归、支持向量机、神经网络算法和无监督学习等常见的机器学习算法模型。然后通过TensorFlow 在自然语言文本处理、语音识别、图形识别和人脸识别等方面的成功应用讲解TensorFlow 的实际开发过程。


640?wx_fmt=png

 

图书特点:

很系统:讲解19种机器学习经典算法,依次击破重难点

很图示:书中包括113张图解说明,方便读者理解

很实用:囊括文本识别、语音识别、图形识别、人脸认识等

很实战:31个实例、13个案例,详解TensorFlow机器学习


目录(上下滑动显示更多内容)


第1章 机器学习概述

1.1 人工智能    1

1.2 机器学习    2

1.2.1 机器学习的发展    2

1.2.2 机器学习的分类    3

1.2.3 机器学习的经典算法    4

1.2.4 机器学习入门    6

1.3 TensorFlow简介    6

1.3.1 主流框架的对比    7

1.3.2 TensorFlow的发展    9

1.3.3 使用TensorFlow的公司    10

1.4 TensorFlow环境准备    10

1.4.1 Windows环境    11

1.4.2 Linux环境    21

1.4.3 Mac OS环境    22

1.5 常用的第三方模块    22

1.6 本章小结       23

第2章 TensorFlow基础

2.1 TensorFlow基础框架    24

2.1.1 系统框架    24

2.1.2 系统的特性    26

2.1.3 编程模型    27

2.1.4 编程特点    28

2.2 TensorFlow源代码结构分析    30

2.2.1 源代码下载    30

2.2.2 TensorFlow目录结构    30

2.2.3 重点目录    31

2.3 TensorFlow基本概念    33

2.3.1 Tensor    33

2.3.2 Variable    34

2.3.3 Placeholder    35

2.3.4 Session    36

2.3.5 Operation    36

2.3.6 Queue    37

2.3.7 QueueRunner    38

2.3.8 Coordinator    39

2.4 第一个TensorFlow示例    40

2.4.1 典型应用    41

2.4.2 运行TensorFlow示例    43

2.5 TensorBoard可视化    45

2.5.1 SCALARS面板    45

2.5.2 GRAPHS面板    47

2.5.3 IMAGES面板    48

2.5.4 AUDIO面板    49

2.5.5 DISTRIBUTIONS面板    49

2.5.6 HISTOGRAMS面板    49

2.5.7 PROJECTOR面板   50

2.6 本章小结       50

第3章 TensorFlow进阶

3.1 加载数据       51

3.1.1 预加载数据    51

3.1.2 填充数据    51

3.1.3 从CSV文件读取数据     52

3.1.4 读取TFRecords数据     54

3.2 存储和加载模型     58

3.2.1 存储模型     58

3.2.2 加载模型     59

3.3 评估和优化模型     60

3.3.1 评估指标的介绍与使用     60

3.3.2 模型调优的主要方法     61

3.4 本章小结        63

第4章 线性模型

4.1 常见的线性模型     64

4.2 一元线性回归     65

4.2.1 生成训练数据     65

4.2.2 定义训练模型     66

4.2.3 进行数据训练     66

4.2.4 运行总结     67

4.3 多元线性回归     68

4.3.1 二元线性回归算法简介     68

4.3.2 生成训练数据     69

4.3.3 定义训练模型     70

4.3.4 进行数据训练     70

4.3.5 运行总结     70

4.4 逻辑回归        71

4.4.1 逻辑回归算法简介     71

4.4.2 生成训练数据     73

4.4.3 定义训练模型     74

4.4.4 进行数据训练     74

4.4.5 运行总结     75

4.5 本章小结        76

第5章 支持向量机

5.1 支持向量机简介     77

5.1.1 SVM基本型     77

5.1.2 SVM核函数简介     79

5.2 拟合线性回归     80

5.2.1 生成训练数据     80

5.2.2 定义训练模型     81

5.2.3 进行数据训练     81

5.2.4 运行总结     82

5.3 拟合逻辑回归     83

5.3.1 生成训练数据     83

5.3.2 定义训练模型     84

5.3.3 进行数据训练     85

5.3.4 运行总结     86

5.4 非线性二值分类     87

5.4.1 生成训练数据     87

5.4.2 定义训练模型     88

5.4.3 进行数据训练     89

5.4.4 运行总结     89

5.5 非线性多类分类     91

5.5.1 生成训练数据     91

5.5.2 定义训练模型     92

5.5.3 进行数据训练     93

5.5.4 运行总结     94

5.6 本章小结        95

第6章 神经网络

6.1 神经网络简介     96

6.1.1 神经元模型     97

6.1.2 神经网络层    100

6.2 拟合线性回归问题    102

6.2.1 生成训练数据    102

6.2.2 定义神经网络模型    102

6.2.3 进行数据训练    103

6.2.4 运行总结    104

6.3 MNIST数据集    104

6.3.1 MNIST数据集简介    105

6.3.2 数据集图片文件    105

6.3.3 数据集标记文件    106

6.4 全连接神经网络    106

6.4.1 加载MNIST训练数据    106

6.4.2 构建神经网络模型    107

6.4.3 进行数据训练    108

6.4.4 评估模型    109

6.4.5 构建多层神经网络模型    110

6.4.6 可视化多层神经网络模型    111

6.5 卷积神经网络    113

6.5.1 卷积神经网络简介    114

6.5.2 卷积层    115

6.5.3 池化层    119

6.5.4 全连接神经网络层    121

6.5.5 卷积神经网络的发展    121

6.6 通过卷积神经网络处理MNIST    122

6.6.1 加载MNIST训练数据    122

6.6.2 构建卷积神经网络模型    123

6.6.3 进行数据训练    127

6.6.4 评估模型    127

6.7 循环神经网络    128

6.7.1 循环神经网络简介    128

6.7.2 基本循环神经网络    129

6.7.3 长短期记忆网络    131

6.7.4 双向循环神经网络简介    134

6.8 通过循环神经网络处理MNIST    135

6.8.1 加载MNIST训练数据    136

6.8.2 构建神经网络模型    136

6.8.3 进行数据训练及评估模型    137

6.9 递归神经网络    138

6.9.1 递归神经网络简介    138

6.9.2 递归神经网络的应用    139

6.10 本章小结    140

第7章 无监督学习

7.1 无监督学习简介    141

7.1.1 聚类模型    141

7.1.2 自编码网络模型    142

7.2 K均值聚类    142

7.2.1 K均值聚类算法简介    142

7.2.2 K均值聚类算法实践    144

7.3 自编码网络    147

7.3.1 自编码网络简介    147

7.3.2 自编码网络实践    148

7.4 本章小结       151

第8章 自然语言文本处理

8.1 自然语言文本处理简介    152

8.1.1 处理模型的选择    152

8.1.2 文本映射    153

8.1.3 TensorFlow文本处理的一般步骤    156

8.2 学写唐诗       157

8.2.1 数据预处理    157

8.2.2 生成训练模型    158

8.2.3 评估模型    160

8.3 智能影评分类    163

8.3.1 CBOW嵌套模型    163

8.3.2 构建影评分类模型    167

8.3.3 训练评估影评分类模型    169

8.4 智能聊天机器人    170

8.4.1 Attention机制的Seq2Seq模型    170

8.4.2 数据预处理    173

8.4.3 构建智能聊天机器人模型    174

8.4.4 训练模型    177

8.4.5 评估模型    179

8.5 本章小结       180

第9章 语音处理

9.1 语音处理简介    181

9.1.1 语音识别模型    181

9.1.2 语音合成模型    183

9.2 听懂数字       183

9.2.1 数据预处理    184

9.2.2 构建识别模型    185

9.2.3 训练模型    185

9.2.4 评估模型    185

9.3 听懂中文       185

9.3.1 数据预处理    186

9.3.2 构建识别模型    188

9.3.3 训练模型    191

9.3.4 评估模型    191

9.4 语音合成       192

9.4.1 Tacotron模型    192

9.4.2 编码器模块    193

9.4.3 解码器模块    196

9.4.4 后处理模块    197

9.5 本章小结       197

第10章 图像处理

10.1 机器学习的图像处理简介    198

10.1.1 图像修复    198

10.1.2 图像物体识别与检测    199

10.1.3 图像问答    201

10.2 图像物体识别    201

10.2.1 数据预处理    201

10.2.2 生成训练模型    203

10.2.3 训练模型    205

10.2.4 评估模型    206

10.3 图片验证码识别    208

10.3.1 验证码的生成    208

10.3.2 数据预处理    209

10.3.3 生成训练模型    211

10.3.4 训练模型    212

10.3.5 评估模型    213

10.4 图像物体检测    214

10.4.1 物体检测系统    214

10.4.2 物体检测系统实践    215

10.5 看图说话    217

10.5.1 看图说话原理    218

10.5.2 看图说话模型的构建    218

10.5.3 看图说话模型的训练    220

10.5.4 评估模型    221

10.6 本章小结    222

第11章 人脸识别

11.1 人脸识别简介    223

11.1.1 人脸图像采集    223

11.1.2 人脸检测    224

11.1.3 人脸图像预处理    224

11.1.4 人脸关键点检测    224

11.1.5 人脸特征提取    224

11.1.6 人脸比对    225

11.1.7 人脸属性检测    225

11.2 人脸验证    225

11.2.1 数据预处理    226

11.2.2 运行FaceNet模型    226

11.2.3 实现人脸验证    229

11.3 性别和年龄的识别    231

11.3.1 Adience数据集    231

11.3.2 数据预处理    232

11.3.3 生成训练模型    233

11.3.4 训练模型    235

11.3.5 评估模型    236

11.4 本章小结    237


第二本书是《R统计数据清洗及应用》,该书是统计数据自动清洗的全面指南,利用数理统计、数据挖掘或预定义的清洗规则等技术,从大量数据中筛选出满足质量要求的那些有用数据。重点关注数据清洗方法的自动化,既包括理论知识,也包括使用R语言编写的应用。使读者能够设计数据清洗过程,用于进行一次性分析或者设置生产系统以便定期进行数据清洗。


640?wx_fmt=png


要生成干净的数据,需要经历一个纷繁复杂且耗费时间的过程,不仅需要了解相关的技术诀窍,还需要具备统计方面的专业知识。《R统计数据清洗及应用》介绍大量文字、数值或分类数据的清洗技术,涵盖有关数据表示和数据结构的各种技术数据清洗方法。书中重点介绍了统计数据验证,基于预定义限制的数据清理和数据清洗策略。


640?wx_fmt=jpeg


目录(上下滑动显示更多内容)

1  数据清洗   1

1.1  统计价值链   1

1.1.1  原始数据   2

1.1.2  输入数据   2

1.1.3  有效数据   3

1.1.4  统计数据   3

1.1.5  输出   3

1.2  R统计数据清洗及应用》使用的表示法和约定   3

2  R语言简介   5

2.1  命令行中的R语言   5

2.2  向量   7

2.2.1  向量计算   9

2.2.2  数组和矩阵   10

2.3  数据帧   11

2.3.1  公式-数据接口   12

2.3.2  选择行和列,布尔运算符   13

2.3.3  使用索引进行选择   13

2.3.4  数据帧操纵:dplyr软件包   15

2.4  特殊值   16

2.5  R中导入和导出数据   19

2.5.1  R中的文件路径   20

2.5.2  软件包提供的格式   20

2.5.3  从数据库读取数据   21

2.5.4  处理R外部的数据   21

2.6  函数   22

2.6.1  使用函数   22

2.6.2  编写函数   23

2.7  R统计数据清洗及应用》中使用的软件包   24

3  数据的技术表示   27

3.1  数值数据   28

3.1.1  整数   28

3.1.2  R中的整数   30

3.1.3  实数   31

3.1.4  双精度数   31

3.1.5  机器精度的概念   33

3.1.6  处理浮点数的不良结果   34

3.1.7  处理不良结果   35

3.1.8  R中的数值数据   37

3.2  文本数据   38

3.2.1  术语和编码   38

3.2.2  Unicode   39

3.2.3  一些常见的编码方案   40

3.2.4  R中的文本数据:character类的对象   43

3.2.5  R中的编码方案   45

3.2.6  使用非本地编码方案进行数据的读取和写入   46

3.2.7  检测编码方案   48

3.2.8  排序规则和排序   49

3.3  时间和日期   51

3.3.1  TAIUTC以及POSIXEpcoch开始的秒数   51

3.3.2  时间和日期表示法   52

3.3.3  R中的时间和日期存储   54

3.3.4  R中的时间和日期转换   55

3.3.5  闰日、时区和夏令时   57

3.4  区域设置注意事项   58

4  数据结构   61

4.1  简介   61

4.2  表格数据   61

4.2.1  data.frame对象   62

4.2.2  数据库   62

4.2.3  dplyr   64

4.3  矩阵数据   65

4.4  时间序列   66

4.5  图表数据   68

4.6  Web数据   70

4.6.1  网页爬取   70

4.6.2  Web API   70

4.7  其他数据   73

4.8  整理表格数据   73

4.8.1  每列变量   75

4.8.2  单个观测值存储在多个表中   75

5  清洗文本数据   77

5.1  字符规范化   78

5.1.1  编码转换和Unicode规范化   78

5.1.2  字符转换和音译   80

5.2  使用正则表达式进行模式匹配   82

5.2.1  基本正则表达式   82

5.2.2  实用的正则表达式   85

5.2.3  R中生成正则表达式   93

5.3  R中的常见字符串处理任务   94

5.4  近似文本匹配   99

5.4.1  字符串指标   101

5.4.2  R中的字符串指标和近似文本匹配   110

6  数据验证   121

6.1  简介   121

6.2  初识validate软件包   122

6.2.1  使用check_that快速检查   122

6.2.2  基本工作流程:validatorconfront   124

6.2.3  validateDSL背景简介   126

6.3  定义数据验证   127

6.3.1  数据验证的正式定义   128

6.3.2  验证函数的运算   130

6.3.3  验证和缺失值   132

6.3.4  验证函数的结构   133

6.3.5  界定validate中的验证规则   134

6.4  数据验证函数的形式类型   135

6.4.1  深入了解测量   135

6.4.2  验证规则的分类   137

6.5  使用validate软件包验证数据   139

6.5.1  控制台和validator对象中的验证规则   139

6.5.2  在管道中验证   141

6.5.3  抛出错误或警告   141

6.5.4  测试线性方程式的公差   142

6.5.5  设置和重置选项   143

6.5.6  从文件导入验证规则/将验证规则导出到文件   144

6.5.7  检查变量类型和元数据   146

6.5.8  检查值范围和代码列表   147

6.5.9  检查记录中一致性规则   148

6.5.10  检查跨记录验证规则   150

6.5.11  检查函数依赖   151

6.5.12  跨数据集验证   152

6.5.13  宏、变量组、键   153

6.5.14  分析输出:validation对象   154

6.5.15  输出维度和输出选择   156

7  在数据记录中定位错误   159

7.1  错误定位   159

7.2  使用R进行错误定位   162

7.3  MIP问题的形式进行错误定位   164

7.3.1  错误定位和混合整数规划   165

7.3.2  线性限制   166

7.3.3  分类限制   167

7.3.4  混合类型限制   169

7.4  数值稳定性问题   171

7.4.1  解决MIP问题   172

7.4.2  缩放数值记录   174

7.4.3  设置数值阈值   174

7.5  实际问题   176

7.5.1  设置可靠性权重   176

7.5.2  简化条件验证规则   177

7.6  结论   181

8  规则集的维护和简化   185

8.1  验证规则的质量   185

8.1.1  完备性   185

8.1.2  多余的规则和不可行性   186

8.2  以逻辑语言表述规则   186

8.3  规则集问题   188

8.3.1  不可行规则集   188

8.3.2  固定值   190

8.3.3  冗余规则   191

8.3.4  非松弛子句   191

8.3.5  非约束子句   191

8.4  检测和简化过程   192

8.4.1  混合整数规划   193

8.4.2  检测可行性   193

8.4.3  查找导致不可行的规则   193

8.4.4  检测冲突规则   194

8.4.5  检测部分不可行性   194

8.4.6  检测固定值   194

8.4.7  检测非松弛子句   195

8.4.8  检测非约束子句   195

8.4.9  检测冗余规则   195

8.5  结论   196

9  基于领域知识模型的方法   197

9.1  使用数据修改规则进行校正   197

9.1.1  修改函数   198

9.1.2  针对数值数据的一类修改函数   202

9.2  使用dcmodify进行基于规则的校正   206

9.2.1  从文件中读取规则   207

9.2.2  修改规则语法   208

9.2.3  缺失值   209

9.2.4  顺序执行和与顺序无关的执行   209

9.2.5  选项设置管理   210

9.3  演绎校正   210

9.3.1  校正数值数据中的键入错误   211

9.3.2  使用线性限制进行演绎插补   214

10  插补和调整   221

10.1  缺失数据   221

10.1.1  缺失数据机制   221

10.1.2  使用R可视化和测试缺失数据中的模式   222

10.2  基于模型的插补   226

10.3  R中基于模型的插补   228

10.3.1  使用simputation指定插补方法   228

10.3.2  基于线性回归的插补   229

10.3.3  M估计   231

10.3.4  Lasso回归、岭回归和弹性网络回归   233

10.3.5  分类和回归树   233

10.3.6  随机森林   236

10.4  使用R进行赋值元素插补   237

10.4.1  随机和顺序热卡插补   238

10.4.2  k最近邻和预测均值匹配   239

10.5  simputation软件包中的其他方法   240

10.6  基于EM算法的插补   241

10.6.1  EM算法   242

10.6.2  假定多变量正态分布情况下的EM插补   244

10.7  插补下的抽样方差   245

10.8  多重插补   246

10.8.1  基于EM算法的多重插补   249

10.8.2  Amelia软件包   249

10.8.3  基于链式方程的多变量插补   253

10.8.4  使用mice软件包进行插补   254

10.9  用于估计插补方差的分析方法   257

10.10  选择插补方法   257

10.11  约束值调整   260

10.11.1  形式化描述   260

10.11.2  对插补数据的应用   263

10.11.3  使用rspa软件包调整插补值   263

11  示例:一个小型数据清洗系统   265

11.1  设置   266

11.1.1  确定性方法   267

11.1.2  错误定位   268

11.1.3  插补   269

11.1.4  调整插补数据   271

11.2  监控数据更改   273

11.2.1  数据差异(Daff)   273

11.2.2  汇总单元格更改   275

11.2.3  按照验证规则汇总更改   276

11.2.4  使用lumberjack自动跟踪数据更改   278

11.3  集成和自动化   282

11.3.1  使用RScript   282

11.3.2  docopt软件包   283

11.3.3  自动化数据清洗   283

 


以上两本的详细信息都可以扫码了解哦!


接下来重点来了!!为了回馈一直以来支持我们的粉丝,我们联系了5位IT圈知名大佬组织一场送书活动,每人免费赠送 4 本(两本书各两本),一共送出20 本!包邮到家!


亲爱的读者朋友,只需关注下方的大佬公众号,并回复【清华】,就可以获得抽奖二维码。本次活动将于6月16日晚上8点结束,中奖的读者请在 24 小时内填写收货地址及电话号码,并备注一本你所喜爱的书籍名称,祝君好运哦~


640?wx_fmt=png

 扫码回复清华?

『恋习python送4本


640?wx_fmt=jpeg

扫码回复清华?

『数据森麟送4本


640?wx_fmt=png

扫码回复清华?

『AI派送4本


640?wx_fmt=png

扫码回复清华?

程序员小王送4本


640?wx_fmt=png

扫码回复清华?

『表哥有话讲送4本


声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/625161
推荐阅读
相关标签
  

闽ICP备14008679号