搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
Gausst松鼠会
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
自然语言处理课程总结_CodingPark编程公园_自然语言处理 课程报告
2
C++:round函数的用法_c++ round
3
如何把C盘下用户的中文用户名改成英文用户名_c盘用户名字怎么改成英文
4
【话题】开源大模型与闭源带模型你更看好哪一方
5
python IDLE的下载及安装_idle下载官网
6
mysql中if在oracle怎么用_Oracle的NVL()函数和MySQL中的IfNull()函数
7
YOLOv5-v1-Chinese-Comment: 中文注释版YOLOv5,让目标检测更易理解
8
2023 hnust 湖南科技大学 大三下 人工智能导论课程 期中考试复习笔记_已知一个完善的符号系统,能执行下列6种功能
9
解决spark运行中ERROR Shell:Failed to locate the winutils binary in the hadoop binary path的问题_error shell: failed
10
Vue+ElementUI实现表单动态渲染、可视化配置的方法
当前位置:
article
> 正文
数据导入与预处理-课程总结-01~03章_数据采集与预处理课程梳理
作者:Gausst松鼠会 | 2024-06-08 19:35:44
赞
踩
数据采集与预处理课程梳理
数据导入
与预处理-课程总结-01~03章
第1章 数据预处理概述
1.1 基本概念
1.1.1 大数据项目开发流程
1.1.2 什么是数据预处理
1.1.3 数据质量
1.1.4 常见的数据问题
1.2 数据预处理
1.2.1 数据预处理流程
1.2.2 数据清理的处理方法
1.缺失值的处理方法
2. 异常值的处理方法
3. 重复值的处理方法
1.2.3 数据集成
1. 集成过程中需要处理的问题
2. 数据集成——实体识别
3. 数据集成——冗余属性识别
4. 数据冲突的检测与处理
1.2.4 数据变换
1. 规范化:
2. 数据变换——属性构造
1.2.5 数据规约
1.数据规约目的
2.数据规约方法
第2章 numpy库
2.1 数组对象
2.2 创建数组
2.3 访问数组元素
2.3.1 通过整数索引
2.3.2 使用花式索引访问元素
2.3.3 使用布尔索引访问元素
2.3.4 使用切片访问元素
2.4 数组运算
2.4.1 形状相同的数组运算
2.4.2 数组与常量运算
2.5 Numpy的约减即操作
2.5.1 约减操作
2.5.2 数组排序操作
2.5.3 数组转置
2.5.4 随机数生成
1. numpy的random库
第3章 pandas基础
3.1 series
3.1.1 创建series对象
3.1.2 Series属性
3.1.3 Series索引
1. 位置索引
2. 标签索引
3. 切片索引
4. 布尔索引
3.1.5 Series基本操作技巧
3.2 DataFrame
3.2.1 Dataframe简介
3.2.2 创建DataFrame对象
3.2.3 Dataframe:索引
1.选择行与列
2. df.loc[] - 按index选择行
3. df.iloc[] - 按照整数位置(从轴的0到length-1)选择行
4. 布尔型索引
3.2.4 DataFrame基本操作技巧
1. 数据查看、转置
2. 添加、修改、删除值
3. 排序
3.2.5 Index索引对象
1.索引对象概述
2. 索引对象操作
3. 使用索引对象操作数据
3.3 统计计算与统计描述
备注:本文主要是课程总结,不做过多的拓展,如果需要详细了解,可以查看本专栏系列内容,
专栏链接直达
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/Gausst松鼠会/article/detail/690880
推荐阅读
article
Hadoop
安装
目录
_找到
hadoop
安装
文件
的保存的
目录
,
查看待
安装
的
hadoop
文件
的名称...
/root/software/
hadoop
-2.6.0-cdh5.15.1/etc/
hadoop
_找到
hadoop
安装
文...
赞
踩
article
【C
语言
】实现
数据结构
——
栈
,
队列
_c
语言
栈
和
队列
盘子堆...
栈
和
队列
都常用的
数据结构
,这里使用C
语言
实现
栈
和
队列
,一、
栈
栈
:是一种特殊的线性表,其只允许在一端出数据和入数据,插入数...
赞
踩
article
【
AlexNet
】_
alexnet
数据
增强
...
转载 https://blog.csdn.net/hongbin_xu/article/details/80271291...
赞
踩
article
商务
合作
-
源码
获取_
源码
合作
...
商务
合作
-
源码
获取,可以添加下微信。_
源码
合作
源码
合作
商务
合作
-
源码
获取,可以添加下微信 ...
赞
踩
article
数据
治理
相关
名词解析_
数据
资产
构成
包括
哪些...
数据
治理
相关
名词解析:1、
数据
、
数据
资源、
数据
资产
、
数据
要素。2、
数据
管理、
数据
资源管理、
数据
资产
管理、
数据
要素化。3、...
赞
踩
article
Typescrip
t
高级: 深入理解
ex
t
ends
k
eyof
语法
_
k
ex
t
ends
k
eyof
...
在TypeScrip
t
中,
ex
t
ends
关键字是类型系统中一个极其重要的组成部分它不仅用于类的继承,也是类型兼容性检查和...
赞
踩
article
动态
规划
方案
数
问题_
动态
规划
取
数
方案
数
...
动态
规划
方案
数
选择_
动态
规划
取
数
方案
数
动态
规划
取
数
方案
数
...
赞
踩
article
armbian
安装
docker
并配置
青龙
面板
(
centos
通用)_
armbian
安装
青龙
面板
...
armbian
安装
docker
并配置
青龙
面板
(
centos
通用)_
armbian
安装
青龙
面板
armbian
安装
青龙
面板
...
赞
踩
article
Springboot
操作
Redis
时,发现
key
值出现 \xac\xed\
x00
\
x05t
\
x00
\...
@Bean@SuppressWarnings("all")public
Redis
Template
[详细]
-->
赞
踩
article
想要高效
爬取
电商
数据
?五种
爬虫
方式
全解析!封装
API
接口调用_
电商
爬虫
...
本文将介绍五种常见的
爬虫
方式
,分别是:基于 Python 的 Requests 库、基于 Python 的 Scrapy...
赞
踩
article
iOS(
Swift
)
多线程
GCD
_
swift
多线程
...
GCD
(Grand Central Dispatch)是基于C语言开发的一套
多线程
开发机制,也是目前苹果官方推荐的
多线程
...
赞
踩
article
webshell
相关之——
渗透
获取
webshell
思路
总结_熊海
网站
内容
系统
webshell
...
渗透
获取
webshell
思路
总结又坐一天没动地方哈,但是感觉还是有一些没真整明白,也没总结的特别全面细致,今天先发出来,...
赞
踩
article
后端
解决
跨域
问题
_
通过
配置
后端
接口
的
跨域
支持
解决
了该
问题
。...
springboot
解决
跨域
问题
_
通过
配置
后端
接口
的
跨域
支持
解决
了该
问题
。
通过
配置
后端
接口
的
跨域
支持
解决
了该
问题
。 ...
赞
踩
article
【学习笔记】《
卓有成效
的
管理者
》
第二章
掌握
自己
的
时间
_
卓有成效
的
管理者
第二章
...
相比《领导力》那本书,德鲁克这本书可操作性更强一些。管理别人之前,先管理好
自己
;管理好
自己
,首先是管理好
自己
的
时间
。其实...
赞
踩
article
毕业
论文
会
查
ai
率吗?国内高校
毕业
论文
查
ai
吗_
毕业
论文
毕业
后会
查
ai
率吗...
AIPaperPass是AI原创论文写作平台,免费千字大纲,5分钟生成3万字初稿,提供答辩汇报ppt、开题报告、任务书等...
赞
踩
article
nvm
安装
与
卸载
踩坑
记录
...
之前用的
nvm
的nodejs版本管理工具,但是这两天出了莫名其妙的问题,无法下载新版本的nodejs,在找不到原因的情况...
赞
踩
article
[C语言实现]
数据结构
——单链表详解(1)_
typedef
struc
t
slistnode
{ s...
新手易懂的C语言实现单链表_
typedef
struc
t
slistnode
{
sltdatetype
data
; s...
赞
踩
article
四个
Python
常用
OCR
库
的用法详解_
python
ocr
识别
...
在这个例子中,我们首先使用PIL
库
打开图像文件,然后使用
python
-tesseract
库
的image_to_strin...
赞
踩
article
实验六
Hive
_
hive
实验...
一、实验内容1、安装配置
Hive
、MySQL及其JDBC驱动2、编写
Hive
QL语句、实现数据库、表、视图的基本操作3、...
赞
踩
article
分布式
消息
流
处理
平台
kafka
(一)-
kafka
单机、
集群
环境
搭建
流程及
使用
入门_
kafka
搭建
...
自带了zookeeper服务, 不需要额外
搭建
zookeeper
集群
服务,如果不想
使用
也可以
使用
自己
搭建
的zookeep...
赞
踩
相关标签
数据结构
ML
课程设计
数据治理
数据标准化
typescript
动态规划
c++
算法
docker
centos
容器
爬虫
数据挖掘
网络爬虫
笔记
servlet
多线程
安全
java
spring
人工智能
AI写作
论文阅读