当前位置:   article > 正文

python的pandas库简介_python库pandas简介

python的pandas库简介

pandas是基于numpy的数据分析模块,提供了大量标准模型和高效操作大型数据集所需要的工具。

pandas主要提供了3种数据结构:1、Series,带标签的一维数组;2、DataFrame,带标签且大小可变的二维表格结构;3、Panel,带标签且大小可变的三维数组。

使用:用pig工具下载和安装pandas

导入:import pandas as pd

1.生成一维数组

import numpy as np

x = pd.Series([1, 3,  5, np.nan])

2.生成二维数组

dates = pd.data_range(start  = '20130101', end = '20131231', freq = 'D') #间隔为天

dates = pd.data_range(start  = '20130101', end = '20131231', freq = 'M') #间隔为月

df = pd.DataFrame(np.random.randn(12, 4), index = dates, columns = list('ABCD'))

df = pd.DataFrame([[np.random.randint(1, 100) for j in range(4)] for i in range(12)], index = dates, columns = list('ABCD')) #构造4列随机数

df = pd.DataFrame({'A':[np.random.randint(1, 100) for i in range(4)], 'B':pd.date_range(start = '20130101', periods = 4, freq = 'D'), 'C':pd.Series([1, 2, 3, 4], index = list(range(4)), dtype = 'float32'), 'D':np.array([3] * 4, dtype = 'int32'), 'E':pd.Categorical(["test", "train", "test", "train"]), 'F':'foo'})

df = pd.DataFrame({'A':[np.random.randint(1, 100) for i in range(4)], 'B':pd.date_range(start = '20130101', periods = 4, freq = 'D'), 'C':pd.Series([1, 2, 3, 4], index = list(range(4)), dtype = 'float32'), 'D':np.array([3] * 4, dtype = 'int32'), 'E':pd.Categorical(["test", "train", "test", "train"]), 'F':'foo'})

3.二维数据查看

df.head()  #默认显示前5行

df.head(3)  #查看前3行

df.tail(2)  #查看最后2行

4.查看二维数据的索引、列名和数据

df.index  #查看索引

df.columns  #查看列名

df.values  #查看数据

5.查看数据的统计信息

df.describe()  #返回平均值、标准差、最小值、最大值等信息

6.二维数据转置

df.T

7.排序

df.sort_index(axis = 0, ascending = False)   #对轴进行排序

df.sort_index(axis = 1, ascending = False)

df.sort_values(by = 'A')  #对数据进行排序

df.sort_vlaues(by = 'A', ascending = False)  #对数据进行降序排列

8.数据选择

df['A']  #选择列

df[0 : 2]  #使用切片选择多行

df.loc[:, ['A', 'C']]  #选择多列

df.loc[['zhang', 'zhou'], ['A', 'B', 'C', 'D']]  #同时指定多行与多列进行选择

df.loc['zhang', ['A', 'B', 'C', 'D']]

df.at['zhang', 'A']  #查询指定行、列位置的数据值

df.iloc[3]  #查询第3行数据

df.iloc[0:3, 0:4]  #查询前3行、前4列数据

df.iloc[[0, 2, 3], [0, 4]]  #查询指定的多行、多列数据

df[df.A > 50]  #按给定条件进行查询

python之pandas简介

一. Pandas简介 1.Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和 ...

python库pandas

由于在机器学习中经常以矩阵的方式来表现数据,那么我们就需要一种数据结构来存储和处理矩阵.pandas库就是这样一个工具. 本文档是一个学习笔记,记录一些常用的命令,原文:http://www.cnbl ...

Python库-Pandas

Pandas是基于NumPy的一种数据分析工具,提供了大量使我们快速便捷处理数据的函数和方法. 中文官网地址:https://www.pypandas.cn Pandas基于两种数据类型:Series ...

顶级Python库

绝不能错过的24个顶级Python库 Python有以下三个特点: · 易用性和灵活性 · 全行业高接受度:Python无疑是业界最流行的数据科学语言 · 用于数据科学的Python库的数量优势 事实 ...

Python数据分析Pandas库方法简介

Pandas 入门 Pandas简介 背景:pandas是一个Python包,提供快速,灵活和富有表现力的数据结构,旨在使“关系”或“标记”数据的使用既简单又直观.它旨在成为在Python中进行实际, ...

python库之-------Pandas

包括两个数据结构:DataFrame和Series 官方文档地址: pandas https://pandas.pydata.org/pandas-docs/stable/index.html ser ...

Python数据分析库pandas基本操作

Python数据分析库pandas基本操作2017年02月20日 17:09:06 birdlove1987 阅读数:22631 标签: python 数据分析 pandas 更多 个人分类: Pyt ...

Python 数据处理库 pandas 入门教程

Python 数据处理库 pandas 入门教程2018/04/17 · 工具与框架 · Pandas, Python 原文出处: 强波的技术博客 pandas是一个Python语言的软件包,在我们使 ...

教程 | 一文入门Python数据分析库Pandas

首先要给那些不熟悉 Pandas 的人简单介绍一下,Pandas 是 Python 生态系统中最流行的数据分析库.它能够完成许多任务,包括: 读/写不同格式的数据 选择数据的子集 跨行/列计算 寻找并 ...

随机推荐

formValidator 表单验证

作为一名程序员,在解决工作中遇到问题之后,做一些总结是有必要的,既方便总结温习相关知识点,也为广大的程序员提供了一些工作经历,给予同行一面明鉴. 首先,众所周知的,我们需要引用js类库: eg:< ...

序号自增key的使用

由于在模板中,需要输出序号,但是从数据库中提取的话,保证不了序号的连续性. 在模板中我就使用foreach循环,查手册看到foreach的使用 但是我还是没从手册中学会key的使用.尝试使用 结果,如 ...

HDU1510 White rectangles

White Rectangles Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others) ...

CentOS7 下安装telnet服务

今天搞了下 Centos 7 下面升级 openssl 和 openssh ,顺便装了下 telnet # 安装 telnet 避免 ssh 无法登录 yum -y install xinetd te ...

centos 7 切换运行模式

如设置命令行级别方法: systemctl set-default multi-user.target 设置窗口级别方法: systemctl set-default graphical.target

centos 编译安装net-snmp 5.6.2

1.准备环境 yum -y install make gcc gcc-c++ gcc-g77 openssl openssl-devel 常用lib安装可参照本文 2.编译和安装 首先我们需要下载Ne ...

ASP.NET MVC提交LIST列表到后台接收不到数据

兄跌 你看到这篇文章的时候已经找到答案了. 我在解决这个问题的端倪的时候已经浪费了我一个下午的休假时间.所以你应该给我一个赞!!! 不废话了上代码: Entity(Model) [Serializab ...

Sublime Text 3 最新可用注册码(免破解)

12年的时候分享过Sublime Text 2的注册码和破解方法.4年后容我更新一下Sublime Text 3的注册码.. 最好还是购买正版主持版权.:D. 以下两枚注册码用最新的Sublime T ...

EF 一对一、一对多、多对多配置语句小记

数据库实体间的关系无非有这么几种:一对一.一对多.多对多,这些关系在EF框架中分别有不同的创建方式: 1.在"Database First"模式中,这些关系通过SQL语句的方式建立 ...

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/694961
推荐阅读
相关标签
  

闽ICP备14008679号