赞
踩
Pandas
是Python
语言的一个扩展程序库,用于数据分析。
Pandas
是一个开放源码、BSD
许可的库,提供高性能、易于使用的数据结构和数据分析工具。
Pandas
名字衍生自术语 “panel data
”(面板数据)和 “Python data analysis
”(Python
数据分析)。
Pandas
一个强大的分析结构化数据的工具集,基础是NumPy
(提供高性能的矩阵运算)。
Pandas
可以从各种文件格式比如CSV
、JSON
、SQL
、Microsoft Excel
导入数据。
Pandas
可以对各种数据进行运算操作,比如归并、再成形、选择,还有数据清洗和数据加工特征。
Pandas
广泛应用在学术、金融、统计学等各个数据分析领域。
Pandas
主要包括以下几个特点:
DataFrame
对象。Excel
、CSV
、SQL
文件),然后转换为可处理的对象;DataFrame
的数据列进行增加、修改或者删除的操作;Pandas
的主要数据结构是Series
(一维数据)与DataFrame
(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。
Series是一种类似于一维数组的对象,它由一组数据(各种Numpy
数据类型)以及一组与之相关的数据标签(即索引)组成。
DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame
既有行索引也有列索引,它可以被看做由Series
组成的字典(共同用一个索引)。
Pandas Series
类似表格中的一个列(column
),类似于一维数组,由一组数据值(value
)和一组标签组成,其中标签与数据值之间是一一对应的关系。Series
可以保存任何数据类型,比如整数、字符串、浮点数、Python
对象等,它的标签默认为整数,从0开始依次递增。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。