当前位置:   article > 正文

Pandas手册汉化_dt.floor

dt.floor

目录

输入/输出

Pickling

平面文件

剪贴板

Excel

JSON

HTML

HDFStore: PyTables (HDF5)

Feather

Parquet

SAS

SQL

Google BigQuery

STATA

一般功能

数据处理

顶级缺失数据

顶级转换

顶级处理时间

顶级处理间隔

顶级评估

Series

构造函数

属性

转换

索引, 迭代

二元运算符函数

Function application, GroupBy & Window

计算/ 描述性统计

重新索引/ 选择/ 标签操作

缺少数据处理

重塑, 排序

合并/ 加入

时间序列

类似日期的属性

字符串处理

分类

绘图

序列化/ IO / 转换

Sparse

DataFrame

构造函数

属性和基础数据

转换

索引, 迭代

二元运算符函数

Function application, GroupBy & Window

计算/ 描述性统计

重新索引/ 选择/ 标签操作

缺少数据处理

重塑, 排序, 转置

合并/ 加入

时间序列

绘图

序列化/ IO / 转换

Sparse

面板

Attributes and underlying data

转换

索引, 迭代, 切片

Binary operator functions

Function application, GroupBy

计算/ 描述属性

重新索引/ 选择/ 标签操作

缺少数据处理

重塑, 排序, 转置

合并/ 加入

时间序列相关

序列化/ IO / 转换

索引

属性

缺少值

转换

排序

特定时间的操作

组合/ 加入/ 设置操作

选择

Numeric Index

分类

分类组件

IntervalIndex

IntervalIndex Components

多指标

MultiIndex 构造函数

MultiIndex 属性

MultiIndex 组件

MultiIndex 选择

DatetimeIndex

选择时间/日期组件

选择

特定时间的操作

转换

TimedeltaIndex

ConversionComponents

转换

PeriodIndex

属性

Methods

标量

Period

属性

方法

时间戳

方法

间隔

属性

Timedelta

属性

方法

频率

窗口

标准移动窗口函数

标准扩展窗口函数

指数加权移动窗口函数

GroupBy

索引, 迭代

功能应用

计算/ 描述性统计

重新采样

索引, 迭代

功能应用

上采样

计算/ 描述性统计

Style

Styler 构造函数

Styler 属性

风格应用

内置样式

样式导出和导入

绘图

一般实用功能

使用选项

测试功能

例外 and 警告

数据类型相关功能

扩展


Pandas手册汉化

此页面概述了所有公共pandas对象,函数和方法。pandas.*命名空间中公开的所有类和函数都是公共的。

一些子包是公共的,其中包括pandas.errors, pandas.plotting,和pandas.testing。文档中提到了公共函数 pandas.iopandas.tseries子模块。pandas.api.types分包包含一些与pandas中的数据类型相关的公共函数

输入/输出

Pickling

read_pickle(path[, compression]):从文件加载pickled pandas对象(或任何对象)

平面文件

read_table(filepath_or_buffer[, sep, …]):将常规分隔文件读入DataFrame

read_csv(filepath_or_buffer[, sep, …]):将CSV(逗号分隔)文件读入DataFrame

read_fwf(filepath_or_buffer[, colspecs, widths]):将固定宽度格式化的行表读入DataFrame

read_msgpack(path_or_buf[, encoding, iterator]):从指定的文件路径加载msgpack pandas对象

剪贴板

read_clipboard([sep]):从剪贴板中读取文本并传递给read_table.

Excel

read_excel(io[, sheet_name, header, names, …]):将Excel表读入pandas DataFrame

ExcelFile.parse([sheet_name, header, names, …]):将指定的工作表解析为DataFrame

JSON

read_json([path_or_buf, orient, typ, dtype, …]):将JSON字符串转换为pandas对象

json_normalize(data[, record_path, meta, …]):将“半结构化JSON数据”“规范化”为平面表

build_table_schema(data[, index, …]):从中创建表模式data

HTML

read_html(io[, match, flavor, header, …]):阅读HTML表格到list的DataFrame对象

HDFStore: PyTables (HDF5)

read_hdf(path_or_buf[, key, mode]):从商店读取,如果我们打开它关闭它.

HDFStore.put(key, value[, format, append]):将对象存储在HDFStore中

HDFStore.append(key, value[, format, …]):附加到文件中的表.

HDFStore.get(key):检索存储在文件中的pandas对象

HDFStore.select(key[, where, start, stop, …]):检索存储在文件中的pandas对象,可选择基于where条件

HDFStore.info():打印商店的详细信息

HDFStore.keys():返回与HDFStore中存储的对象相对应的键(可能无序)列表。

Feather

read_feather(path[, nthreads]):从文件路径加载羽毛格式对象

Parquet

read_parquet(path[, engine, columns]):从文件路径加载镶木地板对象,返回DataFrame.

SAS

read_sas(filepath_or_buffer[, format, …]):读取存储为XPORT或SAS7BDAT格式文件的SAS文件

SQL

read_sql_table(table_name, con[, schema, …]):将SQL数据库表读入DataFrame.

read_sql_query(sql, con[, index_col, …]):将SQL查询读入DataFrame.

read_sql(sql, con[, index_col, …]):将SQL查询或数据库表读入DataFrame.

Google BigQuery

read_gbq(query[, project_id, index_col, …]):从Google BigQuery加载数据.

STATA

read_stata(filepath_or_buffer[, …]):将Stata文件读入DataFrame.

StataReader.data_label():返回Stata文件的数据标签

StataReader.value_labels():返回一个dict,将每个变量名称与一个dict相关联,将每个值与其对

StataReader.variable_labels():将变量标签作为dict返回,将每个变量名称与相应的标签相关联

一般功能

数据处理

melt(frame[, id_vars, value_vars, var_name, …]):“Unpivots”DataFrame从宽格式到长格式,可选择设置标识符变量。

pivot(index, columns, values):根据此DataFrame的3列生成“pivot”表。

pivot_table(data[, values, index, columns, …]):创建一个电子表格样式的数据透视表作为DataFrame。

crosstab(index, columns[, values, rownames, …]):计算两个(或更多)因子的简单交叉列表。

cut(x, bins[, right, labels, retbins, …]):Bin值为离散间隔。

qcut(x, q[, labels, retbins, precision, …]):基于分位数的离散化功能。

merge(left, right[, how, on, left_on, …]):通过按列或索引执行数据库样式的连接操作来合并DataFrame对象。

merge_ordered(left, right[, on, left_on, …]):使用为时序数据等有序数据设计的可选填充/插值执行合并。

merge_asof(left, right[, on, left_on, …]):执行asof合并。

concat(objs[, axis, join, join_axes, …]):沿特定轴连接pandas对象,沿其他轴使用可选的设置逻辑。

get_dummies(data[, prefix, prefix_sep, …]):将分类变量转换为虚拟/指示变量

factorize(values[, sort, order, …]):将对象编码为枚举类型或分类变量。

unique(values):哈希表基于唯一。

wide_to_long(df, stubnames, i, j[, sep, suffix]):宽面板到长格式。

顶级缺失数据

isna(obj):检测类似数组的对象的缺失值。

isnull(obj):检测类似数组的对象的缺失值。

notna(obj):检测类似数组的对象的非缺失值。

notnull(obj):检测类似数组的对象的非缺失值。

顶级转换

to_numeric(arg[, errors, downcast]):将参数转换为数字类型.

顶级处理时间

to_datetime(arg[, errors, dayfirst, …]):将参数转换为datetime。

to_timedelta(arg[, unit, box, errors]):将参数转换为timedelta

date_range([start, end, periods, freq, tz, …]):返回固定频率DatetimeIndex。

bdate_range([start, end, periods, freq, tz, …]):返回固定频率DatetimeIndex,以工作日作为默认频率

period_range([start, end, periods, freq, name]):返回固定频率PeriodIndex,以日(日历)作为默认频率

timedelta_range([start, end, periods, freq, …]):返回固定频率TimedeltaIndex,以day作为默认频率

infer_freq(index[, warn]):根据输入索引推断最可能的频率。

顶级处理间隔

interval_range([start, end, periods, freq, …]):返回固定频率IntervalIndex

顶级评估

eval(expr[, parser, engine, truediv, …]):使用各种后端将Python表达式评估为字符串

Series

构造函数

Series([data, index, dtype, name, copy, …]):带轴标签的一维ndarray(包括时间序列).

属性

Axes

Series.index:系列的索引(轴标签)

Series.values:返回系列为ndarray或ndarray-like取决于dtype

Series.dtype:返回基础数据的dtype对象

Series.ftype:如果数据稀疏则返回

Series.shape:返回基础数据形状的元组

Series.nbytes:返回基础数据中的字节数

Series.ndim:根据定义1,返回基础数据的维数

Series.size:返回基础数据中的元素数量

Series.strides:返回基础数据的步幅

Series.itemsize:返回基础数据项的dtype的大小

Series.base:如果共享基础数据的内存,则返回基础对象

Series.T:返回转置,根据定义自我

Series.memory_usage([index, deep]):返回Series的内存使用情况。

Series.hasnans:如果我有任何nans,我会回来; 实现各种性能加速

Series.flags

Series.empty

Series.dtypes:返回基础数据的dtype对象

Series.ftypes:如果数据稀疏则返回

Series.data:返回基础数据的数据指针

Series.is_copy

Series.name

Series.put(*args, **kwargs):将put方法应用于其values属性(如果有)

转换

Series.astype(dtype[, copy, errors]):将pandas对象转换为指定的dtypedtype。

Series.infer_objects():尝试推断对象列的更好的dtypes。

Series.convert_objects([convert_dates, …]):(DEPRECATED)尝试推断对象列的更好dtype。

Series.copy([deep]):复制此对象的索引和数据。

Series.bool():返回单个元素PandasObject的bool。

Series.to_period([freq, copy]):将Series从DatetimeIndex转换为具有所需频率的PeriodIndex(如果未传递,则从索引推断)

Series.to_timestamp([freq, how, copy]):在期间开始时转换为时间戳的datetimedex

Series.tolist():返回值列表。

Series.get_values():与值相同(但处理稀疏转换); 是一种观点

索引, 迭代

Series.get(key[, default]):从给定键的对象获取项目(DataFrame列,Panel切片等)。

Series.at访问行/列标签对的单个值。

Series.iat按整数位置访问行/列对的单个值。

Series.loc通过标签或布尔数组访问一组行和列。

Series.iloc纯粹基于整数位置的索引,用于按位置选择。

Series.__iter__():返回值的迭代器。

Series.iteritems():懒惰地迭代(索引,值)元组

Series.items():懒惰地迭代(索引,值)元组

Series.keys():索引的别名

Series.pop(item):返回项目并从框架中删除。

Series.item():将基础数据的第一个元素作为python标量返回

Series.xs(key[, axis, level, drop_level]):返回Series / DataFrame的横截面(行或列)。

For more information on .at.iat.loc, and .iloc, see the indexing documentation

二元运算符函数

Series.add(other[, level, fill_value, axis]):添加系列和其他元素(二元运算符添加)。

Series.sub(other[, level, fill_value, axis]):减去序列和其他元素(二元运算符)。

Series.mul(other[, level, fill_value, axis]):系列和其他的乘法,元素(二元运算符mul)。

Series.div(other[, level, fill_value, axis]):系列和其他的浮动划分,元素方式(二元算子truediv)。

Series.truediv(other[, level, fill_value, axis]):系列和其他的浮动划分,元素方式(二元算子truediv)。

Series.floordiv(other[, level, fill_value, axis]):系列和其他的整数除法,元素方式(二元运算符floordiv)。

Series.mod(other[, level, fill_value, axis]):系列和其他的模数,元素方式(二元运算符mod)。

Series.pow(other[, level, fill_value, axis]):系列和其他元素的指数幂(二元运算符pow)。

Series.radd(other[, level, fill_value, axis]):添加系列和其他元素(二元运算符radd)。

Series.rsub(other[, level, fill_value, axis]):减去序列和其他元素(二元运算符rsub)。

Series.rmul(other[, level, fill_value, axis]):系列和其他的乘法,元素(二元运算符rmul)。

Series.rdiv(other[, level, fill_value, axis]):系列和其他的浮动划分,元素方式(二元算子rtruediv)。

Series.rtruediv(other[, level, fill_value, axis]):系列和其他的浮动划分,元素方式(二元算子rtruediv)。

Series.rfloordiv(other[, level, fill_value, …]):系列和其他的整数除法,元素方式(二元运算符rfloordiv)。

Series.rmod(other[, level, fill_value, axis]):系列和其他的模数,元素方式(二元运算符rmod)。

Series.rpow(other[, level, fill_value, axis]):系列和其他元素的指数幂(二元运算符rpow)。

Series.combine(other, func[, fill_value]):当一个系列或另一个系列中缺少索引时,使用给定函数对两个系列执行元素二进制运算,并带有可选填充值

Series.combine_first(other):组合系列值,首先选择调用Series的值。

Series.round([decimals]):将系列中的每个值舍入到给定的小数位数。

Series.lt(other[, level, fill_value, axis]):少于系列和其他元素(二元运算符lt)。

Series.gt(other[, level, fill_value, axis]):大于系列和其他元素(二元运算符gt)。

Series.le(other[, level, fill_value, axis]):小于或等于系列等,逐元素(二元运算)。

Series.ge(other[, level, fill_value, axis]):大于或等于系列和其他元素(二元运算符ge)。

Series.ne(other[, level, fill_value, axis]):不等于系列和其他元素(二元运算符ne)。

Series.eq(other[, level, fill_value, axis]):等于系列和其他元素(二元运算符eq)。

Series.product([axis, skipna, level, …]):返回请求轴的值的乘积

Series.dot(other):矩阵乘法与DataFrame或内部产品与Series对象。

Function application, GroupBy & Window

Series.apply(func[, convert_dtype, args]):调用Series的值的函数。

Series.agg(func[, axis]):使用指定轴上的一个或多个操作进行聚合。

Series.aggregate(func[, axis]):使用指定轴上的一个或多个操作进行聚合。

Series.transform(func, *args, **kwargs):调用函数生成类似索引的NDFrame并返回带有转换值的NDFrame

Series.map(arg[, na_action]):使用输入对应(字典,系列或函数)映射Series的值。

Series.groupby([by, axis, level, as_index, …]):使用mapper(dict或key函数,将给定函数应用于组,将结果作为系列返回)或通过一系列列的组系列。

Series.rolling(window[, min_periods, …]):提供滚动窗口计算。

Series.expanding([min_periods, center, axis]):提供扩展转换。

Series.ewm([com, span, halflife, alpha, …]):提供指数加权函数

Series.pipe(func, *args, **kwargs):应用func(self,* args,** kwargs)

计算/ 描述性统计

Series.abs():返回具有每个元素的绝对数值的Series / DataFrame

Series.all([axis, bool_only, skipna, level]):返回是否所有元素都是True,可能是在轴上。

Series.any([axis, bool_only, skipna, level]):返回任何元素在请求的轴上是否为True

Series.autocorr([lag]):Lag-N自相关

Series.between(left, right[, inclusive]):返回boolean Series等效于left <= series <= right

Series.clip([lower, upper, axis, inplace]):在输入阈值处修剪值。

Series.clip_lower(threshold[, axis, inplace]):返回值低于阈值截断的输入的副本。

Series.clip_upper(threshold[, axis, inplace]):输入的返回副本,其值超过给定值(截断)。

Series.corr(other[, method, min_periods]):计算与其他系列的相关性,不包括缺失值

Series.count([level]):返回系列中非NA / null观测值的返回数

Series.cov(other[, min_periods]):计算与Series的协方差,不包括缺失值

Series.cummax([axis, skipna]):返回DataFrameSeries轴上的累积最大值。

Series.cummin([axis, skipna]):返回DataFrameSeries轴上的累积最小值。

Series.cumprod([axis, skipna]):通过DataFrameSeries轴返回累积产品。

Series.cumsum([axis, skipna]):返回DataFrameSeries轴上的累积和。

Series.describe([percentiles, include, exclude]):生成描述性统计数据,总结数据集分布的集中趋势,分散和形状,不包括NaN值。

Series.diff([periods]):第一个离散的元素差异。

Series.factorize([sort, na_sentinel]):将对象编码为枚举类型或分类变量。

Series.kurt([axis, skipna, level, numeric_only]):使用Fisher对峰度的定义(正常峰度== 0.0),在请求轴上返回无偏峰度。

Series.mad([axis, skipna, level]):返回请求轴的值的平均绝对偏差

Series.max([axis, skipna, level, numeric_only]):此方法返回对象中的最大值。

Series.mean([axis, skipna, level, numeric_only]):返回请求轴的值的平均值

Series.median([axis, skipna, level, …]):返回请求轴的值的中值

Series.min([axis, skipna, level, numeric_only]):此方法返回对象中的最小值。

Series.mode():返回数据集的模式。

Series.nlargest([n, keep]):返回最大的n元素。

Series.nsmallest([n, keep]):返回最小的n元素。

Series.pct_change([periods, fill_method, …]):当前元素和先前元素之间的百分比变化。

Series.prod([axis, skipna, level, …]):返回请求轴的值的乘积

Series.quantile([q, interpolation]):给定分位数处的返回值,即la numpy.percentile

Series.rank([axis, method, numeric_only, …]):沿轴计算数值数据等级(1n)。

Series.sem([axis, skipna, level, ddof, …]):在请求的轴上返回均值的无偏标准误差。

Series.skew([axis, skipna, level, numeric_only]):返回请求轴的无偏偏差,由N-1归一化

Series.std([axis, skipna, level, ddof, …]):返回请求轴上的样本标准偏差。

Series.sum([axis, skipna, level, …]):返回请求轴的值的总和

Series.var([axis, skipna, level, ddof, …]):在请求的轴上返回无偏差异。

Series.kurtosis([axis, skipna, level, …]):使用Fisher对峰度的定义(正常峰度== 0.0),在请求轴上返回无偏峰度。

Series.unique():返回Series对象的唯一值。

Series.nunique([dropna]):返回对象中唯一元素的数量。

Series.is_unique如果对象中的值是唯一的,则返回布尔值

Series.is_monotonic如果对象中的值是monotonic_increasing,则返回布尔值

Series.is_monotonic_increasing如果对象中的值是monotonic_increasing,则返回布尔值

Series.is_monotonic_decreasing如果对象中的值是monotonic_decreasing,则返回布尔值

Series.value_counts([normalize, sort, …]):返回包含唯一值计数的对象。

Series.compound([axis, skipna, level]):返回请求轴的值的复合百分比

Series.nonzero():返回非零元素的整数索引

Series.ptp([axis, skipna, level, numeric_only]):返回最大值和之间的差值

重新索引/ 选择/ 标签操作

Series.align(other[, join, axis, level, …]):使用指定的每个轴索引的连接方法将轴上的两个对象对齐

Series.drop([labels, axis, index, columns, …]):返回已删除指定索引标签的系列。

Series.drop_duplicates([keep, inplace]):返回系列,删除重复值。

Series.duplicated([keep]):指示重复的系列值。

Series.equals(other):确定两个NDFrame对象是否包含相同的元素。

Series.first(offset):用于基于日期偏移量化时间序列数据的初始时段的便捷方法。

Series.head([n]):返回前n行。

Series.idxmax([axis, skipna]):返回最大值的行标签。

Series.idxmin([axis, skipna]):返回最小值的行标签。

Series.isin(values):检查系列中是否包含

Series.last(offset):用于基于日期偏移量化时间序列数据的最终时段的便捷方法。

Series.reindex([index]):使用可选填充逻辑将系列符合到新索引,将NA / NaN放置在先前索引中没有值的位置。

Series.reindex_like(other[, method, copy, …]):将具有匹配索引的对象返回给我自己。

Series.rename([index]):更改系列索引标签或名称

Series.rename_axis(mapper[, axis, copy, inplace]):更改索引或列的名称。

Series.reset_index([level, drop, name, inplace]):使用索引重置生成新的DataFrameSeries

Series.sample([n, frac, replace, weights, …]):从对象轴返回随机的项目样本。

Series.select(crit[, axis]):DEPRECATED)返回与轴标签匹配条件对应的数据

Series.set_axis(labels[, axis, inplace]):将所需索引分配给给定轴。

Series.take(indices[, axis, convert, is_copy]):沿轴返回给定位置索引中的元素。

Series.tail([n]):返回最后n行。

Series.truncate([before, after, axis, copy]):在某个索引值之前和之后截断SeriesDataFrame

Series.where(cond[, other, inplace, axis, …]):返回与self相同形状的对象,其对应的条目来自self,其中condTrue,否则来自其他

Series.mask(cond[, other, inplace, axis, …]):返回与self相同形状的对象,其对应的条目来自self,其中condFalse,否则来自other

Series.add_prefix(prefix):带有字符串前缀的前缀标签。

Series.add_suffix(suffix):带有字符串后缀的后缀标签。

Series.filter([items, like, regex, axis]):根据指定索引中的标签设置数据框的行或列。

缺少数据处理

Series.isna():检测缺失值。

Series.notna():检测现有(非缺失)值。

Series.dropna([axis, inplace]):返回删除了缺失值的新系列。

Series.fillna([value, method, axis, …]):使用指定的方法填充NA / NaN

Series.interpolate([method, axis, limit, …]):根据不同的方法插值。

重塑, 排序

Series.argsort([axis, kind, order]):覆盖ndarray.argsort

Series.reorder_levels(order):使用输入顺序重新排列索引级别。

Series.sort_values([axis, ascending, …]):按值排序。

Series.sort_index([axis, level, ascending, …]):按索引标签排序系列。

Series.swaplevel([i, j, copy]):MultiIndex中交换ij级别

Series.unstack([level, fill_value]):

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/193621
推荐阅读
相关标签
  

闽ICP备14008679号