当前位置:   article > 正文

数据分析Pandas专栏---第二章<Pandas四个关键词>

数据分析Pandas专栏---第二章<Pandas四个关键词>

正文:

Pandas中,有三个重要的概念:字段(Columns)、索引(Index)、行(row)和序列(Series)。让我们来看看它们之间的区别:

字段(Columns):

字段是DataFrame中的列,表示数据框中的不同变量或特征。每个字段都有一个名称,可以通过字段名称访问和操作数据。

示例:

  1. import pandas as pd
  2. data = {'Name': ['John', 'Emma', 'Mike'],
  3. 'Age': [25, 28, 30],
  4. 'City': ['New York', 'London', 'Sydney']}
  5. df = pd.DataFrame(data)
  6. print(df)

输出:

  1. Name Age City
  2. 0 John 25 New York
  3. 1 Emma 28 London
  4. 2 Mike 30 Sydney

在这个示例中,'Name'、'Age'和'City'是DataFrame中的三个字段

索引(Index):

索引是Pandas中用于标识和访问数据的标签。它允许我们按行访问和操作DataFrame中的数据。索引可以是整数、日期时间、标签等。每个DataFrame都有一个默认的整数索引,可以自定义或重置索引

  1. import pandas as pd
  2. data = {'Name': ['John', 'Emma', 'Mike'],
  3. 'Age': [25, 28, 30],
  4. 'City': ['New York', 'London', 'Sydney']}
  5. df = pd.DataFrame(data)
  6. print(df.index)

输出:

RangeIndex(start=0, stop=3, step=1)

在这个示例中,索引是一个RangeIndex对象,它表示行索引范围从0到2(共3行)。

行(row):


行是DataFrame中的每个记录或观察值。每一行都通过索引进行标识。行提供了对数据的行维度的标识和访问功能。我们可以按行访问和操作DataFrame中的数据。


示例:

  1. import pandas as pd
  2. data = {'Name': ['John', 'Emma', 'Mike'],
  3. 'Age': [25, 28, 30],
  4. 'City': ['New York', 'London', 'Sydney']}
  5. df = pd.DataFrame(data)
  6. row = df.iloc[0]
  7. print(row)


输出:

  1. Name          John
  2. Age             25
  3. City      New York
  4. Name: 0, dtype: object


在这个示例中,以索引0标识的行是以Series的形式表示的。通过使用iloc方法,我们可以按照索引的位置访问和操作特定行的数据。

序列(Series):

序列是Pandas中的一维数据结构,可以看作是带有标签索引的数组。它是由单个字段以及它们对应的索引组成。在内部,每个列都是一个序列。序列可以独立存在,也可以作为DataFrame中的一部分。

  1. import pandas as pd
  2. data = {'Name': ['John', 'Emma', 'Mike'],
  3. 'Age': [25, 28, 30],
  4. 'City': ['New York', 'London', 'Sydney']}
  5. df = pd.DataFrame(data)
  6. name_series = df['Name']
  7. print(name_series)

输出:

  1. 0 John
  2. 1 Emma
  3. 2 Mike
  4. Name: Name, dtype: object

在这个示例中,'Name'列是一个序列,它具有对应的索引,并被赋予了名称'Name'。

总结

  1. 字段(Columns)是DataFrame对象中的列,提供了对数据列维度的标识和访问功能。
  2. 索引(Index)提供了对DataFrame中数据行的标签访问功能。
  3. 行(row)表示DataFrame中每个记录或观察值,提供了对数据行维度的标识和访问功能。
  4. 序列(Series)是DataFrame中每个字段的子集,是具有标签索引的一维数据结构。

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop】
推荐阅读
相关标签
  

闽ICP备14008679号