当前位置:   article > 正文

Python数据分析:活用Pandas库

Python数据分析:活用Pandas库

Pandas是Python中最常用的数据分析库之一。它提供了高效的数据结构,如DataFrame和Series,以及许多用于数据处理和分析的函数和方法。下面是一些常见的Pandas库的用法和示例代码说明:

1.导入Pandas库

import pandas as pd

2.创建DataFrame:

  1. data = {'Name': ['Tom', 'Jack', 'Steve', 'Ricky'],
  2. 'Age': [28, 34, 29, 42],
  3. 'Salary': [2500, 5000, 3500, 6000]}
  4. df = pd.DataFrame(data)
  5. print(df)

输出结果:

  1. Name Age Salary
  2. 0 Tom 28 2500
  3. 1 Jack 34 5000
  4. 2 Steve 29 3500
  5. 3 Ricky 42 6000

3.读取和写入数据文件:

  1. # 读取CSV文件
  2. df = pd.read_csv('data.csv')
  3. # 写入CSV文件
  4. df.to_csv('output.csv', index=False)

4.数据清洗和预处理:

  1. # 删除缺失值
  2. df.dropna()
  3. # 填充缺失值
  4. df.fillna(0)
  5. # 删除重复值
  6. df.drop_duplicates()

5.数据选择和过滤:

  1. # 选择单列
  2. df['Name']
  3. # 选择多列
  4. df[['Name', 'Salary']]
  5. # 选择行
  6. df.iloc[0] # 选择第一行
  7. df.loc[df['Age'] > 30] # 选择年龄大于30的行

6.数据排序:

  1. # 按指定列排序
  2. df.sort_values('Age')
  3. # 按指定列降序排序
  4. df.sort_values('Salary', ascending=False)
  5. # 按多列排序
  6. df.sort_values(['Age', 'Salary'], ascending=[True, False])

7.数据聚合和分组:

  1. # 计算平均值
  2. df['Salary'].mean()
  3. # 按列分组并计算平均值
  4. df.groupby('Name')['Salary'].mean()

这些是使用Pandas库进行数据分析的一些常见操作和示例代码。Pandas还提供了许多其他有用的函数和方法,可以根据具体的数据分析任务进行进一步学习和探索。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/blog/article/detail/44887
推荐阅读
相关标签
  

闽ICP备14008679号