当前位置:   article > 正文

python借助pandas处理大数据中的csv._pandas 'utf-8' codec can't decode byte 0xe4 in pos

pandas 'utf-8' codec can't decode byte 0xe4 in position 10: invalid continua

目录

怎样利用pandas导入csv

怎样访问csv的某一行?

怎样访问csv的前几行?

怎样访问csv的某列?

怎样在大数据中精确查找值?

怎样提取某列不重复数据?

怎样合并几列数据?


csv的数据

怎样利用pandas导入csv

ps:

  1. 如果出现('utf-8' codec can't decode byte 0xe4 in position 343: invalid continuat)的情况                                             需要添加条件:    df = pd.read_csv("Students.csv",encoding='ISO-8859-1')
  2. pd.read_csv("为csv的路径")
  1. import pandas as pd
  2. # 直接读取csv
  3. df = pd.read_csv("Students.csv")
  4. print(df)
  5. #输出
  6. name Gender age
  7. 0 Student1 boy 19
  8. 1 Student2 girl 18
  9. 2 Student3 girl 18
  10. 3 Student4 boy 18

怎样访问csv的某一行?

怎样访问csv的前几行?

ps:

访问某一行的时候, 列表数据第一行为0,第二行为1,依次递增 (忽略了每一列的标题)

访问前几行的时候,输入几,就访问几行,从1开始.(忽略了每一列的标题)

  1. import pandas as pd
  2. df = pd.read_csv("Students.csv")
  3. # 返回某一行的数据
  4. print(df.iloc[2]) # 返回第三行
  5. #输出
  6. name Student3
  7. Gender girl
  8. age 18
  9. Name: 2, dtype: object
  10. # 返回前XX行的数据,注意 不含有标题head。
  11. a = pd.read_csv("Students.csv",nrows= 2) #返回前两行
  12. print(a)
  13. #输出
  14. name Gender age
  15. 0 Student1 boy 19
  16. 1 Student2 girl 18

怎样访问csv的某列?

ps:访问列的时候,只需要输入每一列的标题即可,相当于可记为一个数组的访问.

  1. import pandas as pd
  2. df = pd.read_csv("Students.csv")
  3. # 返回x列的数据
  4. print(df["name"]) # name为列的名称
  5. #输出
  6. 0 Student1
  7. 1 Student2
  8. 2 Student3
  9. 3 Student4
  10. Name: name, dtype: object

怎样在大数据中精确查找值?

ps:把行和列结合便可以得到某一个精确的值

  1. import pandas as pd
  2. df = pd.read_csv("Students.csv")
  3. #返回 Student1 的年龄
  4. print(df.iloc[0]["age"])
  5. #输出
  6. 19

怎样提取某列不重复数据?

  1. import pandas as pd
  2. df = pd.read_csv("Students.csv")
  3. # 提取年龄组的不重复年龄列
  4. ages = df["age"].unique()
  5. print(ages)
  6. #输出 [19 18]

怎样合并几列数据?

  1. import pandas as pd
  2. df = pd.read_csv("Students.csv")
  3. # 数据合并(需要Student 的所有信息并合并)
  4. df["information"] = df["name"].map(str)+": "+df["Gender"].map(str) +","+ df["age"].map(str)
  5. print(df["information"])
  6. #输出
  7. 0 Student1: boy,19
  8. 1 Student2: girl,18
  9. 2 Student3: girl,18
  10. 3 Student4: boy,18
  11. Name: information, dtype: object

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/运维做开发/article/detail/924350
推荐阅读
相关标签
  

闽ICP备14008679号