当前位置:   article > 正文

解决pandas读取csv、tsv文件出现错误《ParserError: Error tokenizing data. C error: Expected 1 fields in line...》_pandas.errors.parsererror: error tokenizing data.

pandas.errors.parsererror: error tokenizing data. c error: expected 1 fields

读取文件方式改为

import pandas as pd
pd_data = pd.read_csv('./files.tsv')
  • 1
  • 2

出错,ParserError: Error tokenizing data. C error: Expected 1 fields in line…
将读取方式改为

documents = pd.read_csv('./files.tsv', sep='\t', header=0)
  • 1

OK,问题解决!

read_csv()是Pandas库中用于读取CSV文件的函数,其常用参数如下:

filepath_or_buffer---->CSV文件的路径或URL地址。
sep---->CSV文件中字段分隔符,默认为逗号。
delimiter---->CSV文件中字段分隔符,默认为None。
header---->指定哪一行作为列名,默认为0,即第一行。
names---->自定义列名,如果header=None,则可以使用该参数。
index_col---->用作行索引的列编号或列名。
usecols---->读取指定的列,可以是列名或列编号。
dtype---->指定每列的数据类型,可以是字典或者函数。
na_values---->用于替换缺失值的值。
skiprows---->跳过指定的行数。
skipfooter---->跳过文件末尾的指定行数。
nrows---->读取指定的行数。
parse_dates---->指定哪些列需要转换为日期类型。
infer_datetime_format---->尝试解析日期时间格式(提高效率)。
dayfirst---->将日期解析为“日--年”而不是“月--年”的格式。
encoding---->CSV文件的编码方式,默认为None,使用系统默认编码。
squeeze---->如果文件只包含一列,则返回Series对象而不是DataFrame对象。
thousands---->千位分隔符。
decimal---->小数点分隔符。
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/191572
推荐阅读
相关标签
  

闽ICP备14008679号