赞
踩
原始数据集样式
处理后的结果
代码实现
# 读取数据,指定'r'读取,指定目录(data/LCQMC.test.data原始文件目录) sentence_list = [line.strip() for line in open('data/LCQMC.test.data', "r", encoding='utf-8').readlines()] # 循环并处理每条数据 new_list = [] for count in sentence_list: # 获取分割下标 index = count.find(' ') new_list.append(count[:index]) # 成功输出 # print(new_list) # 打开需要写入的文件, 指定'w'写入,指定目录(需要写入的新文件目录 data/LCQMC.txt) f = open("data/LCQMC.txt","w") # 遍历每一条数据并写入 for new_count in new_list: f.write(new_count) # 写入一条之后换行 f.write('\n') # 关闭文件 f.close
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。