赞
踩
我有一个包含以下字段的表单:日期时间、ID和地址。此表单自动为每个条目分配一个唯一的id字符串(U_uid),然后将这些数据输出到一个csv中,其中的标题和行如下所示:Date Time ID U_ID Address
9/12/13 12:07 13 adfasd 1345 Wilson Way
9/12/13 13:45 8 jklj 1456 Jackson Hollow
9/13/13 14:55 13 klidh 1345 Wilson Way
9/13/13 15:00 8 ikodl 1456 Jackson Hollow
我正在寻找一种方法,通过Python脚本删除具有相同ID的用户提交的重复内容,同时保留行中的其余数据。理想情况下,我希望只保留与csv文件中ID相关联的第一个条目。在
输出应该如下所示:
^{pr2}$
到目前为止,我还停留在:import csv
with open('/Users/user/Desktop/test.csv', 'rb') as f:
r = csv.reader(f)
headers = r.next()
rows = [(Date Time, ID, U_ID, Address) for Date Time, ID, U_ID, Address in r]
clean = [row for row in rows if row[1] != '#N/A']
clean2 = list(set(row[1]))
这给了我一个只有ID唯一值的列表,但我不确定如何恢复与这些值的行相关联的所有其他数据。在
如前所述,如果我也能得到最早的提交,那将是很好的,但老实说,任何一个独特的提交ID都应该这样做。在
谢谢你的阅读!在
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。