赞
踩
学习笔记整理:上个章节学习了在百度搜索引擎中收集即时新闻,在此基础上,可以让python自动生成txt形式的文件。用到的函数是write,只需在原名为baidu(company)的函数最后,插入功能实现代码:
file1 = open('/Users/nicole/Documents/舆情挖掘报告.txt', 'a')
##我把这个文件存在文稿里,Mac查看文件位置:双击右键-显示简介-通用-位置
# 如果把a改成w的话,则每次生成txt的时候都会把原来的txt清空,用w不太好,因为这样只能保留一家公司信息;
# 如果出现乱码问题,则设置encoding参数为utf-8,写成file1 = open('E:\\数据挖掘报告.txt', 'a',encoding='utf-8')
file1.write(company + '数据挖掘completed!' + '\n' + '\n')
for i in range(len(title)):
file1.write(str(i + 1) + '.' + title[i] + '(' + date[i] + '-' + source[i] + ')' + '\n') ##这一行只写入标题,日期和来源,最后记得换行
file1.write(href[i] + '\n') # '\n'表示换行 ,这一行写入新闻链接
file1.write('——————————————————————————————' + '\n' + '\n') ##换两行写入下一家公司
最后在文档里会找到这个叫“舆情挖掘报告.txt”的文件,代码会自动把收集的信息整理到文档里。实验时发现不需要提前先建这么一个文档,可以生成word(.docx)文档但是打不开来,还没弄清原因。成果如下图:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。