当前位置:   article > 正文

【爬虫】:使用python+pandas 爬取带表格的网页_爬虫测试带表格的网站

爬虫测试带表格的网站

原网页为:常见化学品CAS号列表
在这里插入图片描述

代码:

import pandas as pd

for i in range(0, 324):  # 爬取全部324页数据
    url = 'https://www.chemicalbook.com/CASDetailList_%s00.htm' % (str(i))
    tb = pd.read_html(url, encoding="utf-8")[0] # 这里注意设置encoding,否则会中文乱码
    tb.to_csv(r'./data/常见化学品CAS号列表.csv', mode='a', encoding='utf_8_sig', header=1, index=0)
    print('第' + str(i) + '页抓取完成')
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

爬出的数据:
在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/80130
推荐阅读
相关标签
  

闽ICP备14008679号