赞
踩
def 爬取4399():
#发送请求并且拿到源代码
import requests
链接='https://www.4399.com/' #网站链接
请求头={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:127.0) Gecko/20100101 Firefox/127.0'} #构造请求头用于爬取网站源代码使用
网站源代码=requests.get(url=链接,headers=请求头).text #发送请求并且拿到网站源代码
#解析数据
from bs4 import BeautifulSoup
初始化=BeautifulSoup(网站源代码,'lxml') #初始化
class属性的结果=初始化.find(class_="tm_list") #class是关键字
li标签内容=class属性的结果.find_all('li') #list
for i in li标签内容:
tex=i.text
Fun.AddRowText(uiName,'ListView_1',rowIndex='end',values=tex)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。