赞
踩
- pattern=r'<a class="name" href="/u/(.*?).html" target="_blank">(.*?)</a>.*? <span class="s-star s-star(.*?)"></span>'
- items=re.compile(pattern,re.S|re.M).findall(ht2)
- it=str(items)
承接上篇,我们转换得到了ht2,设置了正则表达式,注意有三个的分组,即三个(.*?),这就是我们所要获取的三组内容,具体的语法规则在之前的博客已经说了,正则这一块水还很深,刚踏出一小步……compile和findall方法也提到了,注意一下参数
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。