赞
踩
正则表达式
就是对 字符串
进行 过滤
的 特定字符串。
入门者会(.*)
足矣。
import re
text = u"""
<ul>
<li class="blog-unit">
<a href="/first">第一个</a>
</li>
<li class="blog-unit">
<a href="/second">第二个</a>
</li>
</ul>
"""
for url in re.findall('<a href="(.*)">', text):
print url
打印结果是:
/first
/second
for txt in re.findall('">(.*)</a>', text):
print txt
打印结果是:
第一个
第二个
版权声明:转载必须注明本文转自 East196 的博客:http://blog.csdn.net/east196
赞
踩
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。