赞
踩
Python 爬虫 爬取单个基因的生物学功能(urllib+正则表达式):
import re
import urllib
from urllib import request
url = 'https://www.ncbi.nlm.nih.gov/gene/?term=FUT1' # 查找FUT1基因的网址
response = urllib.request.urlopen(url)
content = response.read().decode('utf-8') # 对response 进行解码
print(content)
print(type(content))
p =re.findall('<td>(.*?)</td>',content) # (.*?)为正则表达式的目标区域
print('FUT1:',p[0])
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。