当前位置:   article > 正文

Python 爬虫 爬取单个基因 表格数据的生物学功能 (urllib+正则表达式):_基因数据正则表达式

基因数据正则表达式

Python 爬虫 爬取单个基因的生物学功能(urllib+正则表达式):

import re
import urllib
from urllib import request
url = 'https://www.ncbi.nlm.nih.gov/gene/?term=FUT1'   #  查找FUT1基因的网址
response = urllib.request.urlopen(url)
content = response.read().decode('utf-8')   #  对response  进行解码
print(content)
print(type(content))
p =re.findall('<td>(.*?)</td>',content)     #  (.*?)为正则表达式的目标区域
print('FUT1:',p[0])
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/202160
推荐阅读
相关标签
  

闽ICP备14008679号