当前位置:   article > 正文

如何用python爬取参考文献的doi_python爬取论文参考文献

python爬取论文参考文献

阅读文章时每当看到一篇优秀的参考文献总会把持不住自己去往文章后面翻,然后找到它的名字,再去找数据库搜索并下载,如此一番,至少3分钟过去了......再回过头来继续读原来的文章,卧槽,读到哪了?!于是,慌张的小手拿起了手机,打开了抖音,嗯这是啥?我竟然没吃过!

今天课题组一位同学问我能不能直接找到这篇文章中的参考文章并下载下来,我尝试了一下,3分钟教你秒杀所有。

我以Nature Communications的一篇文章为例,Responses of plant diversity to precipitation change are strongest at local spatial scales and in drylands。本文仅供参考,出了任何问题概不负责。

希望大家仅作为学术使用,不要过度爬取,遵守网络秩序。

  1. import requests
  2. from lxml import etree
  3. url = "文章的url"
  4. resp = requests.get(url)
  5. tree = etree.HTML(resp.text)
  6. divs = tree.xpath('//*[@id="Bib1-content"]/div/ol/li')
  7. for div in divs:
  8. ref = div.xpath("./p[2]/a[1]/@href")
  9. print(ref)
  10. #上面这些可以得到文章的网站链接(图一),可以直
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/843530
推荐阅读
相关标签
  

闽ICP备14008679号