当前位置:   article > 正文

前端页面中的爬虫

前端页面中的爬虫

浏览器前端页面中,爬取另一个页面的html并取出相关数据

          var txt = '<html><body>......</body></html>';
          var parser = new DOMParser();
          var xmlDoc = parser.parseFromString(txt, "text/html");


          var $client = $(xmlDoc.getElementsByTagName("body")[0]).find('ul.article-ul li:first');


          var id = $client.find('.wx-width:first span').text().trim();
          var rank = $client.find('.wx-rank:first span').text().trim();
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号