神奇cpp

这个屌丝很懒，什么也没留下！

热门标签

热门文章

当前位置: article > 正文

rvest爬虫及案例分析_r语言rvest爬虫案例

作者：神奇cpp | 2024-07-14 13:03:30

赞

踩

r语言rvest爬虫案例

由于最近准备着学习手数据挖掘，想着先从爬取数据开始。

现做一下总结，可能需要的R包有: rvest(主要)、xml2、stringr(主要用来实现字符串处理)

一、简单介绍rvest函数

read_html() #用来下载网页
htnl_nodes() #用来标记要抓取网页元素的节点
html_attrs() #用来下在相应的网址（2，3函数单数情况也可以使用）
html_tag() #提取标签名称
html_table() #用来抓取表格
1
2
3
4
5

注：1.html_table()在网页结构比较简单的情况下比较实用链接（这个案例就可以通过html_table()轻松抓取，可以自己动手试一试）

二.以下以具体的例子来解释

1.抓取慕课网所有的课程信息

在网易云课堂看了R实战，老师演示了这个实例感觉实现的效果不好，所以自己尝试了一下

思路

- 先抓取7个大类课程的网址

- 然后抓取每一类具体的文本信息

- 用循环来实现7大类

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/神奇cpp/article/detail/824776

推荐阅读

相关标签

Copyright © 2003-2013 www.wpsshop.cn 版权所有，并保留所有权利。

闽ICP备14008679号