当前位置:   article > 正文

python数据模块类如何定义_save_data怎么用

save_data怎么用

python数据模块类如何定义

说明

1、定义数据模块类,名为DataLoader。

2、类中有核心变量data用于保存爬行数据,以及两个相关界面grab_data(爬取数据)和save_data(保存数据到当地)。

实例

grab_data() 的核心代码

JavaScript

  1. def grab_data(self):
  2. # 获取入口链接
  3. entries = self.get_entry()
  4. # 遍历入口链接,解析得到文章链接
  5. links = self.parse4links(entries)
  6. # 遍历文章链接,解析得到文章内容
  7. datas = self.parse4datas(links)
  8. # 将相关数据写入变量 data
  9. self.data = pd.DataFrame(datas)

save_data() 的核心代码

JavaScript

  1. def save_data(self):
  2. # 将变量 data 写入 csv 文件
  3. self.data.to_csv(self.data_path, index = None)

我们已经爬取并保存好数据 data,数据以 DataFrame 形式存储,保存在 csv 文件,格式如下:

JavaScript

  1. |---------------------------------------------------|
  2. | id | link | cont | title |
  3. |---------------------------------------------------|
  4. | page id | page link | page content | page title |
  5. |---------------------------------------------------|
  6. | ...... | ...... | ...... | ...... |
  7. |---------------------------------------------------|

以上就是python数据模块类定义的方法,希望对大家有所帮助。

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/455064
推荐阅读
相关标签
  

闽ICP备14008679号