当前位置:   article > 正文

空间数据分析与r语言实践_R语言空间数据分析(一):总论

空间数据分析与r语言实践

作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量、机器学习、数据可视化、应用统计建模、知识图谱等,著有《R语言高效数据处理指南》(《R语言数据高效处理指南》(黄天元)【摘要 书评 试读】- 京东图书)。知乎专栏:R语言数据挖掘邮箱:huang.tian-yuan@qq.com.欢迎合作交流。

HopeR:R语言空间数据分析(零):总目录​zhuanlan.zhihu.com

最近对空间分析比较感兴趣,所以准备开始系统学习一下R中的空间数据挖掘。国外资料已经非常多,知难行易,一点一点夯实基础。主要资料如下:

CASA0005 Geographic Information Systems and Science

Spatial Data Science

Geocomputation with R

Geodesic geometry

下面做一个简单的上手案例,就是读取shape格式文件,然后进行观察和可视化。一般来说,shape格式文件需要有三个文件,才能够成为一个完整的整体(分别是".shp", ".shx"与 ".dbf"文件,具体参考shapefile文件_百度百科)。我们演示的原始文件来自于:https://github.com/andrewmaclachlan/CASA0005repo/tree/master/prac10_data/statistical-gis-boundaries-london/ESRI,分别是以下3个文件:

94752109fb6a8115d2b78b1cb27d0453.png

我把它们放在data目录下,实现代码如下:

  1. library(pacman)
  2. p_load(sf)
  3. shape <- st_read("data/London_Borough_Excluding_MHW.shp")

这样,就可以把shape格式的文件读入到R中,现在放到shape变量中了。它本质上是一个带有元信息的数据框,可以用summary来观察它的数据结构:

summary(shape)

455494c015d59f0ad106a4145cca6af9.png

同时可以进行可视化:

plot(shape)

58e2c0affabec1f30bccdac414b07017.png

我们可以看到,如果是分类变量,那么就会利用不同的离散颜色做区分;如果是数值变量,则会自动调用冷暖色调来做数值区分。此外,如果属性中只有缺失值,那么地理空间中将会是一片空白(如SUB_2009)。我们也可以只提取其地理属性(边界),然后进行可视化:

  1. shape %>%
  2. st_geometry() %>%
  3. plot()

61d3475e62e77b80060b6eca75c6e31b.png

tmap包提供了较好的可视化功能,不过包的加载可能会花费一些时间。比如,我们来对HECTARES变量进行可视化:

  1. p_load(tmap)
  2. tmap_mode("plot")
  3. qtm(shape,fill = "HECTARES")

effae12e01f6637df50adf0803f53b50.png

这里图例位置显然安排不合理,但是以后再来提如何修改这些细节。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/66156
推荐阅读
相关标签
  

闽ICP备14008679号