当前位置:   article > 正文

K-means对地震数据进行处理_地震数据聚类分析

地震数据聚类分析

首先是……自用

Spark来对地震数据进行分析,经过预处理后得到各地地震数据,用这些数据进行数据分析,首先是用K-means来求地震聚类

  1. from pyspark.ml.clustering import KMeans
  2. kmeans=KMeans(k=17, seed=2147483648)
  3. from pyspark.ml.feature import VectorAssembler
  4. VectorAssembler =VectorAssembler(inputCols=["Latitude","Longitude","Year","Month", "Day"],outputCol="features")
  5. new_df=VectorAssembler.transform(df)
  6. print(new_df.head(1))
  7. model=kmeans.fit(new_df) #注意,传入的DataFrame是矢量名称为features的集合
  8. centers=model.clusterCenters() #产生聚类集合
  9. print(centers)
  10. transformed=model.transform(new_df)
  11. print(transformed.head(1))
  12. dataK = transformed.toPandas()

可视化部分

  1. figK = px.scatter_geo(dataK,
  2. color = dataK.prediction,
  3. color_continuous_scale = px.colors.sequential.Inferno,
  4. lon = dataK.Longitude,
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小桥流水78/article/detail/759312
推荐阅读
相关标签
  

闽ICP备14008679号