当前位置:   article > 正文

计算机毕业设计师hadoop+spark+hive知识图谱医生推荐系统 医生数据分析可视化大屏 医生爬虫 医疗可视化 医生大数据 机器学习 大数据毕业设计

计算机毕业设计师hadoop+spark+hive知识图谱医生推荐系统 医生数据分析可视化大屏 医生爬虫 医疗可视化 医生大数据 机器学习 大数据毕业设计

流程:
1.Python爬虫采集中华健康网约10万医生数据,最终存入mysql数据库;
2.使用pandas+numpy/hadoop+mapreduce对mysql中的医生数据进行数据分析,使用高德地图解析地理位置,并将结果转入.csv文件同时上传到hdfs文件系统;
3.使用hive建库建表,导入.csv数据集;
4.一半指标使用离线数仓hive_sql分析,一半指标使用实时数仓实时计算Spark之Scala实现;
5.使用sqoop将分析指标导入mysql数据库
6.使用Flask+echarts实现可视化大屏界面;
创新点:高德地图解析地理位置、海量医生数据、Python爬虫、炫酷可视化大屏
选装:可选装知识图谱、推荐系统、预测系统、后台管理等

核心算法代码分享如下:

  1. package com.bigdata.storm.kafka.util;
  2. import redis.clients.jedis.Jedis;
  3. import redis.clients.jedis.JedisPool;
  4. import redis.clients.jedis.JedisPoolConfig;
  5. /**
  6. * @program: storm-kafka-api-demo
  7. * @description: redis工具类
  8. * @author: 小毕
  9. * @company: 清华大学深圳研究生院
  10. * @create: 2019-08-22 17:23
  11. */
  12. public class JedisUtil {
  13. /*redis连接池*/
  14. private static JedisPool pool;
  15. /**
  16. *@Description: 返回redis连接池
  17. *@Param:
  18. *@return:
  19. *@Author: 小毕
  20. *@date: 2019/8/22 0022
  21. */
  22. public static JedisPool getPool(){
  23. if(pool==null){
  24. //创建jedis连接池配置
  25. JedisPoolConfig jedisPoolConfig = new JedisPoolConfig();
  26. //最大连接数
  27. jedisPoolConfig.setMaxTotal(20);
  28. //最大空闲连接
  29. jedisPoolConfig.setMaxIdle(5);
  30. pool=new JedisPool(jedisPoolConfig,"node03.hadoop.com",6379,3000);
  31. }
  32. return pool;
  33. }
  34. public static Jedis getConnection(){
  35. return getPool().getResource();
  36. }
  37. /* public static void main(String[] args) {
  38. //System.out.println(getPool());
  39. //System.out.println(getConnection().set("hello","world"));
  40. }*/
  41. }

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/木道寻08/article/detail/771543
推荐阅读
相关标签
  

闽ICP备14008679号