赞
踩
这里有一份完整版的复习资料以及近四年的详细真题回忆版,还有一些学长学姐整理的材料统一汇总了一下。
山东大学数据科学导论复习资料以及历年期末近4年真题回忆版
一、简答
1.大数据处理的全生命周期,以疫情监控的大数据应用为例
2.(1)探索性数据分析的定义(2)比较eda与传统数据分析的差异
3.为什么传统的RDB不适用于web2.0数据管理了
二、设计
1.MapReduce 自然连接 写出Map和Reduce的函数
2.Redis存粉丝是通过Redis (1)简述这样存储的优点 (2)当粉丝表为zSet时,设计索引可以查询某ID是否为粉丝
三、计算
1.TF-IDF计算 选择关键词
2.
(1)画二分图
(2)判断给alice推荐的歌曲 用personalrank验证
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。