赞
踩
网上能搜到的B站的大数据面试题太少了,博主有点找不到了,而且最近B站的校招的效率似乎不是很高,简历投进去一个多星期了,一点反应都没有,别问,问就是在池子里.jpg
1.数仓与关系数据库区别
1.数据库有相对复杂的表格结构,存储结构相对紧致,少冗余数据,而数据仓库则是相对简单的表格结构,存储结构相对松散,多冗余数据。
2.数据库在读和写两方面都有优化,数据仓库一般只是读优化
3.数据库单次操作作用于少量的数据,数据仓库单次操作会作用于大量的数据
4.数据库支持单条数据的修改,数据仓库不支持
5.数据库可以和用户进行交互,数据仓库不行
2.数据仓库为什么需要分层?优缺点?
分层原因:
1.用空间换时间。通过建设多层次的数据模型供用户使用,避免用户直接使用操作型数据,可以更高效的访问数据
2.把复杂问题简单化。将一个复杂的任务分解成多个步骤来完成,每一层只处理单一的步骤,比较简单和容易理解。而且便于维护数据的准确性,当数据出现问题之后,可以不用修复所有的数据,只需要从有问题的步骤开始修复
3.便于处理业务的变化。随着业务的变化,只需要调整底层的数据。
优点:
高效的数据组织形式(易维护)
面向主题的特性决定了数据仓库拥有业
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。