当前位置:   article > 正文

2020哔哩哔哩大数据面试题整理_b站面试题可以在网上搜吗

b站面试题可以在网上搜吗

网上能搜到的B站的大数据面试题太少了,博主有点找不到了,而且最近B站的校招的效率似乎不是很高,简历投进去一个多星期了,一点反应都没有,别问,问就是在池子里.jpg

1.数仓与关系数据库区别
    1.数据库有相对复杂的表格结构,存储结构相对紧致,少冗余数据,而数据仓库则是相对简单的表格结构,存储结构相对松散,多冗余数据。
    2.数据库在读和写两方面都有优化,数据仓库一般只是读优化
    3.数据库单次操作作用于少量的数据,数据仓库单次操作会作用于大量的数据
    4.数据库支持单条数据的修改,数据仓库不支持
    5.数据库可以和用户进行交互,数据仓库不行

2.数据仓库为什么需要分层?优缺点?
    分层原因:
        1.用空间换时间。通过建设多层次的数据模型供用户使用,避免用户直接使用操作型数据,可以更高效的访问数据
        2.把复杂问题简单化。将一个复杂的任务分解成多个步骤来完成,每一层只处理单一的步骤,比较简单和容易理解。而且便于维护数据的准确性,当数据出现问题之后,可以不用修复所有的数据,只需要从有问题的步骤开始修复
        3.便于处理业务的变化。随着业务的变化,只需要调整底层的数据。
    优点:
        高效的数据组织形式(易维护)
        面向主题的特性决定了数据仓库拥有业

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/673479
推荐阅读
相关标签
  

闽ICP备14008679号