当前位置:   article > 正文

大数据面试题(全)【八股文】

大数据面试题(全)【八股文】

Hadoop面试题【八股文,800页】文末附百度网盘链接


全文共800页
此处篇幅有限,列出部分问题

在这里插入图片描述

Hadoop基础

Hadoop的特点?

Hadoop生态圈组件及其作用?

Hadoop主要分哪几个部分?他们有什么作用?

Hadoop 1.x,2.x,3.x的区别?

Hadoop的优缺点?

HDFS部分

HDFS文件写入和读取流程

HDFS组成架构

介绍下HDFS,说下HDFS优缺点,以及使用场景

HDFS作用

HDFS的容错机制

HDFS的存储机制

HDFS的副本机制

HDFS的常见数据格式,列式存储格式和行存储格式异同点,列式存储优点有哪些?

HDFS如何保证数据不丢失?

MapReduce部分

介绍下MapReduce

MapReduce优缺点

MapReduce架构

MapReduce工作原理

MapReduce哪个阶段最费时间

MapReduce中的Combine是干嘛的?有什么好处?

MapReduce为什么一定要有环型缓冲区

MapReduce为什么一定要有Shuffle过程

MapReduce的Shuffle过程及其优化

Reduce怎么知道去哪里拉Map结果集?

Reduce阶段都发生了什么,有没有进行分组

YARN部分

介绍下YARN

YARN有几个模块?

YARN工作机制

YARN有什么优势,能解决什么问题?

YARN容错机制

YARN高可用

YARN调度器

YARN中Container是如何启动的?

YARN的改进之处,Hadoop 3.x相对于Hadoop 2.x?

YARN监控

Zookeeper面试题

介绍下Zookeeper是什么?

Zookeeper有什么作用?优缺点?有什么应用场景?

Zookeeper的选举策略,leader和follower的区别?

介绍下Zookeeper选举算法

Zookeeper的节点类型有哪些?分别作用是什么?

Zookeeper的节点数怎么设置比较好?

Zookeeper架构?

Zookeeper的功能有哪些?

Hive面试题

说下为什么要使用Hive?Hive的优缺点?Hive的作用是什么?

说下Hive是什么?跟数据仓库区别?

Hive架构?

Hive内部表和外部表的区别?

为什么内部表的删除,就会将数据全部删除,而外部表只删除表结构?

为什么用外部表更好?

Hive建表语句?创建表时使用什么分隔符?

Hive删除语句外部表删除的是什么?

链接:https://pan.baidu.com/s/1rRR7XJ_5eAGvtnOsyQCVLA?pwd=urqj
提取码:urqj
–来自百度网盘超级会员V3的分享

添加小奥博士 vx: AI_xiaoao
一起学习交流Python学习

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/454149
推荐阅读
相关标签
  

闽ICP备14008679号