当前位置:   article > 正文

大数据技术Hive详解_大数据hive

大数据hive

一、Hive 概述

1、Hive 简介

Hive:由Facebook开源用于解决海量结构化日志的数据统计

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。

本质是:将HQL转化成MapReduce程序。

说明: 

  1. Hive处理的数据存储在HDFS;
  2. Hive分析数据底层的实现是MapReduce;
  3. 执行程序运行在Yarn上;

1. 分布式文件系统HDFS存储架构与原理

HDFS结构与架构:

HDFS分布式文件系统架构:

Namenode上保存着 HDFS 的名字空间。对于任何对文件系统元数据产生修改的操作, Namenode 都会使用一种称为 EditLog 的事务日志记录下来。

例如,在 HDFS 中创建一个文件, Namenode 就会在 Editlog 中插入一条记录来表示;同样地,修改文件的副本系数也将往 Editlog

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/557803
推荐阅读
相关标签
  

闽ICP备14008679号