Hive的工作原理是什么？Hive和Hadoop执行任务的流程

数据库
23年2月18日
编辑

xiawuyouke

Hive是基于Hadoop的一个数据仓库工具，主要用来对数据进行抽取、转换、加载操作。HiveQL可以将结构化的数据文件映射为一张数据表，允许熟悉SQL的用户查询数据，也允许熟悉MapReduce的开发者开发自定义的mapper和reducer来处理内建的mapper和 reducer无法完成的复杂的分析工作，相对于Java代码编写的MapReduce来说，Hive的优势更加明显。Hive利用Hadoop的HDFS存储数据，利用Hadoop的MapReduce执行查询。

Hive和Hadoop协作执行任务的工作原理

(1) 用户通过用户接口向Driver提交executeQuery。

(2) Driver向Compiler发送获取计划的请求。

(3) Compiler根据用户提交的executeQuery去MetaStore获取需要的元数据信息。

(4) MetaStore向Compiler发送元数据信息。

(5) Compiler得到元数据信息，并向Driver发送计划。

(6) Driver 向EXECUTION ENGINE提交executePlan。

(7) 用户接口向Driver发起获取结果集(fetchResults)的请求。

(8）Driver向EXECUTION ENGINE发起获取结果集的请求。

(9）EXECUTION ENGINE向Driver发送结果集，Driver获取到结果集后返回用户接口。

{{userData.name}}已认证

Hive的工作原理是什么？Hive和Hadoop执行任务的流程

TiDB中有哪些组件？（TiDB架构图解）

大数据基础：如何配置HDFS相关的Kerberos账户？

2023十大番号(2023年一月新番号大全)

黄色一级c片（一级爱c片）

中国十大贪官(中国十大最强的老虎排名)

日本大尺度电视剧（成年人必看的十部日本爱情电影）

中国十大天价烟(中国十大天价茶)

12本足以封神的经典小说（公认完结高质量的网络封神小说）

家庭乱伦电影

韩国最好看的三级女演员（演过情欲片的5位韩国女星）

日本黄色_级片（什么是日本B级片）

中国现代活佛排名前十（中国活佛有几个）

一个从阴间回来的人讲述真实经历(阴曹地府回来的故事)

星光被祖国人干第几集第几秒（祖国人第几集扣了星光）