hive面试题及答案？-招聘街

一、hive面试题及答案？

1、你觉得你个性上最大的优点是什么？

回答提示：沉着冷静、条理清楚、立场坚定、顽强向上。

乐于助人和关心他人、适应能力和幽默感、乐观和友爱。我在北大青鸟经过一到两年的培训及项目实战，加上实习工作，使我适合这份工作。我相信我能成功。

2、说说你最大的缺点？

回答提示：这个问题企业问的概率很大，通常不希望听到直接回答的缺点是什么等，如果求职者说自己小心眼、爱忌妒人、非常懒、脾气大、工作效率低，企业肯定不会录用你。绝对不要自作聪明地回答“我最大的缺点是过于追求完美”，有的人以为这样回答会显得自己比较出色，但事实上，他已经岌芨可危了。企业喜欢求职者从自己的优点说起，中间加一些小缺点，最后再把问题转回到优点上，突出优点的部分。企业喜欢聪明的求职者。

3、你对加班的看法？

回答提示：实际上好多公司问这个问题，并不证明一定要加班。只是想测试你是否愿意为公司奉献。

回答样本：如果是工作需要我会义不容辞加班。我现在单身，没有任何家庭负担，可以全身心的投入工作。但同时，我也会提高工作效率，减少不必要加班。

二、hive定义？

hive是基于Hadoop的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。

hive数据仓库工具能将结构化的数据文件映射为一张数据库表，并提供SQL查询功能，能将SQL语句转变成MapReduce任务来执行。Hive的优点是学习成本低，可以通过类似SQL语句实现快速MapReduce统计，使MapReduce变得更加简单，而不必开发专门的MapReduce应用程序。hive十分适合对数据仓库进行统计分析。

三、hive函数？

扩展hive函数案列以及解释

1.rand()；

rand(int sedd)取随机数返回值为double类型说明:返回一个0到1范围内的随机数。如果指定种子seed，则会等到一个稳定的随机数序列

2.round(double n,a) ：

对输入的n数，保留a位小数，四舍五入， round(double a) 四舍五入

3.ceil：

向上取整 select ceil(45.6); --46

4.floor：

向下取整 select floor(45.6); --45

5.split(str,spliter) :

对字符串str 根据字符spliter切割 hive> select split("a,d,c",","); ["a","d","c"]

四、HIVE是什么？

hive是基于Hadoop的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。

五、hive的定义？

hive 是基于 hadoop 的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在 hadoop 中的大规模数据的机制。

hive 数据仓库工具能将结构化的数据文件映射为一张数据库表，并提供 SQL 查询功能，能将 SQL 语句转变成 MapReduce 任务来执行。

六、hive工作机制？

hive是基于Hadoop的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。

hive数据仓库工具能将结构化的数据文件映射为一张数据库表，并提供SQL查询功能，能将SQL语句转变成MapReduce任务来执行

七、Hive是什么？

hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能，可以将sql语句转换为MapReduce任务进行运行。

其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。

八、hive的优缺点？

优点

简单容易上手:提供了类SQL查询语言HQL

可扩展:为超大数据集设计了计算/扩展能力(MR作为计算引擎,HDFS作为存储系统) 一般情况下不需要重启服务Hive可以自由的扩展集群的规模。

提供统一的元数据管理

延展性:Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数

缺点

没有

九、kudu和hive区别？

kudu: 中文名：扭角林羚（拼音：niǔ jiǎo lín líng）；英文名：Greater kudu；学名：Tragelaphus strepsiceros。扭角林羚，又名大旋角羚、大弯角羚及大扭角条纹羚，是东非及非洲南部的羚羊。

hive:蜂巢，蜂窩；蜂群

十、hive相对clickhouse优势？

Hive相对于ClickHouse的优势主要在于：

1. SQL支持：Hive是基于Hadoop的分布式数据仓库，它提供了类SQL语言HiveQL,可以方便地进行数据分析和查询。而ClickHouse则专注于实时查询，它的查询语言ClickHouse Query是基于列式存储的。

2. 数据量处理：Hive适合处理大规模数据集，因为它是基于MapReduce的分布式计算框架，可以在集群上并行处理海量数据。而ClickHouse则更适合处理小到中等规模的数据集，因为它的设计是为了在单个节点上高效查询。

3. 功能支持：Hive提供了很多高级特性，如分区、桶、合并、重写等，使得用户可以更加灵活地处理数据。而ClickHouse则专注于高性能和实时查询，对于一些高级特性的支持相对较少。

4. 生态系统：Hive拥有丰富的生态系统，包括各种开源工具和库，如Pig、Mahout、Spark等。这些工具可以帮助用户更好地利用Hive进行数据分析和处理。而ClickHouse则相对较新，生态系统还不够完善。

总之，Hive适合处理大规模数据集和高级分析需求，而ClickHouse则更适合实时查询和小型数据集处理。选择哪种工具取决于具体的业务需求和数据规模。

hive面试题及答案？

一、hive面试题及答案？

二、hive定义？

三、hive函数？

四、HIVE是什么？

五、hive的定义？

六、hive工作机制？

七、Hive是什么？

八、hive的优缺点？

九、kudu和hive区别？

十、hive相对clickhouse优势？

相关资讯

热门频道

最新发布

热门排行