汇总all
编辑
临时总结
Hive 中创建表有哪几种方式,其区别是什么? 1.hive 创建表有以下几种方式 1)create tabl…
(1)Hive 中有三种 UDF:(普通)UDF、用户定义聚集函数(user-defined aggregat…
怎样对大数据集群进行有效监控?如何实现预警、报警? 1. 可以有很多方式对大数据集群进行监控 1) 可以使用 …
什么是 Hadoop 分布式缓存 1)Hadoop 分布式缓存是 Map-Reduce 框架提供的用于缓存应用…
怎么解决 MapReduce 的数据倾斜? 现象:Mapreduce 程序在运行的时候,运行了大部分,但是还有…
MapReduce 数据处理及 shuffle 的流程,以及各个阶段的先后顺序 1、Map阶段 1)读取hdf…
参考答案: 1、简述 默认情况下,Map 输出的结果会对 Key 进行默认的排序,但是有时候需要对 Key 排…
Hadoop 中通过拆分任务到多个节点运行来实现并行计算,但某些节点运行较慢会拖慢整个任务的运行,Hadoop…
Hadoop 的性能调优从哪些方面着手 一、硬件方面 二、操作系统参数调优 三、jvm 层面 四…
Hadoop 有哪些调度器?我们该如何选择? hadoop 中常用的调度器有三种: 1)FIFO:(hadoo…