Hadoop目录详解:

1. tmp目录:主要用作mapreduce操作期间的临时存储。 Mapreduce工件,中间数据等将保存在该目录下。 mapreduce作业执行完成后,这些文件将自动清除。如果删除此临时文件,则可能会影响当前正在运行的mapreduce作业
2. sbin目录:存放启动或停止hadoop相关服务的脚本
3. bin目录:存放对hadoop相关服务(HDFS,YARN)进行操作的脚本
4. etc目录:hadoop的配置文件目录,存放hadoop的配置文件
5. share目录:存放hadoop的依赖jar包和文档,文档可以被删除掉
6. lib目录:存放hadoop的本地库(对数据进行压缩解压缩功能)
7. log目录:NameNode、DataNode、ResourceManage 等系统自带的服务输出来的日志默认是存放在 ${HADOOP_HOME}/logs 目录下
8. include目录:对外提供的编程库头文件(具体的动态库和静态库在lib目录中),这些文件都是用C++定义的,通常用于C++程序访问HDFS或者编写MapReduce程序。
9. lib目录:包含了Hadoop对外提供的编程动态库和静态库,与include目录中的头文件结合使用。
 10.libexec目录:各个服务对应的shell配置文件所在的目录,可用于配置日志输出目录、启动参数(比如JVM参数)等基本信息。