hdfs的客户端有多种形式:
1、网页形式
2、命令行形式
3、客户端在哪里运行,没有约束,只要运行客户端的机器能够跟hdfs集群通信即可
文件的切块大小和存储的副本数量,都是由客户端决定!
所谓的由客户端决定,是通过配置参数来定的
hdfs的客户端会读以下两个参数,来决定切块大小、副本数量:
切块大小的参数: dfs.blocksize
副本数量的参数: dfs.replication
这两个配置文件只对客户端起作用,上传文件的时候,副本数量和文件的块大小,就是由则这两个参数决定的。
命令行操作hdfs
准备任意一台机器,上面放一个hadoop安装目录
然后,配置hadoop-env.sh,添加JAVA_HOME
然后,配置core-site.xml,写一个参数fs.defaultFS:值为hdfs集群的uri
(hdfs://hdp-01:9000)
然后,用安装目录中的hadoop命令即可启动hdfs的命令行客户端
hdfs命令行客户端的所有命令列表
Usage: hadoop fs [generic options]
[-appendToFile … ] 同时上传多个文件到HDFS
[-cat [-ignoreCrc] …] 查看文件内容
[-checksum …] //校验完整性?不清楚这个
[-chgrp [-R] GROUP PATH…] 修改文件所属组
[-chmod [-R] 《MODE[,MODE]… | OCTALMODE> PATH…] 修改文件权限
[-chown [-R] [OWNER][:[GROUP]] PATH…] 修改文件所有者及组
[-copyFromLocal [-f] [-p] [-l] [-d] … ] 本地copy文件到hdfs=上传
[-copyToLocal [-f] [-p] [-ignoreCrc] [-crc] … ] 从hdfs copy文件到本地=下载
[-count [-q] [-h] [-v] [-t []] [-u] [-x] …] 统计文件及文件夹数目
[-cp [-f] [-p | -p[topax]] [-d] … ] 拷贝
[-createSnapshot []] 创建快照(数据备份)
[-deleteSnapshot ] 删除快照
[-df [-h] [ …]] 磁盘空间大小
[-du [-s] [-h] [-x] …] 文件夹/文件总大小
[-expunge] 清空回收站(文件被删除时会移到临时目录.Trash/中,当超过延迟时间之后,文件才会被永久删除)
[-find … …] 查询
[-get [-f] [-p] [-ignoreCrc] [-crc] … ] 下载
[-getfacl [-R] ] 查看ACL(访问权限组拥有者)
[-getfattr [-R] {-n name | -d} [-e en] ] 显示文件扩展名
[-getmerge [-nl] [-skip-empty-file] ] 合并多个文件下载
[-help [cmd …]] 帮助。。。
[-ls [-C] [-d] [-h] [-q] [-R] [-t] [-S] [-r] [-u] [ …]] 查看目录。。。
[-mkdir [-p] …] 创建文件夹
[-moveFromLocal … ] 本地移动文件到hdfs
[-moveToLocal ] 从hdfs移动文件到本地
[-mv … ] hdfs内移动
[-put [-f] [-p] [-l] [-d] … ] 上传
[-renameSnapshot ] 重命名快照
[-rm [-f] [-r|-R] [-skipTrash] [-safely] …] 删除文件/文件夹
[-rmdir [–ignore-fail-on-non-empty]
…] 递归删除
[-setfacl [-R] [{-b|-k} {-m|-x } ]|[–set ]] 设置ACL
[-setfattr {-n name [-v value] | -x name} ] 设置扩展名
[-setrep [-R] [-w] …] 设置副本数
[-stat [format] …] 显示文件统计信息
[-tail [-f] ] 查看文件尾部信息
[-test -[defsz] ] 查看文件信息(-e PATH是否存在,-z 文件是否为空,-d 是否为目录)
[-text [-ignoreCrc] …] 产看文件内容
[-touchz …] 创建空文件
[-truncate [-w] …] 文件尾部截断
[-usage [cmd …]] 显示给定命令或所有命令用法,对比help不含说明文档
其中常用的
1、查看hdfs中的目录信息
hadoop fs -ls /hdfs路径
hadoop fs -ls /bbb/xxx/
hadoop fs -ls -R / ##递归显示指定路径下的所有文件和文件夹信息
2、上传文件到hdfs中
hadoop fs -put test.txt /
hadoop fs -copyFromLocal test.txt /test.txt.2
copyFromLocal等价于 put
hadoop fs -moveFromLocal /本地文件 /hdfs路径 ## 跟copyFromLocal的区别是:从本地移动到hdfs中
3、下载文件到客户端本地磁盘
hadoop fs -get /hdfs中的路径 /本地磁盘目录
hadoop fs -copyToLocal /hdfs中的路径 /本地磁盘路径 ## 跟get等价
hadoop fs -get /test.txt.2
hadoop fs -copyToLocal /test.txt.2
4、在hdfs中创建文件夹
hadoop fs -mkdir /aaa
hadoop fs -mkdir -p /bbb/xxx
5、拷贝文件
hadoop fs -cp /test.txt /bbb/
6、移动hdfs中的文件(更名)
hadoop fs -mv /test.txt.2 /test.txt.3
hadoop fs -mv /test.txt.3 /bbb/test.txt.4
7、删除hdfs中的文件或文件夹
hadoop fs -rm -r /aaa
8、追加内容到已存在的文件
hadoop fs -appendToFile /本地文件 /hdfs中的文件
9、显示文本文件的内容
hadoop fs -cat /test.txt
hadoop fs -tail /test.txt
10、下载多个文件在本地生成一个合并文件
hadoop fs -getmerge /test/*.dat ./xx.dat
11、修改文件的权限
hadoop fs -chown user:group /aaa
hadoop fs -chmod 700 /aaa
使用java api操作hdfs文件
这里采用的windows运程连接集群
jar:hadoop安装包中找到common和hdfs下的lib内的jar
public class hdfs {
FileSystem fs;
@Before
public void start() throws IOException, InterruptedException, URISyntaxException {//创建连接,为了获取root权限,有三种方式
//1,假装自己是root用户,在vm参数里添上-DHADOOP_USER_NAME=root
//2,假装自己是root用户,在系统变量设置用户名为root
/*
Configuration conf = new Configuration();
//需要指定hdfs文件系统,同时指定namenode所在的机器
conf.set("fs.defaultFS", "hdfs://hdp-01:9000"); fs.defaultFS
//指定用户名,注意是System
System.setProperty("HADOOP_USER_NAME", "root");
fs= FileSystem.get(conf);
*/
//直接在连接时指定用户名
Configuration conf = new Configuration();
conf.set("dfs.replication", "2");
conf.set("dfs.blocksize","64m");
fs= FileSystem.get(new URI("hdfs://hdp-01:9000"),conf,"root");
}
//上传
@Test
public void put() throws IOException {//覆盖上传
Path src = new Path("G:/result2.txt");
Path dst = new Path("/test");
fs.copyFromLocalFile(src, dst);
}
//下载
@Test
public void load() throws IOException {//覆盖上传
Path src = new Path("G:/result2.txt");
Path dst = new Path("/test/result.txt");
fs.copyToLocalFile(dst, src);
}
//新建文件夹
@Test
public void add() throws Exception {
fs.mkdirs(new Path("/path"));
}
//删除文件或文件夹,bollean代表是否递归删除
@Test
public void delete() throws IOException {
fs.delete(new Path("/result.txt"),true);
}
//修改文件
@Test
public void update() throws Exception {
FSDataOutputStream append = fs.append(new Path("/result2.txt"));//追加 >>
//FSDataOutputStream append = fs.create(new Path("/result2.txt"));//覆盖 > 其实是创建新文件 echo "" > xxx
//FSDataOutputStream append = fs.create(new Path("/result2.txt"),false);//设置为不覆盖,如果文件已存在,将运行失败
append.write("王八蛋黄鹤".getBytes("utf-8"));
append.close();
fs.close();
}
//读文件
@Test
public void show()throws Exception {
FSDataInputStream inputStream = fs.open(new Path("/result2.txt"));
byte[] b = new byte[1024] ;
int len=0;
while((len=inputStream.read(b))>0) {
String str = new String(b);
System.out.println(str);
}
inputStream.close();
fs.close();
}
//移动和重命名
@Test
public void move() throws Exception {
fs.rename(new Path("/test/result.txt"), new Path("/result2.txt"));
}
//判断是否存在
@Test
public void testExist() throws Exception{
boolean exists = fs.exists(new Path("/result2.txt"));
System.out.println(exists);
}
// 随机读文件
@Test
public void randomRead() throws Exception{
FSDataInputStream open = fs.open(new Path("/result2.txt"));
open.seek(2);
byte [] buff = new byte [10];
open.read(buff);
System.out.println(new String(buff));
}
// 查看文件的相关信息
@Test
public void testLisFile() throws Exception{
RemoteIterator<LocatedFileStatus> listFiles = fs.listFiles(new Path("/"), true);//true表示递归
while (listFiles.hasNext()) {
LocatedFileStatus file = listFiles.next();//文件信息
System.out.println("最后访问时间:"+new Date(file.getAccessTime()));//不算本次
System.out.println("块大小:"+file.getBlockSize());
System.out.println("文件路径:"+file.getPath());
System.out.println("副本数量:"+file.getReplication());
System.out.println("文件所有者"+file.getOwner()+"所属的组"+file.getGroup());
BlockLocation[] blockLocation = file.getBlockLocations();
System.out.println("---文件块信息----");
for (BlockLocation blk: blockLocation ) {
System.out.println("---块大小="+blk.getLength());
System.out.println("块所在的节点:"+Arrays.toString(blk.getHosts()));
System.out.println("块的起始偏移量:"+blk.getOffset());
}
System.out.println("----------------------");
}
}
//查看文件夹的相关信息
@Test
public void testListStatus() throws Exception{
FileStatus[] listStatus = fs.listStatus(new Path("/"));
for (FileStatus fss : listStatus) {
System.out.println("路径:"+fss.getPath());
System.out.println(fss.isFile()?"是文件":"是目录");
System.out.println("块大小参数:"+fss.getBlockSize());
}
}
//复制
@Test
public void copy() {//貌似不支持,似乎也不需要
}
}