189 8069 5689

HDFS的shell操作-创新互联

一:HDFS常用shell命令

专业领域包括网站设计制作、网站设计、商城网站建设、微信营销、系统平台开发, 与其他网站设计及系统开发公司不同,创新互联的整合解决方案结合了帮做网络品牌建设经验和互联网整合营销的理念,并将策略和执行紧密结合,为客户提供全网互联网整合方案。

查看filesystem shell 文档  【地址如下:】

Apache Hadoop 3.3.4 – Overview

常见的shell命令: 

二:常用命令实践操作

启动集群:

创建目录:

1.创建单层目录,执行:hdfs dfs -mkdir /ied

在Hadoop WebUI查看创建目录

2.创建多层目录,执行:hdfs dfs -mkdir /luzhou/lzy  【会报错,因为目录不存在】

注:执行:hdfs dfs -mkdir -p /luzhou/lzy,创建成功

在Hadoop WebUI查看创建目录

3.查看目录:

执行:hdfs dfs -ls /   ,查看根目录(任何节点上查看,结果都是一样的)

执行:hdfs dfs -ls /luzhou

执行:hdfs dfs -ls -R /,递归查看/目录

4.上传本地文件到HDFS

创建test.txt文件,执行:echo "hello hadoop world">test.txt

查看test.txt文件内容

上传test.txt文件到HDFS /ied目录,执行:hdfs dfs -put test.txt   /ied

查看是否上传成功,执行:hdfs dfs -ls /ied

5、查看文件内容,执行:hdfs dfs -cat /ied/test.txt

6、下载HDFS文件到本地:

先删除本地test.txt文件

下载HDFS文件系统的/ied/test.txt到本地当前目录,执行:hdfs dfs -get /ied/test.txt

检查是否下载成功

可以将HDFS上的文件下载到本地指定位置,并且可以更改文件名,执行:hdfs dfs -get /ied/test.txt /home/exam.txt

检查是否下载成功

7.删除HDFS文件,执行:hdfs dfs -rm /ied/test.txt

检查是否下载成功,执行:hdfs dfs -ls /ied/test.txt

【使用通配符,可以删除满足一定特征的文件】

8、删除HDFS目录,执行:hdfs dfs -rmdir /luzhou

注:

-rmdir删除不了非空目录

要递归删除才能删除非空目录:hdfs dfs -rm -r /luzhou  (-r:recursive)

删除空目录 /BigData,执行:hdfs dfs -rmdir /BigData

9、移动目录或文件

注:-mv命令有移动和改名双重功能,将/ied目录更名为/ied01,执行:hdfs dfs -mv /ied /ied01

利用Hadoop WebUI界面查看更名是否成功

/ied01/exam.txt更名为/ied/test.txt,执行命令:hdfs dfs -mv /ied01/exam.txt /ied01/test.txt

查看改名后的文件内容

10、文件合并下载:

在/ied01中,创建sport.txt和music.txt并上传

合并/ied01目录文件下载到本地当前目录的merger.txt,执行:hdfs dfs -getmerge /ied01/*merger.txt

查看本地merger.txt,是否是三个文件合并后的内容

11、检查文件信息:

检查文件test.txt,执行:hdfs fsck /ied01/test.txt -files -blocks -locations -racks

HDFS里一个文件块是128MB,上传一个大于128MB的文件,hadoop-3.3.4.tar.gz大约663.24MB

128 M B × 5 = 640 M B< 663.24 M B< 768 M B = 128 M B × 6 128 MB\times 5 = 640MB \lt 663.24MB \lt 768MB = 128 MB\times 6128MB×5=640MB<663.24MB<768MB=128MB×6 ,HDFS会将hadoop-3.3.4.tar.gz分割成6块。

执行:hdfs dfs -put /opt/hadoop-3.3.4.tar.gz /ied01,将Hadoop压缩包上传到HDFS中/ied01目录

查看HDFS 上hadoop文件信息,执行:hdfs fsck /ied01/hadoop3.3.4tar.gz -files -locations -racks

在HadoopWebUI查看文件块信息更加方面,总共6个文件块

12、创建时间戳文件

执行:hdfs dfs -touchz /ied01/sunsheine.txt     在/ied01目录里创建一个文件

界面查看,为空文件,大小为0字节

注:这种空文件,作为表示文件,也可叫做时间戳文件,并再次在/ied01目录下创建sunshine.txt同名文件

注:

如果touchz命令的路径指定的文件不存在,那就创建一个空文件;如果指定的文件存在,那就改变该文件的时间戳。

13、复制文件或目录

创建/ied02目录

1、同名复制文件

【执行:hdfs dfs -cp /ied01/music.txt /ied02    ,将/ied01/music.txt复制到/ied02中】

查看拷贝成功文件

2、改名复制文件

【执行:hdfs dfs -cp /ied01/exam.txt /ied02/hello.txt   将/ied01/test.txt复制到/ied02目录】

3、复制目录

执行:hdfs dfs -cp /ied01/ied03 ,  将/ied01目录复制到/ied03目录

查看拷贝成功后的目录

查看文件大小,执行:hdfs dfs -du /ied01/test.txt

注:看到文件大小是19字符,包含一个看不见结束符

14、上传文件

执行:hdfs dfs -copyFromLocal merger.txt /ied02        【-copyFromLocal 类似于-put】

查看是否上传成功

15、下载文件

执行:hdfs dfs -copyToLocal /ied01/sunshine.txt  【-copyToLocal类似于-get】

查看是否下载成功

16、查看某目录下文件个数,执行:hdfs dfs -count /ied01

17、检查Hadoop本地库,执行:hdfs checknative -a

查看Hadoop本地库文件

18、进入和退出安全模式

1、进入安全模式,执行:hdfs dfsadmin -safemode enter 

注:

进入安全模式后,只读不写

此时创建目录将会报错

2、退出安全模式,执行:hdfs dfsadmin -safemode leave

此时,创建将不会存在问题

你是否还在寻找稳定的海外服务器提供商?创新互联www.cdcxhl.cn海外机房具备T级流量清洗系统配攻击溯源,准确流量调度确保服务器高可用性,企业级服务器适合批量采购,新人活动首月15元起,快前往官网查看详情吧


文章题目:HDFS的shell操作-创新互联
网站URL:http://cdxtjz.cn/article/dpsidh.html

其他资讯