一、ceph简介
- ceph被称作面向未来的存储,
- 可以实现的存储方式:
- 块存储:提供像普通硬盘一样的存储,为使用者提供“硬盘”
- 文件系统存储:类似于NFS的共享方式,为使用者提供共享文件夹
- 对象存储:像百度云盘一样,需要使用单独的客户端
ceph的构成
- Ceph OSD 守护进程: Ceph OSD 用于存储数据。此外,Ceph OSD 利用 Ceph 节点的 CPU、内存和网络来执行数据复制、纠删代码、重新平衡、恢复、监控和报告功能。存储节点有几块硬盘用于存储,该节点就会有几个osd进程。
- Ceph Mon监控器: Ceph Mon维护 Ceph 存储集群映射的主副本和 Ceph 存储群集的当前状态。监控器需要高度一致性,确保对Ceph 存储集群状态达成一致。维护着展示集群状态的各种图表,包括监视器图、 OSD 图、归置组( PG )图、和 CRUSH 图。
- MDSs: Ceph 元数据服务器( MDS )为 Ceph 文件系统存储元数据。
- RGW:对象存储网关。主要为访问ceph的软件提供API接口。
二、环境准备
创建4台虚拟机,配置好ip及yum,关闭selinux,firewalld,node[1..3]分别配置2块20G的硬盘
主机名 IP地址
node1 192.168.4.11/24
node2 192.168.4.12/24
node3 192.168.4.13/24
client1 192.168.4.10/24
三、ceph集群搭建步骤
一、ceph为我们提供了一个ceph-deploy工具,可以在某一节点上统一操作全部节点
将Node1作为部署节点,将来的操作都在node1上进行,node1配置免密登录及所有主机配置域名解析:
[root@node1 ~]# ssh-keygen # 生成密钥对
[root@node1 ~]# for i in {10..13}
> do
> ssh-copy-id 192.168.4.$i
> done # 在所有的主机上配置名称解析。注意,解析的名字必须是该机器的主机名
[root@node1 ~]# vim /etc/hosts # 增加4行
... ...
192.168.4.10 client1
192.168.4.11 node1
192.168.4.12 node2
192.168.4.13 node3
[root@node1 ~]# for i in 10 12 13
> do
> scp /etc/hosts 192.168.4.$i:/etc/
> done
二、配置ceph集群所需安装包
# 在3个节点上安装软件包
[root@node1 ~]# for i in node{1..3}
> do
> ssh $i yum install -y ceph-mon ceph-osd ceph-mds ceph-radosgw
> done
安装结束后,最好再在三台虚拟机上再次 yum install -y ceph-mon ceph-osd ceph-mds ceph-radosgw确保已经安装,防止后续报错
三、配置client1为ntp服务器、node1-3成为client1的NTP客户端
(1)client1搭建ntp服务器:
root@client1 ~]# yum install -y chrony
[root@client1 ~]# vim /etc/chrony.conf
29 allow 192.168.4.0/24 # 授权192.168.4.0/24可以时钟同步
33 local stratum 10 # 即使没有从一个源同步时钟,也为其他主机提供时间
[root@client1 ~]# systemctl restart chronyd
(2)node1-3成为客户端
[root@node1 ~]# for i in node{1..3}
> do
> ssh $i yum install -y chrony
> done
[root@node1 ~]# vim /etc/chrony.conf # 只改第7行
7 server 192.168.4.10 iburst # 替换gateway
[root@node1 ~]# for i in node{2..3}
> do
> scp /etc/chrony.conf $i:/etc/
> done
[root@node1 ~]# for i in node{1..3}
> do
> ssh $i systemctl restart chronyd
> done 验证时间是否同步 client1前面有^*表示同步成功
[root@node1 ~]# chronyc sources -v
四、在node1上安装ceph-deploy部署工具,同时创建ceph工作目录ceph-deploy
yum install -y ceph-deploy
[root@node1 ~]# yum install -y ceph-deploy
[root@node1 ~]# mkdir ceph-cluster
[root@node1 ~]# cd ceph-cluster
五、创建一个新的集群,包含(node1-node3),并修改配置文件
[root@node1 ceph-cluster]# ceph-deploy new node{1..3}
[root@node1 ceph-cluster]# ls
ceph.conf ceph-deploy-ceph.log ceph.mon.keyring
[root@node1 ceph-cluster]# tree .
.
├── ceph.conf # 集群配置文件
├── ceph-deploy-ceph.log # 日志文件
└── ceph.mon.keyring # 共享密钥
修改配置文件,开启块存储快照功能,此步非常之重要!!!
root@node1 ceph-cluster]# vim ceph.conf # 尾部追加一行如下
rbd_default_features = 1
六、初始化monitor及查看集群状态(三台机器已成为1个ceph)
[node1 ceph-cluster]# ceph-deploy mon create-initial查看集群状态ceph -s
health HEALTH_ERR # 因为还没有硬盘
常见错误:装包不全、虚拟机内存不够,如果安装过程中出现keyring...这种报错,可执行命令 ceph-deploy gatherkeys node{1..3},执行该命令后,所有ceph相关安装包必须重新安装!
七、创建OSD(分区表及分区)
(1)初始化各主机硬盘(做成gpt分区表)
# 初始化各主机的硬盘。vmware应该是sdb和sdc,硬盘根据实际情况名称,可lsblk命令查看
[root@node1 ceph-cluster]# ceph-deploy disk zap node1:vdb node1:vdc
[root@node1 ceph-cluster]# ceph-deploy disk zap node2:vdb node2:vdc
[root@node1 ceph-cluster]# ceph-deploy disk zap node3:vdb node3:vdc
(2)创建存储空间(分区)
ceph会硬盘分为两个分区,一个分区大小为5GB,用于保存ceph的内部资源;另一个分区是剩余全部空间
[root@node1 ceph-cluster]# ceph-deploy osd create node1:vd{b,c}
[root@node1 ceph-cluster]# lsblk
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
vda 253:0 0 30G 0 disk
└─vda1 253:1 0 30G 0 part /
vdb 253:16 0 20G 0 disk
├─vdb1 253:17 0 15G 0 part /var/lib/ceph/osd/ceph-0
└─vdb2 253:18 0 5G 0 part
vdc 253:32 0 20G 0 disk
├─vdc1 253:33 0 15G 0 part /var/lib/ceph/osd/ceph-1
└─vdc2 253:34 0 5G 0 part
# 将会出现2个osd进程,因为有两块硬盘用于ceph
[root@node1 ceph-cluster]# systemctl status ceph-osd*# 继续初始化其他节点的OSD
[root@node1 ceph-cluster]# ceph-deploy osd create node2:vd{b,c}
[root@node1 ceph-cluster]# ceph-deploy osd create node3:vd{b,c}
(3)查看集群状态 ceph -s
health HEALTH_OK ,一切正常
行文至此,一个ceph集群已搭建完毕,接下来浅谈其运用
四、ceph集群运用
前文已经提到ceph可以实现的存储方式:
–块存储:提供像普通硬盘一样的存储,为使用者提供“硬盘”
–文件系统存储:类似于NFS的共享方式,为使用者提供共享文件夹
–对象存储:像百度云盘一样,需要使用单独的客户端
(一)ceph-块存储
1.1块存储介绍:
块存储,就是可以提供像硬盘一样的设备。使用块存储的节点,第一次连接块设备,需要对块设备进行分区、格式化,然后挂载使用。ceph提供存储时,需要使用存储池。为了给客户端提供存储资源,需要创建名为存储池的容器。存储池类似于逻辑卷管理中的卷组。卷组中包含很多硬盘和分区;存储池中包含各节点上的硬盘。
1.2快存储使用
存储池查看ceph osd lspools ,默认有一个名为rbd的存储池,其编号为0,可通过ceph df,查看存储池大小。此时虽然有90G,但是一个数据有3个副本。所以可用为30G,保存的副本数量可通过ceph osd pool get rbd size查看,通过ceph osd pool set rbd size 4进行副本数量修改
正课:
1.2.1在默认存储池中,创建一个名为demo-image大小为10G的镜像,提供给客户端使用
[root@node1 ceph-cluster]# rbd create demo-image --size 10G
# 查看默认存储池中的镜像
[root@node1 ceph-cluster]# rbd list
demo-image
# 查看demo-image的详细信息
[root@node1 ceph-cluster]# rbd info demo-image
rbd image 'demo-image':
size 10240 MB in 2560 objects
order 22 (4096 kB objects)
block_name_prefix: rbd_data.1035238e1f29
format: 2
features: layering
flags:
1.2.2客户端使用块存储,以下操作均在客户端client,除了(2)
思路:
•怎么用?装软件
•ceph集群在哪?通过配置文件说明集群地址
•权限。keyring文件
(1)安装ceph客户端软件yum install -y ceph-common
(2)将配置文件和密钥keyring文件拷贝给客户端(指定ceph地址)
[root@node1 ceph-cluster]# scp /etc/ceph/ceph.conf 192.168.4.10:/etc/ceph/
[root@node1 ceph-cluster]# scp /etc/ceph/ceph.client.admin.keyring 192.168.4.10:/etc/ceph/
(3)客户端查看镜像rbd list,并进行映射到本地
rbd map demo-image;将demo-image镜像映射;rbd showmapped 查看映射;
(4)客户端挂载格式化使用
root@client1 ~]# mkfs.xfs /dev/rbd0
[root@client1 ~]# mount /dev/rbd0 /mnt/
[root@client1 ~]# df -h /mnt/
(二)ceph-文件系统
2.1ceph文件系统介绍
文件系统:相当于是组织数据存储的方式#就是共享文件夹
•格式化时,就是在为存储创建文件系统。
•Linux对ceph有很好的支持,可以把ceph文件系统直接挂载到本地。
•要想实现文件系统的数据存储方式,需要有MDS组件
•安装并启用mds
2.2实现
(1)在node3节点上安装MDS ,ssh node3 yum install -y ceph-mds
(2)node1配置让node3有MDS服务。可以部署多个,防止单点故障,如node2
[root@node1 ~]# cd ceph-cluster/
[root@node1 ceph-cluster]# ceph-deploy mds create node3
注:MDS(元数据)介绍
元数据就是描述数据的属性。如属主、属组、权限等。
•ceph文件系统中,数据和元数据是分开存储的
•新建存储池
–归置组PG:存储池包含PG。PG是一个容器,用于存储数据。
–为了管理方便,将数量众多的数据放到不同的PG中管理,而不是直接把所有的数据扁平化存放。
–通常一个存储池中创建100个PG。
(3)新建一个名为data1的存储池,目的是存储数据,有100个PG:ceph osd pool create data1 100
(4)新建一个名为metadata1的存储池,目的是存储元数据ceph osd pool create metadata1 100
(5)创建名为myfs1的cephfs,数据保存到data1中,元数据保存到metadata1中:ceph fs new myfs1 metadata1 data1#先写就先存元数据
(6)客户端使用cephfs
挂载文件系统需要密码。查看密码
cat /etc/ceph/ceph.client.admin.keyring
[client.admin]
key = AQBmhINh1IZjHBAAvgk8m/FhyLiH4DCC
客户端挂载使用,三个存储ip任选其一:
# -t 指定文件系统类型。-o是选项,提供用户名和密码
# cephfs的端口号默认是6789
[root@client1 ~]# mkdir /mydata
[root@client1 ~]# mount -t ceph -o name=admin,secret=AQBmhINh1IZjHBAAvgk8m/FhyLiH4DCCrnrdPQ== 192.168.4.13:6789:/ /mydata
[root@client1 ~]# df -h /mydata
文件系统 容量 已用 可用 已用% 挂载点
192.168.4.13:6789:/ 90G 520M 90G 1% /mydata