前言:
postgresql是一个非常成熟的开源的功能强大的关系型数据库,总体来说,该数据库安装简单,使用复杂,复杂度在多个维度都会有所体现,比如,SQL语法的复杂(语法和MySQL,oracle等基本是一致的,这就比较友好了,虽然什么左联查,右联查,函数,触发器,约束等等内容非常多),文件系统的复杂(配置文件,标识文件,数据库文件等等),维护的复杂(备份和恢复工具比较多,需要根据自己的需求来仔细甄别,挑选,使用),优化的复杂(通常,数据库能跑起来是一件事,能高效率的,稳定的运行是另一回事)
OK,那么,postgresql数据库内的文件系统到底是一个什么系统?数据库是如何运行的?wal日志文件存放在哪里?wal日志文件有什么用?postgresql的主配置文件到底能干什么?标识文件如何使用?数据库文件是存放在哪里的?这些文件存在的意义是什么?
一,
postgresql的文件系统概述
[postgres@k8s-node2 pgsql]$ ll
total 1240
-rw-r--r-- 1 postgres postgres 522 Nov 10 2020 aclocal.m4
drwx------ 2 postgres postgres 4096 Mar 9 00:54 bin
drwxrwxrwx 2 postgres postgres 4096 Nov 10 2020 config
-rw------- 1 postgres postgres 434222 Mar 9 00:42 config.log
-rwx------ 1 postgres postgres 40061 Mar 9 00:42 config.status
-rwxr-xr-x 1 postgres postgres 575329 Nov 10 2020 configure
-rw-r--r-- 1 postgres postgres 84108 Nov 10 2020 configure.in
drwxrwxrwx 56 postgres postgres 4096 Nov 10 2020 contrib
-rw-r--r-- 1 postgres postgres 1192 Nov 10 2020 COPYRIGHT
drwx------ 19 postgres postgres 4096 Mar 25 18:17 data
drwxrwxrwx 3 postgres postgres 87 Nov 10 2020 doc
-rw------- 1 postgres postgres 3998 Mar 9 00:42 GNUmakefile
-rw-r--r-- 1 postgres postgres 3998 Nov 10 2020 GNUmakefile.in
-rw-r--r-- 1 postgres postgres 284 Nov 10 2020 HISTORY
drwx------ 6 postgres postgres 4096 Mar 9 00:54 include
-rw-r--r-- 1 postgres postgres 61479 Nov 10 2020 INSTALL
drwx------ 4 postgres postgres 4096 Mar 9 00:54 lib
-rw-r--r-- 1 postgres postgres 1665 Nov 10 2020 Makefile
-rw-r--r-- 1 postgres postgres 1212 Nov 10 2020 README
drwx------ 6 postgres postgres 4096 Mar 9 00:54 share
drwxrwxrwx 16 postgres postgres 4096 Mar 9 00:42 src
OK,以上是二进制编译安装的一个postgresql数据库,该数据库已经初始化完成了。
猛一看,文件并不多,大概也就1w多个文件(夹)而已,深入研究的话,可能会大吃一惊的。
1,
contrib文件夹
此文件夹是插件目录,里面有很多插件,比如passwordcheck 密码检查工具(安全增强插件),不过基本都是需要编译的,由开源组织提供的小工具集,也可以认为是一个扩展功能集合,可以这么理解的哦
[root@EULER1 contrib]# ls
adminpack bloom contrib-global.mk dict_xsyn hstore intarray lo oid2name pgcrypto pg_standby pg_visibility sepgsql tablefunc tsm_system_time xml2
amcheck btree_gin cube earthdistance hstore_plperl isn ltree pageinspect pg_freespacemap pg_stat_statements postgres_fdw spi tcn unaccent
auth_delay btree_gist dblink file_fdw hstore_plpython jsonb_plperl ltree_plpython passwordcheck pg_prewarm pgstattuple README sslinfo test_decoding uuid-ossp
auto_explain citext dict_int fuzzystrmatch intagg jsonb_plpython Makefile pg_buffercache pgrowlocks pg_trgm seg start-scripts tsm_system_rows vacuumlo
2,
lib文件夹
数据库运行时的类库,也可以认为是开发库
[root@EULER1 lib]# ls
ascii_and_mic.so euc_jp_and_sjis.so libecpg.a libecpg.so libpgfeutils.a libpgtypes.so.3 libpq.so.5.12 pkgconfig utf8_and_euc2004.so utf8_and_gb18030.so utf8_and_sjis2004.so
cyrillic_and_mic.so euc_kr_and_mic.so libecpg_compat.a libecpg.so.6 libpgport.a libpgtypes.so.3.12 libpqwalreceiver.so plpgsql.so utf8_and_euc_cn.so utf8_and_gbk.so utf8_and_sjis.so
dict_snowball.so euc_tw_and_big5.so libecpg_compat.so libecpg.so.6.12 libpgport_shlib.a libpq.a passwordcheck.so utf8_and_ascii.so utf8_and_euc_jp.so utf8_and_iso8859_1.so utf8_and_uhc.so
euc2004_sjis2004.so latin2_and_win1250.so libecpg_compat.so.3 libpgcommon.a libpgtypes.a libpq.so pgoutput.so utf8_and_big5.so utf8_and_euc_kr.so utf8_and_iso8859.so utf8_and_win.so
euc_cn_and_mic.so latin_and_mic.so libecpg_compat.so.3.12 libpgcommon_shlib.a libpgtypes.so libpq.so.5 pgxs utf8_and_cyrillic.so utf8_and_euc_tw.so utf8_and_johab.so
3,
share文件夹
直译是共享文件夹,该文件夹内存放的是初始化数据库的文件,里面包括一些初始化时执行的SQL语句,PostgreSQL的文档、 man、 示例文件以及一些扩展,此文件夹在初始化时非常重要
[root@EULER1 share]# ll
total 1108
-rw-r--r--. 1 pg1 pg1 33114 Mar 9 00:54 errcodes.txt
drwx------. 2 pg1 pg1 4096 Mar 25 19:22 extension
-rw-r--r--. 1 pg1 pg1 112339 Mar 9 00:54 information_schema.sql
-rw-r--r--. 1 pg1 pg1 4674 Mar 9 00:54 pg_hba.conf.sample
-rw-r--r--. 1 pg1 pg1 1636 Mar 9 00:54 pg_ident.conf.sample
-rw-r--r--. 1 pg1 pg1 604 Mar 9 00:54 pg_service.conf.sample
-rw-r--r--. 1 pg1 pg1 649166 Mar 9 00:54 postgres.bki
-rw-r--r--. 1 pg1 pg1 134668 Mar 9 00:54 postgres.description
-rw-r--r--. 1 pg1 pg1 26578 Mar 9 00:54 postgresql.conf.sample
-rw-r--r--. 1 pg1 pg1 49 Mar 9 00:54 postgres.shdescription
-rw-r--r--. 1 pg1 pg1 278 Mar 9 00:54 psqlrc.sample
-rw-r--r--. 1 pg1 pg1 33590 Mar 9 00:54 snowball_create.sql
-rw-r--r--. 1 pg1 pg1 35441 Mar 9 00:54 sql_features.txt
-rw-r--r--. 1 pg1 pg1 50232 Mar 9 00:54 system_views.sql
drwx------. 18 pg1 pg1 4096 Mar 9 00:54 timezone
drwx------. 2 pg1 pg1 4096 Mar 9 00:54 timezonesets
drwx------. 2 pg1 pg1 4096 Mar 9 00:54 tsearch_data
比较有价值的文件是 :
- errcodes.txt (错误代码表,如果开发中有错误,得看这个文件)
- postgres.bki 后端接口文件---模板数据库template1是通过运行在bootstrap模式的postgres程序读取postgres.bki文件创建的。BKI文件是一些用特殊语言写的脚本,这些脚本使PostgreSQL后端能够理解,且以特殊的bootstrap模式来执行之,这种模式允许在不存在系统表的零初始条件下执行数据库函数,而普通的SQL命令要求系统表必须存在。因此BKI文件仅用于初始化数据集簇。
- system_views.sql 系统视图SQL脚本
- 以及配置文件模板(包括主配置文件的模板和连接权限hba模板)
4,
data目录
此目录通常我们也可以称之为数据文件目录。由于Linux的设计理念是万物皆为文件,因此,逻辑上的所有概念都可以物化为文件
此目录只有初始化数据库后才会生成出现,该目录下存放的是几个主要配置文件和数据库的物理文件
[pg1@EULER1 data]$ ll
total 140
-rw------- 1 pg1 pg1 224 Mar 20 02:31 backup_label.old
drwx------ 5 pg1 pg1 4096 Mar 19 20:16 base
-rw------- 1 pg1 pg1 44 Mar 25 18:07 current_logfiles
drwx------ 2 pg1 pg1 4096 Mar 25 19:28 global
drwx------ 2 pg1 pg1 4096 Mar 25 18:07 log
drwx------ 2 pg1 pg1 4096 Mar 18 07:05 pg_commit_ts
drwx------ 2 pg1 pg1 4096 Mar 18 07:05 pg_dynshmem
-rw------- 1 pg1 pg1 4902 Mar 18 07:11 pg_hba.conf
-rw------- 1 pg1 pg1 1636 Mar 18 07:05 pg_ident.conf
drwx------ 4 pg1 pg1 4096 Mar 25 19:32 pg_logical
drwx------ 4 pg1 pg1 4096 Mar 18 07:05 pg_multixact
drwx------ 2 pg1 pg1 4096 Mar 25 18:07 pg_notify
drwx------ 2 pg1 pg1 4096 Mar 20 02:31 pg_replslot
drwx------ 2 pg1 pg1 4096 Mar 18 07:05 pg_serial
drwx------ 2 pg1 pg1 4096 Mar 18 07:05 pg_snapshots
drwx------ 2 pg1 pg1 4096 Mar 20 03:00 pg_stat
drwx------ 2 pg1 pg1 4096 Mar 25 20:15 pg_stat_tmp
drwx------ 2 pg1 pg1 4096 Mar 20 02:40 pg_subtrans
drwx------ 2 pg1 pg1 4096 Mar 20 02:40 pg_tblspc
drwx------ 2 pg1 pg1 4096 Mar 18 07:05 pg_twophase
-rw------- 1 pg1 pg1 3 Mar 18 07:05 PG_VERSION
drwx------ 3 pg1 pg1 4096 Mar 20 02:40 pg_wal
drwx------ 2 pg1 pg1 4096 Mar 18 07:05 pg_xact
-rw------- 1 pg1 pg1 110 Mar 19 02:52 postgresql.auto.conf
-rw------- 1 pg1 pg1 26695 Mar 20 03:00 postgresql.conf
-rw------- 1 pg1 pg1 59 Mar 25 18:07 postmaster.opts
-rw------- 1 pg1 pg1 80 Mar 25 18:07 postmaster.pid
-rw------- 1 pg1 pg1 30 Mar 20 02:31 tablespace_map.old
A,
base目录
此目录是基本表空间和在其表空间下的数据库文件
一级目录名是用户数据库对象的OID(例如,下面的13590),一级目录内的二级子文件都是隶属于该数据库对象的关系,包括表、索引、视图等。
二级子文件分为三大类,第一类是以关系OID命名的主数据文件,第二类是文件名以_fsm结尾的空闲空间映射文件,第三类是文件名以_vm结尾的可见性映射文件。
一般情况下,postgresql数据库只需要两个基础表空间,如果data目录所在分区磁盘空间不足的时候,我们可能会自定义表空间在其它分区,从而扩展数据库。
postgres-# \db+
List of tablespaces
Name | Owner | Location | Access privileges | Options | Size | Description
------------+----------+-------------------------+-------------------+---------+---------+-------------
mytbs | postgres | /opt/custome-tablespace | | | 7833 kB |
pg_default | pg1 | | | | 23 MB |
pg_global | pg1 | | | | 623 kB |
例如,上面的表空间详情表示,pg_default 这个表空间对应的就是base这个目录了,那么,如何证明呢?
postgres-# \db+ pg_default
List of tablespaces
Name | Owner | Location | Access privileges | Options | Size | Description
------------+-------+----------+-------------------+---------+-------+-------------
pg_default | pg1 | | | | 23 MB |
(1 row)
[root@EULER1 base]# du -sh ./
24M ./
OK,看看base目录下有一些什么:
[root@EULER1 base]# pwd
/usr/local/pgsql/data/base
[root@EULER1 base]# ll
total 20
drwx------ 2 pg1 pg1 4096 Mar 18 07:05 1
drwx------ 2 pg1 pg1 4096 Mar 18 07:05 13590
drwx------ 2 pg1 pg1 12288 Mar 25 19:28 13591
OK,13590和13591是什么呢?
这些数字叫oid,如何查询它们对应的是哪个数据库呢?
postgres=# select oid, datname from pg_database;
oid | datname
-------+-----------
13591 | postgres
1 | template1
13590 | template0
32775 | test
(4 rows)
查询某个表在哪个具体的目录下(例如,查询ssss这个表在哪个目录下):
postgres=# select pg_relation_filepath('ssss');
pg_relation_filepath
----------------------
base/13591/40976
(1 row)
如果是空表,那么40976这个文件的状态是empty,如果此表有数据,那么将是data(一开始是空的,后面我添加了数据,添加数据没有演示):
[root@EULER1 13591]# pwd
/usr/local/pgsql/data/base/13591
[root@EULER1 13591]# file 40976
40976: empty
[root@EULER1 13591]# file 40976
40976: data
数据库和表空间的对应关系查询:
postgres=# \l+
List of databases
Name | Owner | Encoding | Collate | Ctype | Access privileges | Size | Tablespace | Description
-----------+----------+----------+-------------+-------------+-------------------+---------+------------+--------------------------------------------
postgres | pg1 | UTF8 | en_US.UTF-8 | en_US.UTF-8 | | 7993 kB | pg_default | default administrative connection database
template0 | pg1 | UTF8 | en_US.UTF-8 | en_US.UTF-8 | =c/pg1 +| 7809 kB | pg_default | unmodifiable empty database
| | | | | pg1=CTc/pg1 | | |
template1 | pg1 | UTF8 | en_US.UTF-8 | en_US.UTF-8 | =c/pg1 +| 7809 kB | pg_default | default template for new databases
| | | | | pg1=CTc/pg1 | | |
test | postgres | UTF8 | en_US.UTF-8 | en_US.UTF-8 | | 7961 kB | mytbs |
(4 rows)
OK,13591和 1 这两个数据库是模板数据库,比较特殊的数据库,上面有介绍,新建数据库是使用的template1这个模板,完全的空,且不可修改的数据库是template0模板(因为不可连接),可以这样使用模板数据库建立新数据库:
root@EULER1 data]# createdb -T template1 -U postgres test2
[root@EULER1 data]# createdb -T template0 -U postgres test3
template1和template0的联系和区别:
PostgreSQL默认初始化数据库后,模板数据库template0和template1包含的内容是一致的。在PG中创建数据库时,默认是从template1模板数据库中克隆出来的,创建出来的数据库是继承template1的,而template0不会继承,因为template是不可连接的。
简单来说,template1是会被污染的,比如,连接到template1数据库,然后在里面建立了一张名字为test的表,并插入一些垃圾数据,那么,在创建新的数据库的时候,新数据库里也将会有同样的test表,表内有同样的垃圾数据
postgres=# \c template1 You are now connected to database "template1" as user "postgres". template1=# \c template0 FATAL: database "template0" is not currently accepting connections Previous connection kept
使用 template1 模板库建库时不可指定新的 encoding 和 locale,而 template0 可以。这里的“新的”指的是非UTF8
PostgreSQL为了满足能够给用户一个干净(也就是最原始)的数据库需求,当需要的时候,可以指定从template0模板数据库中去新建数据库。
在$PGDATA/base/{dboid}
中通常会包含三种文件(也就是前面说的二级子目录):例如16385
、16385_fsm
、16385_vm
,分别是该数据库对应表的数据或索引文件、其对应的空闲空间映射文件、其对应的可见性映射文件。
B,global文件夹
global目录存储pg_control及数据库集群维度的数据库及其关系,非客户维度的数据,例如pg_database、pg_class等。目录内的文件结构和base是一致的。
此文件夹里的内容是全局数据,其中有一个非常重要的文件pg_control,该文件的格式是data
该文件的内容主要分为是三部分,初始化静态信息、WAL及检查点的动态信息、一些配置信息(不能通过文本方式查看,需要pg_controldata这个工具查看该文件内容)
[root@EULER1 global]# pwd
/usr/local/pgsql/data/global
[root@EULER1 global]# file pg_control
pg_control: data
读取此文件由pg_controldata这个程序实现,此命令基本没有参数,直接运行即可:
[root@EULER1 global]# pg_controldata
pg_control version number: 1201
Catalog version number: 201909212
Database system identifier: 7211655189372047015
Database cluster state: in production
pg_control last modified: Sat 25 Mar 2023 11:01:51 PM CST
Latest checkpoint location: 0/C08CD68
Latest checkpoint's REDO location: 0/C08CD30
Latest checkpoint's REDO WAL file: 00000004000000000000000C
Latest checkpoint's TimeLineID: 4
Latest checkpoint's PrevTimeLineID: 4
Latest checkpoint's full_page_writes: on
Latest checkpoint's NextXID: 0:663
Latest checkpoint's NextOID: 57347
Latest checkpoint's NextMultiXactId: 1
Latest checkpoint's NextMultiOffset: 0
Latest checkpoint's oldestXID: 479
Latest checkpoint's oldestXID's DB: 1
Latest checkpoint's oldestActiveXID: 663
Latest checkpoint's oldestMultiXid: 1
Latest checkpoint's oldestMulti's DB: 1
Latest checkpoint's oldestCommitTsXid:0
Latest checkpoint's newestCommitTsXid:0
Time of latest checkpoint: Sat 25 Mar 2023 11:01:50 PM CST
Fake LSN counter for unlogged rels: 0/3E8
Minimum recovery ending location: 0/0
Min recovery ending loc's timeline: 0
Backup start location: 0/0
Backup end location: 0/0
End-of-backup record required: no
wal_level setting: replica
wal_log_hints setting: off
max_connections setting: 1000
max_worker_processes setting: 8
max_wal_senders setting: 10
max_prepared_xacts setting: 0
max_locks_per_xact setting: 64
track_commit_timestamp setting: off
Maximum data alignment: 8
Database block size: 8192
Blocks per segment of large relation: 131072
WAL block size: 8192
Bytes per WAL segment: 16777216
Maximum length of identifiers: 64
Maximum columns in an index: 32
Maximum size of a TOAST chunk: 1996
Size of a large-object chunk: 2048
Date/time type storage: 64-bit integers
Float4 argument passing: by value
Float8 argument passing: by value
Data page checksum version: 0
Mock authentication nonce: be64e48d6831a39e8504bc367bfd40768edba136fbdcaa058b8c6acac954b81a
输出的内容非常多,但十分重要,比如:
Catalog version number: 201909212 #版本发行时间
Database cluster state: in production #数据库状态,此时是单实例或者主从里的主
pg_control last modified: Sat 25 Mar 2023 11:01:51 PM CST#数据库启动时间,启动的时候会读取pg_control 文件,因此,是修改状态
Latest checkpoint location: 0/C08CD68 #wal文件名称
Time of latest checkpoint: Sat 25 Mar 2023 11:01:50 PM CST#数据库启动时间
wal_level setting: replica #wal日志文件的等级,
Latest checkpoint's REDO location: 0/C08CD30 #检查点现在正在使用的wal文件名称
Latest checkpoint's REDO WAL file: 00000004000000000000000C #检查点wal日志文件名称,此文件是正在写入wal日志状态
C,
pg_xact
pg_xact是事务提交日志(Commit Log)的存储目录,事务提交日志默认256KB,文件名形如NNNN,系统初始化后从0000开始递增至FFFF。PG 10及之后的高版本改目录名为pg_xact,10之前目录名称是pg_clog。
[root@EULER1 pg_xact]# pwd
/usr/local/pgsql/data/pg_xact
[root@EULER1 pg_xact]# file 0000
0000: International EBCDIC text, with NEL line terminators
[root@EULER1 pg_xact]# ls -al
total 16
drwx------ 2 pg1 pg1 4096 Mar 18 07:05 .
drwx------. 20 pg1 pg1 4096 Mar 26 00:00 ..
-rw------- 1 pg1 pg1 8192 Mar 25 23:01 0000
D,
pg_wal文件夹
该文件夹内存放的是wal归档日志文件,一般情况下是不可以删除的,备份操作主要依赖此文件夹内的wal日志文件
[root@EULER1 pg_wal]# ll
total 32780
-rw------- 1 pg1 pg1 74 Mar 20 02:40 00000003.history
-rw------- 1 pg1 pg1 16777216 Mar 26 01:33 00000004000000000000000C
-rw------- 1 pg1 pg1 16777216 Mar 20 02:40 00000004000000000000000D
-rw------- 1 pg1 pg1 118 Mar 20 02:40 00000004.history
drwx------ 2 pg1 pg1 4096 Mar 20 02:40 archive_status
以上基本都是重要的文件夹,下面介绍一下postgresql数据库里的重要文件:
A,
postgresql 主配置文件
该配置文件内容涉及的方面很多,主要是服务状态,日志设置,备份设置,恢复设置,主从设置,查询设置等等方方面面,绝大多数配置参数都被注释掉了,它们默认被内置到了数据库中,仅剩下几个参数没有被注释掉,被系统重写了(数据库版本不同,重写参数可能不同),如 pg 12.4 中被重写的了如下几个参数。测试环境使用可以采用默认参数,但在生产中使用就需要对默认参数进行一些优化配置了。
OK,具体的如何设置这些参数,如何优化内容就太多了,在此就不多做介绍了。
B,
pg_hba.conf 连接配置文件
该文件是安全方面的配置文件,主要定义哪些用户以何种方式连接数据库,例如,
host all all 0.0.0.0/0 md5
表示任意客户端均可远程连接此数据库,只是远程连接的时候需要密码校验,也就是需要输入相关用户的密码,如果该用户设置了密码的话。
只是需要注意,此配置文件的更改生效有两种方式,第一是重启数据库服务,第二是利用postgresql的内置函数:
例如,pg_reload_conf这个pg的内置函数可以热更新配置
test=# select pg_reload_conf();
pg_reload_conf
----------------
t
(1 row)
C,
postgresql.auto.conf
该文件是存放数据库系统级别的配置,此文件非常的吊,级别是最高的,也就是说相同的配置在postgresql.conf和postgresql.auto.conf 两个文件里都写的有,那么,最终是auto这个配置文件里的配置项生效
例如:
配置数据库listen也就是监听范围
[pg1@EULER1 ~]$ psql -d postgres -c "ALTER SYSTEM SET listen_addresses TO '*';"
ALTER SYSTEM
[root@EULER1 data]# cat postgresql.auto.conf
# Do not edit this file manually!
# It will be overwritten by the ALTER SYSTEM command.
max_wal_size = '2500'
listen_addresses = '*'
D,
recovery.conf文件
该文件在低版本出现,大概是pg10版本左右,是需要自己编写的,在pg12版本结合到postgresql.conf 文件内了。
该文件主要是用于数据库恢复阶段。
recovery.conf中的参数可以通过alter system 的方式进行配置了
由于是过期的文件,因此,本文不做过多介绍(12已经是主流版本了)
E,
standby.singal
此文件是标识文件,表示服务器状态的无内容文件,通常是表示此时的数据库进入了紧急状态,一般是在主服务器恢复后出现此文件。