Postgresql pg_dump逻辑备份使用说明

1. pg_dump命令说明

pg_dump是一个对PostgreSQL数据库进行逻辑备份的工具。它可以进行热备也就是在数据库正在使用的时候进行完整一致的备份,另外pg_dump并不阻塞其它用户对数据库的访问(读或者写)。

转储格式可以是一个脚本或者归档文件:

  • 脚本转储的格式是纯文本,它包含许多 SQL 命令, 这些 SQL 命令可以用于重建该数据库并将之恢复到保存成脚本的时候的状态。 使用psql从这样的脚本中恢复。 它们甚至可以用于在其它机器甚至是其它硬件体系的机器上重建该数据库,通过对脚本进行一些修改,甚至可以在其它SQL数据库产品上重建该数据库。
  • 归档文件格式必须和pg_restore一起使用重建数据库。 它们允许pg_restore对恢复什么东西进行选择, 或者甚至是在恢复之前对需要恢复的条目进行重新排序。归档文件也是设计成可以跨平台移植

可以使用pg_dump备份时使用"custom"(自定义)格式(-Fc)和 “directory”(目录)格式(-Fd)备份整个数据库,然后使用 pg_restore检查这个归档和/或选择要恢复的数据库部分,可以更灵活的进行数据的恢复

2. 注意事项

  1. 如果指定了-n,schema【–schema=schema】那么pg_dump 将不会备份那些模式所依赖的其他数据库对象。因此, 无法保证备份出来的内容一定能够在另一个干净的数据库中恢复成功。
  2. 非模式对象(比如大对象)不会在指定-n的时候被备份出来。 你可以使用–blobs明确要求转储大对象。
  3. -t table【–table=table】如果指定了-t,那么pg_dump 将不会备份任何选中的表依赖的其它数据库对象。因此, 无法保证备份出来的表能在一个干净的数据库中成功恢复。
  4. -t选项与PostgreSQL 8.2 之前的版本不兼容。 之前的-t tab将转储所有名为tab的表, 但是现在只备份在默认搜索路径中可见的表。写成-t '*.tab’将等价于老版本的行为。 同样,你必须用-t sch.tab而不是老版本的-n sch -t tab选择特定模式中的表。
  5. 在进行纯数据备份并且使用了选项–disable-triggers的时候, pg_dump发出一些查询先关闭用户表上的触发器, 然后插入数据,插入完成后再打开触发器。如果恢复动作在中间停止, 那么系统表可能就会处于一种错误状态。
  6. tar 归档的对象的大小限制于8GB 。这是 tar 文件格式的固有限制。因此这个格式无法用于任何大小超过这个尺寸的表。 tar归档和任何其它输出格式的总大小是不受限制的,只是可能会有操作系统的限制。
  7. pg_dump生成的备份文件并不包含优化器用于查询规划决策的统计信息。 因此,恢复完之后,建议在每个已恢复的对象上运行ANALYZE,以保证恢复后表的查询性能。
  8. pg_dump 不能从比它自身主版本新的PostgreSQL数据库中备份数据;加载备份文件到一个旧的PostgreSQL数据库可能需要手动编辑备份文件,以删除旧版本不兼容的语法。在跨版本的情况下,推荐使用–quote-all-identifiers选项,因为它可以避免因为不同PostgreSQL版本间的保留词列表变化而发生问题
  9. 转储逻辑复制订阅时,pg_dump将生成使用connect = false选项的CREATE SUBSCRIPTION命令,这样恢复订阅时不会建立远程连接来创建复制槽或者进行初始的表拷贝

3. 备份

3.1. 指定库备份

  1. 导出sql文件
-- insert命令形式导出库的数据
pg_dump -h 127.0.0.1 -U admin -p 5432 -W os_test --inserts > bak.sql
pg_dump  os_test --inserts > bak.sql
  1. 导出指定对象
-- 要转储一个数据库到一个自定义格式归档文件:
pg_dump -Fc mydb > db.dump

-- 要用 5 个并行的工作者任务转储一个数据库到一个目录格式的归档
pg_dump -Fd mydb -j 5 -f dumpdir

3.2. 单表备份

-- 备份单个表
pg_dump -h 127.0.0.1 -U admin -p 5432 -W db -t t1 --inserts > bak.sql

-- 备份多个表
pg_dump -h 127.0.0.1 -U admin -p 5432 -W db -t t1 -t t2 --inserts > bak.sql

-- 如果只想备份“schema”模式中所有以job开头的表,但是不包括job_log表
pg_dump -t "schema.job*" -T schema.job_log osdb > schema1.job.sql

-- 转储所有os_test的数据库对象,但是不包含以_log结尾的表
pg_dump -T '*_log'  os_test > log.sql

3.3. 只备份数据

pg_dump -h 127.0.0.1 -U admin -p 5432 -W db --inserts -a > bak.sql

3.4. 只备份表结构

pg_dump -h 127.0.0.1 -U admin -p 5432 -W db -s > bak.sql

4. 还原

-- 要把一个归档文件重新载入到一个(新创建的)名为newdb的数据库:
pg_restore -d newdb db.dump

-- 把一个归档文件重新装载到同一个数据库(该归档正是从这个数据库中转储得来)中,丢掉那个数据库中的当前内容
pg_restore -d postgres --clean --create db.dump

5. 参数说明

5.1 常用参数说明

-h host,指定数据库主机名,或者IP
-p port,指定端口号
-U user,指定连接使用的用户名
-W,按提示输入密码
dbname,指定连接的数据库名称,实际上也是要备份的数据库名称。
-a,--data-only,只导出数据,不导出表结构
-c,--clean,是否生成清理该数据库对象的语句,比如drop table
-C,--create,是否输出一条创建数据库语句
-f file,--file=file,输出到指定文件中
-n schema,--schema=schema,只转存匹配schema的模式内容
-N schema,--exclude-schema=schema,不转存匹配schema的模式内容
-O,--no-owner,不设置导出对象的所有权
-s,--schema-only,只导致对象定义模式,不导出数据
-t table,--table=table,只转存匹配到的表,视图,序列,可以使用多个-t匹配多个表
-T table,--exclude-table=table,不转存匹配到的表。
--inserts,使用insert命令形式导出数据,这种方式比默认的copy方式慢很多,但是可用于将数据导入到非PostgreSQL数据库。
--column-inserts,导出的数据,有显式列名

5.2 全部参数

-a --data-only
只转储数据,而不转储模式(数据定义)。表数据、大对象和序列值都会被转储。(这个选项类似于指定--section=data,但是由于历史原因又不完全相同。)

-b --blobs
在转储中包括大对象。这是当--schema、--table或--schema-only被指定时的默认行为。因此,只有在请求转储一个特定方案或者表的情况中,-b开关才对向转储中加入大对象有用。注意blobs是被考虑的数据,因此在使用--data-only时将被包括在内,但在使用--schema-only时则不会包括。

-B --no-blobs
在转储中排除大对象。当同时给定-b和-B时,行为是在数据被转储时输出大对象,请参考-b文档。

-c --clean 
在输出创建数据库对象的命令之前输出清除(删除)它们的命令 (除非也指定了--if-exists,如果任何对象不存在于目的数据库中,恢复可能会产生一些伤害性的错误消息)。
这个选项只对纯文本格式有意义。对于归档格式,你可以在调用pg_restore时指定该选项。

-C --create
使得在输出的开始是一个创建数据库本身并且重新连接到被创建的数据库的命令(通过这种形式的一个脚本,在运行脚本之前你连接的是目标安装中的哪个数据库都没有关系)。如果也指定了--clean,脚本会在重新连接到目标数据库之前先删除它然后再重建。

通过--create,输出还会包括数据库的注释(如果有)以及与这个数据库相关的任何配置变量设置,也就是任何提到了这个数据库的ALTER DATABASE ... SET ...命令和ALTER ROLE ... IN DATABASE ... SET ...命令。该数据库本身的访问特权也会被转储,除非指定有--no-acl。

这个选项只对纯文本格式有意义。对于归档格式,你可以在你调用pg_restore时指定这个选项。

-E encoding --encoding=encoding
以指定的字符集编码创建转储。在默认情况下,该转储会以该数据库的编码创建(另一种得到相同结果的方式是将PGCLIENTENCODING环境变量设置成想要的转储编码)。

-f file --file=file
将输出发送到指定文件。对于基于输出格式的文件这个参数可以被忽略,在那种情况下将使用标准输出。不过对于目录输出格式必须给定这个参数,在目录输出格式中指定的是一个目录而不是一个文件。在这种情况中,该目录会由pg_dump创建并且不需要以前就存在。

-F format --format=format
选择输出的格式。format可以是下列之一:

p plain
输出一个纯文本形式的SQL脚本文件(默认值)。

c custom
输出一个适合于作为pg_restore输入的自定义格式归档。和目录输出格式一起,这是最灵活的输出格式,它允许在恢复时手动选择和排序已归档的项。这种格式在默认情况还会被压缩。

d directory
输出一个适合作为pg_restore输入的目录格式归档。这将创建一个目录,其中每个被转储的表和大对象都有一个文件,外加一个所谓的目录文件,该文件以一种pg_restore能读取的机器可读格式描述被转储的对象。一个目录格式归档能用标准 Unix 工具操纵,例如一个未压缩归档中的文件可以使用gzip工具压缩。这种格式默认情况下是被压缩的并且也支持并行转储。

t tar
输出一个适合于输入到pg_restore中的tar-格式归档。tar 格式可以兼容目录格式,抽取一个 tar 格式的归档会产生一个合法的目录格式归档。不过,tar 格式不支持压缩。还有,在使用 tar 格式时,表数据项的相对顺序不能在恢复过程中被更改。

-j njobs --jobs=njobs
通过同时归档njobs个表来运行并行转储。这个选项缩减了转储的时间,但是它也增加了数据库服务器上的负载。你只能和目录输出格式一起使用这个选项,因为这是唯一一种让多个进程能在同一时间写其数据的输出格式。

pg_dump将打开njobs + 1 个到该数据库的连接,因此确保你的max_connections设置足够高以容纳所有的连接。

在运行一次并行转储时请求数据库对象上的排他锁可能导致转储失败。其原因是,pg_dump主控进程会在工作者进程将要稍后转储的对象上请求共享锁,以便确保在转储运行时不会有人删除它们并让它们出错。如果另一个客户端接着请求一个表上的排他锁,那个锁将不会被授予但是会被排入队列等待主控进程的共享锁被释放。因此,任何其他对该表的访问将不会被授予或者将排在排他锁请求之后。这包括尝试转储该表的工作者进程。如果没有任何防范措施,这可能会是一种经典的死锁情况。要检测这种冲突,pg_dump工作者进程使用NOWAIT选项请求另一个共享锁。 如果该工作者进程没有被授予这个共享锁,其他某人必定已经在同时请求了一个排他锁并且没有办法继续转储,因此pg_dump除了中止转储之外别无选择。

对于一个一致的备份,数据库服务器需要支持同步的快照,在PostgreSQL 9.2的主服务器和10的后备服务器中引入了一种特性。有了这种特性,即便数据库客户端使用不同的连接,也可以保证他们看到相同的数据集。pg_dump -j使用多个数据库连接,它用主控进程连接到数据一次,并且为每一个工作者任务再一次连接数据库。如果没有同步快照特征,在每一个连接中不同的工作者任务将不能被保证看到相同的数据,这可能导致一个不一致的备份。

如果你希望运行一个 9.2 之前服务器的并行转储,你需要确保数据库内容从主控进程连接到数据库一直到最后一个工作者任务连接到数据库之间不会改变。做这些最简单的方法是在开始备份之前停止任何访问数据库的数据修改进程(DDL 以及 DML)。当对一个 9.2 之前的PostgreSQL服务器运行pg_dump -j时,你还需要指定--no-synchronized-snapshots参数。

-n pattern --schema=pattern
只转储匹配pattern的模式,这会选择模式本身以及它所包含的所有对象。当没有指定这个选项时,目标数据库中所有非系统模式都将被转储。多个模式可以通过书写多个-n开关来选择。另外,pattern参数可以被解释为一种根据psql's \d命令所用的相同规则(见模式(Pattern))编写的模式,这样多个模式也可以通过在该模式中书写通配字符来选择。在使用通配符时,如果需要阻止 shell 展开通配符需要小心引用该模式,见实例。

注意: 当-n被指定时,pg_dump不会尝试转储所选模式可能依赖的任何其他数据库对象。因此,无法保证一次指定模式转储的结果能够仅凭其本身被成功地恢复到一个干净的数据库中。
注意: 当-n被指定时,非模式对象(如二进制大对象)不会被转储。你可以使用--blobs开关将二进制大对象加回到该转储中。

-N pattern --exclude-schema=pattern
不转储匹配pattern模式的任何模式。该模式被根据-n所用的相同规则被解释。-N可以被给定多次来排除匹配几个模式中任意一个的模式。

当-n和-N都被给定时,该行为是只转储匹配至少一个-n开关但是不匹配-N开关的模式。如果只有-N而没有-n,那么匹配-N的模式会被从一个正常转储中排除。

-O --no-owner
不输出设置对象拥有关系来匹配原始数据库的命令。默认情况下,pg_dump会发出ALTER OWNER或SET SESSION AUTHORIZATION语句来设置被创建的数据库对象的拥有关系。除非该脚本被一个超级用户(或是拥有脚本中所有对象的同一个用户)启动,这些语句都将会失败。要使一个脚本能够被任意用户恢复,但把所有对象的拥有关系都给这个用户,可指定-O。

这个选项只对纯文本格式有意义。对于归档格式,你可以在调用pg_restore时指定该选项。

-R --no-reconnect
这个选项已经废弃,但是为了向后兼容仍然能被接受。

-s --schema-only
只转储对象定义(模式),而非数据。

这个选项是--data-only的逆选项。它和指定--section=pre-data --section=post-data相似,但是由于历史原因又不完全相同。(不要把这个选项和--schema选项混淆,后者在“schema”的使用上有不同的含义)。

要为数据库中表的一个子集排除表数据,见--exclude-table-data。

-S username --superuser=username
指定要在禁用触发器时使用的超级用户的用户名。只有使用--disable-triggers时,这个选项才相关(通常,最好省去这个选项,而作为超级用户来启动结果脚本来取而代之)。

-t pattern --table=pattern
只转储名字匹配pattern的表,“table”还可以包括视图、物化视图、序列和外部表。通过写多个-t开关可以选择多个表。另外,pattern参数可以被解释为一种根据psql's \d命令所用的相同规则(见模式(Pattern))编写的模式,这样多个表也可以通过在该模式中书写通配字符来选择。在使用通配符时,如果需要阻止 shell 展开通配符需要小心引用该模式,见实例。

当-t被使用时,-n和-N开关不会有效果,因为被-t选择的表将被转储而无视那些开关,并且非表对象将不会被转储。

注意:当-t被指定时,pg_dump不会尝试转储所选表可能依赖的任何其他数据库对象。因此,无法保证一次指定表转储的结果能够仅凭其本身被成功地恢复到一个干净的数据库中。
注意

-t开关的行为不完全向前兼容 8.2 之前的PostgreSQL版本。以前,写-t tab将转储所有命名为tab的表,但现在它仅仅转储在你默认搜索路径中可见的那一个。要得到旧的行为,你可以写成-t '*.tab'。还有,你必须写类似-t sch.tab的东西来选择一个特定模式中的一个表,而不是用老的惯用语-n sch -t tab。

-T pattern --exclude-table=pattern
不转储匹配pattern模式的任何表。该模式被根据-t所用的相同规则被解释。-T可以被给定多次来排除匹配几个模式中任意一个的模式。

当-t和-T都被给定时,该行为是只转储匹配至少一个-t开关但是不匹配-T开关的表。如果只有-T而没有-t,那么匹配-T的表会被从一个正常转储中排除。

-v --verbose
指定冗长模式。这将导致pg_dump向标准错误输出详细的对象注释以及转储文件的开始/停止时间,还有进度消息。

-V --version
pg_dump版本并退出。

-x --no-privileges --no-acl
防止转储访问特权(授予/收回命令)。

-Z 0..9 --compress=0..9
指定要使用的压缩级别。零意味着不压缩。对于自定义归档格式,这会指定个体表数据段的压缩,并且默认是进行中等级别的压缩。对于纯文本输出,设置一个非零压缩级别会导致整个输出文件被压缩,就好像它被gzip处理过一样,但是默认是不压缩。tar 归档格式当前完全不支持压缩。

--binary-upgrade
这个选项用于就地升级功能。我们不推荐也不支持把它用于其他目的。这个选项在未来的发行中可能被改变而不做通知。

--column-inserts
--attribute-inserts
将数据转储为带有显式列名的INSERT命令(INSERT INTO table (column, ...) VALUES ...)。这将使得恢复过程非常慢,这主要用于使转储能够被载入到非PostgreSQL数据库中。重新加载期间的任何错误都将导致有问题的INSERT相关的行将丢失,而不是整个表内容。

--disable-dollar-quoting
这个选项禁止在函数体中使用美元符号引用,并且强制它们使用 SQL 标准字符串语法被引用。

--disable-triggers
只有在创建一个只转储数据的转储时,这个选项才相关。它指示pg_dump包括在数据被重新载入时能够临时禁用目标表上的触发器的命令。如果你在表上有引用完整性检查或其他触发器,并且你在数据重新载入期间不想调用它们,请使用这个选项。

当前,为--disable-triggers发出的命令必须作为超级用户来执行。因此,你还应当使用-S指定一个超级用户名,或者宁可作为一个超级用户启动结果脚本。

这个选项只对纯文本格式有意义。对于归档格式,你可以在调用pg_restore时指定这个选项。

--enable-row-security
只有在转储具有行安全性的表的内容时,这个选项才相关。默认情况下, pg_dump将把 row_security设置为 off 来确保从该表中转储 出所有的数据。如果用户不具有足够能绕过行安全性的特权,那么会抛出 一个错误这个参数指示pg_dump将 row_security设置为 on,允许用户只转储该表中 它们能够访问到的部分内容。

注意如果当前你使用了这个选项,你可能还想得到INSERT格式的转储,因为恢复期间的COPY FROM不支持行安全性。

--exclude-table-data=pattern
不转储匹配pattern模式的任何表中的数据。该模式根据-t的相同规则被解释。--exclude-table-data可以被给定多次来排除匹配多个模式的表。当你需要一个特定表的定义但不想要其中的数据时,这个选项就有用了。

要排除数据库中所有表的数据,见--schema-only。

--extra-float-digits=ndigits
在转储浮点数据时使用规定的extra_float_digits值,而不是最大可用精度。以备份目的生成的常规转储不使用此选项。

--if-exists
时间条件性命令(即增加一个IF EXISTS子句)来清除数据库和其他对象。 只有同时指定了--clean时,这个选项才可用。

--inserts
将数据转储为INSERT命令(而不是COPY)。这将使得恢复非常慢,这主要用于使转储能够被载入到非PostgreSQL数据库中。重新加载期间的任何错误都将导致有问题的INSERT相关的行将丢失,而不是整个表内容。注意如果你已经重新安排了列序,该恢复可能会一起失败。--column-inserts选项对于列序改变是安全的,但是会更慢。

--load-via-partition-root
在为一个分区表转储数据时,让COPY语句或者INSERT语句把包含它的分区层次的根而不是分区自身作为目标。这导致在数据被装载时,会为每一个行重新确定合适的分区。如果在一台服务器上重新装载数据时会出现行并不是总是落入到和原始服务器上相同的分区中的情况,这个选项就很有用。例如,如果分区列是文本类型并且两个系统中用于排序分区列的排序规则有着不同的定义,就会发生这种情况。

在从用这个选项制作的归档恢复时,最好不要使用并行,因为pg_restore将不能准确地知道一个给定的归档数据项将把数据装载到哪个分区中。这会导致效率不高,因为在并行任务见会有锁冲突,或者甚至可能由于在所有的相关数据被装载前建立了外键约束而导致重新装载失败。

--lock-wait-timeout=timeout
在转储的开始从不等待共享表锁的获得。而是在指定的timeout内不能锁定一个表时失败。超时时长可以用SET statement_timeout接受的任何格式指定(允许的值根据你从其转出的服务器版本变化,但是从 7.3 以来的所有版本都接受一个整数表示的毫秒数。如果从 7.3 以前的服务器转出,这个选项会被忽略。)。

--no-comments
不转储注释。

--no-publications
不转储publication。

--no-security-labels
不转储安全标签。

--no-subscriptions
不转储订阅。

--no-sync
默认情况下,pg_dump将等待所有文件被安全地写入磁盘。这个选项会让pg_dump不等待直接返回,这样会更快,但是也意味着后续的一次操作系统崩溃会让该转储损坏。通常这个选项对测试有用,但是不应该在从生产安装中转储数据时使用。

--no-synchronized-snapshots
这个选项允许对 9.2 以前的服务器运行pg_dump -j,详见-j参数的文档。

--no-tablespaces
不要输出选择表空间的命令。通过这个选项,在恢复期间所有的对象都会被创建在任何作为默认的表空间中。

这个选项只对纯文本格式有意义。对于归档格式,你可以在调用pg_restore时指定该选项。

--no-unlogged-table-data
不转储非日志记录表的内容。这个选项对于表定义(模式)是否被转储没有影响,它只会限制转储表数据。当从一个后备服务器转储时,在非日志记录表中的数据总是会被排除。

--on-conflict-do-nothing
增加 ON CONFLICT DO NOTHING 到INSERT commands。 除非规定了 --inserts,--column-inserts 或--rows-per-insert ,否则此选项是无效的,.

--quote-all-identifiers
强制引用所有标识符。当从PostgreSQL主版本与pg_dump不同的服务器上转储一个数据库时或者当输出准备载入到一个具有不同主版本的服务器时,推荐使用这个选项。默认情况下,pg_dump只对在其主版本中是被保留词的标识符加上引号。在转储其他版本服务器时,这种默认行为有时会导致兼容性问题,因为那些版本可能具有些许不同的被保留词集合。使用--quote-all-identifiers能阻止这种问题,但代价是转储脚本更难阅读。

--rows-per-insert=nrows
数据转储为INSERT命令(而不是COPY)。 控制每个INSERT命令的最大行数。 指定的值必须大于零。重新加载期间的任何错误都将导致有问题的INSERT相关的行将丢失,而不是整个表内容。

--section=sectionname
只转储命名节。节的名称可以是pre-data、data或post-data。这个选项可以被指定多次来选择多个节。默认是转储所有节。

数据节包含真正的表数据、大对象内容和序列值。数据后项包括索引、触发器、规则和除了已验证检查约束之外的约束的定义。数据前项包括所有其他数据定义项。

--serializable-deferrable
为转储使用一个可序列化事务,以保证所使用的快照与后来的数据库状态是一致的。但是这样做是在事务流中等待一个点,在该点上不能存在异常,这样就不会有转储失败或者导致其他事务带着serialization_failure回滚的风险。关于事务隔离和并发控制详见第 13 章。

对于一个只为灾难恢复存在的转储,这个选项没什么益处。如果一个转储被用来在原始数据库持续被更新期间载入一份用于报表或其他只读负载的数据库拷贝时,这个选项就有所帮助。如果没有这个选项,转储可能会反映一个与最终提交事务的任何执行序列都不一致的状态。例如,如果使用了批处理技术,一个批处理在转储中可以显示为关闭,而其中的所有项都不出现。

如果 pg_dump 被启动时没有读写事务在活动,则这个选项没有什么不同。如果有读写事务在活动,该转储的启动可能会被延迟一段不确定的时间。一旦开始运行,有没有这个开关的表现是相同的。

--snapshot=snapshotname
在做一个数据库的转储时指定一个同步的快照(详见 表 9.87)。

在需要把转储和一个逻辑复制槽(见第 48 章) 或者一个并发会话同步时可以用上这个选项。

在并行转储的情况下,将使用这个选项指定的快照名而不是取一个新快照。

--strict-names
要求每一个模式(-n/--schema)和表(-t/--table)限定符匹配要转储的数据库中至少一个模式/表。注意,如果没有找到有这样的模式/表限定符匹配,即便没有--strict-names,pg_dump也将生成一个错误。

这个选项对-N/--exclude-schema、-T/--exclude-table或者--exclude-table-data没有效果。无法匹配任何对象的排除模式不会被当作错误。

--use-set-session-authorization
输出 SQL-标准的SET SESSION AUTHORIZATION命令取代ALTER OWNER命令来确定对象的所有关系。这让该转储更加兼容标准,但是取决于该转储中对象的历史,该转储可能无法正常恢复。而且,一个使用SET SESSION AUTHORIZATION的转储将一定会要求超级用户特权来正确地恢复,而ALTER OWNER要求更少的特权。

-?
--help
显示有关pg_dump命令行参数的帮助并退出。

下列命令行选项控制数据库连接参数。

-d dbname
--dbname=dbname
指定要连接到的数据库名。这等效于指定dbname为命令行上的第一个非选项参数。

如果这个参数包含一个=符号或者以一个合法的URI前缀(postgresql://或postgres://)开始,它将被视作一个conninfo字符串。详见第 33.1 节。

-h host
--host=host
指定服务器正在运行的机器的主机名。如果该值开始于一个斜线,它被用作一个 Unix 域套接字的目录。默认是从PGHOST环境变量中取得(如果被设置),否则将尝试一次 Unix 域套接字连接。

-p port
--port=port
指定服务器正在监听连接的 TCP 端口或本地 Unix 域套接字文件扩展名。默认是放在PGPORT环境变量中(如果被设置),否则使用编译在程序中的默认值。

-U username
--username=username
要作为哪个用户连接。

-w
--no-password
从不发出一个口令提示。如果服务器要求口令认证并且没有其他方式提供口令(例如一个.pgpass文件),那么连接尝试将失败。这个选项对于批处理任务和脚本有用,因为在其中没有一个用户来输入口令。

-W
--password
强制pg_dump在连接到一个数据库之前提示要求一个口令。

这个选项从来不是必须的,因为如果服务器要求口令认证,pg_dump将自动提示要求一个口令。但是,pg_dump将浪费一次连接尝试来发现服务器想要一个口令。在某些情况下,值得键入-W来避免额外的连接尝试。

--role=rolename
指定一个用来创建该转储的角色名。这个选项导致pg_dump在连接到数据库后发出一个SET ROLE rolename命令。当已认证用户(由-U指定)缺少pg_dump所需的特权但是能够切换到一个具有所需权利的角色时,这个选项很有用。一些安装有针对直接作为超级用户登录的策略,使用这个选项可以让转储在不违反该策略的前提下完成。

pg_dump迁移表/存过/函数

迁移用户表

  • 1)确认源端、目标端信息

版本

IP地址

端口

数据库名

用户名

schema名

源库

12.3

192.168.56.101

15432

prodb

root

u1

目标库

12.3

192.168.56.102

15432

testdb

root

u1

  • 2)源库查询要迁移的表信息
$ psql -h 192.168.56.101 -p 15432 -d prodb -U root

select c.relname, c.relkind, c.relpages,pg_size_pretty(pg_relation_size(c.oid))
from pg_class c join pg_namespace n on c.relnamespace=n.oid where n.nspname='u1'
and c.relname in ('t1_202201','t1_202202');
  • 3)源库执行表备份
    -h 指定数据库主机
    -p 指定数据库端口
    -d 指定连接的数据库名
    -U 指定连接用户名
    -n 指定要导出的schema名
    -t 指定要导出的表名
$ pg_dump -h 192.168.56.101 -p 15432 -d prodb -U root -n u1 
-t t1_202201 -t t1_202202 -Fc -f u1_table.dmp -v >u1_table_dump.log 2>&1
  • 4)目标库执行表恢复
$ pg_restore -h 192.168.56.102 -p 15432 -d testdb -U root u1_table.dmp -v >u1_table_restore.log 2>&1

迁移用户函数、存过

  • 1)备份源库指定schema的所有元数据信息
    -s 只导出对象定义
$ pg_dump -h 192.168.56.101 -p 15432 -d prodb -U root -n u1 -s -Fc -f u1.dmp
  • 2)-l 列出备份文件的内容,该操作的输出可以作为 -L 的输入
    -L list-file 仅恢复 list-file 中列出的元素,并按照它们在文件中出现的顺序恢复它们
筛选函数、存过,并生成文本文件
$ pg_restore --list u1.dmp | grep FUNCTION > u1_func_list
$ pg_restore --list u1.dmp | grep PROCEDURE > u1_proc_list

查看函数、存过的数量
$ cat u1_func_list|wc -l
$ cat u1_proc_list|wc -l
  • 3)将存过、函数恢复到目标库
$ pg_restore -h 192.168.56.102 -p 15432 -d testdb -U root -c -L u1_func_list u1.dmp -v >u1_func.log 2>&1

$ pg_restore -h 192.168.56.102 -p 15432 -d testdb -U root -c -L u1_proc_list u1.dmp -v >u1_proc.log 2>&1
  • 4)目标库查询函数、存过数量
$ psql -h 192.168.56.102 -p 15432 -d testdb -U root

SELECT
p.prokind,count(*)
from pg_catalog.pg_proc p
LEFT JOIN pg_catalog.pg_namespace n ON n.oid = p.pronamespace
WHERE n.nspname OPERATOR(pg_catalog.~) '^(u1)$' COLLATE pg_catalog.default and p.prokind in ('f','p')
group by p.prokind;


实施步骤

1、备份恢复单表数据

备份:

pg_dump -h 127.0.0.1 -U cyb -p 5555 -d test3 -t bigtab --inserts > bigtab.sql
-h:服务器地址
-U:用户
-p:端口
-d:指定database
-t:指定table
--inserts:导出为insert格式,方便导入其他数据库

恢复:

--恢复多表数据也是一样
--指定database即可
[postgres@pghost ~]$ psql -d test3 -f bigtab1.sql
SET
SET
SET
SET
SET
 set_config 
------------
 
(1 row)

SET
SET
SET
SET
SET
SET
CREATE TABLE
ALTER TABLE
COPY 3900000
ALTER TABLE
[postgres@pghost ~]$

2、备份恢复多表数据

备份:

pg_dump -h 127.0.0.1 -U cyb -p 5555 -d test3 -t bigtab -t bigtab03 --inserts > bigtab3.sql

与备份单表不同的在于,-t可以写多个

3、备份恢复单数据库

备份:

pg_dump -h 127.0.0.1 -U cyb -p 5555 -d test3 > bigtab4.sql

查看到它导出所有database的对象,比如存储过程、序列、表

[postgres@pghost ~]$ cat bigtab4.sql |grep Name
-- Name: gen_id(date, date); Type: FUNCTION; Schema: public; Owner: cyb
-- Name: get_tel(); Type: FUNCTION; Schema: public; Owner: cyb
-- Name: getchnchar(integer, integer); Type: FUNCTION; Schema: public; Owner: cyb
-- Name: insert_big(integer, integer); Type: FUNCTION; Schema: public; Owner: cyb
-- Name: inset_t(integer); Type: FUNCTION; Schema: public; Owner: cyb
-- Name: inset_t(integer, integer); Type: FUNCTION; Schema: public; Owner: cyb
-- Name: big_s; Type: SEQUENCE; Schema: public; Owner: cyb
-- Name: big_s03; Type: SEQUENCE; Schema: public; Owner: postgres
-- Name: bigtab; Type: TABLE; Schema: public; Owner: cyb
-- Name: bigtab03; Type: TABLE; Schema: public; Owner: postgres
-- Name: color1; Type: TABLE; Schema: public; Owner: cyb
-- Data for Name: bigtab; Type: TABLE DATA; Schema: public; Owner: cyb
-- Data for Name: bigtab03; Type: TABLE DATA; Schema: public; Owner: postgres
-- Data for Name: color1; Type: TABLE DATA; Schema: public; Owner: cyb
-- Name: big_s; Type: SEQUENCE SET; Schema: public; Owner: cyb
-- Name: big_s03; Type: SEQUENCE SET; Schema: public; Owner: postgres
-- Name: bigtab03 bigtab03_pkey; Type: CONSTRAINT; Schema: public; Owner: postgres
-- Name: bigtab bigtab_pkey; Type: CONSTRAINT; Schema: public; Owner: cyb

4、备份恢复表结构

不导出数据:

pg_dump -h 127.0.0.1 -U cyb -p 5555 -d test3 -s > bigtab5.sql

重点在于-s,schema only。

5、备份恢复数据行

不导出表结构:

pg_dump -h 127.0.0.1 -U cyb -p 5555 -d test3 -a > bigtab6.sql

重点在于-a,data only。

6、过滤备份

执行以下命令,备份detroit模式中名称以emp开头的所有表
(名称为employee_log的表除外):

pg_dump -t 'detroit.emp*' -T detroit.employee_log mydb > db.sql

执行以下命令,备份名称以east或west开头并以gsm结尾的所有模式
(不包括名称中含test的任何模式):

pg_dump -n 'east*gsm' -n 'west*gsm' -N '*test*' mydb > db.sql

执行以下命令,备份除名称以ts_开头的表以外的所有数据库对象:

pg_dump -T 'ts_*' mydb > db.sql

7、替换导入

-c, --clean clean (drop) database objects before recreating

pg_dump -h 127.0.0.1 -U cyb -p 5555 -d test3 -t bigtab -c > bigtab_c.sql

8、仅导出指定对象

备份:

pg_dump  --format=c --schema=public --schema-only --file=meta1 test3
pg_restore --list meta1 > function_list

如何只导入指定对象呢?

--只要函数
pg_restore --list meta1|grep FUNCTION > function_list
--只要表
pg_restore --list meta1|grep TABLE > function_list

导入:

pg_restore --dbname=test2 --use-list=function_list  meta1 --verbose
--dbname:导入的目标库
--use-list:过滤好的名单
--verbose:显示过程日志