前言

目前很多同学使用top命令查看内存时,会发现有一些PostgreSQL进程占用了很大的内存,用ps aux常看各个进程的内存时,如果把各个进程的内存加起来时,发现超过了总内存,所以很困惑。中启乘数科技做为专业的数据库服务提供商,对此问题有深入的研究,在这里给大家解惑。

原理解释

我们用top查看时,有时会看到某个PostgreSQL进程占用的内存很大,如下图所示:

mac如何查看postgresql的进程的如何重启_共享内存

从上图中可以看到进程(pid=45286)占到了机器总内存的25.9%,这台机器的总内存是128G,25.9%,基本就是33GB,从感觉上看觉得不可能?但是这里确实显示占用了这么大内存。进一步查看这个进程:

[root@pg01 ~]# ps -ef|grep 45286 |grep -v grep
postgres 45286 45282  0  2020 ?        05:33:30 postgres: checkpointer

发现这个进程是checkpointer进程,难道有内存泄露?但是查看了很多长时间运行的PostgreSQL数据库,发现checkpointer进程都占用了很高的内存。实际上这里看到的这个内存并不是这个进程实际占用的真实内存。原因是这里显示的内存包括了共享内存,而共享内存是在很多的进程之间共享的,不能都算到这个进程头上。另我们知道PostgreSQL数据库使用了很大的共享内存,做数据块的缓存。查看数据库的参数shared_buffers看到数据库的共享内存的大小:

[postgres@pg01 ~]$ psql
psql (11.7)
Type "help" for help.
postgres=# show shared_buffers;
 shared_buffers 
----------------
 32GB
(1 row)

我们有时也会用ps aux查看进程的内存,如下:

[root@pg01 ~]# ps aux --sort=-rss |head -10
USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
postgres 45286  0.0 25.8 35072428 33997064 ?   Ss    2020 333:30 postgres: checkpointer   
postgres 45287  0.0  8.3 35067396 10929444 ?   Ss    2020  49:22 postgres: background writer
postgres 23784 30.4  0.8 35091120 1118520 ?    Rs   21:42   4:13 postgres: inofa greenerp2018 192.168.2.193(62975) SELECT
postgres 24074 41.8  0.8 35091636 1095144 ?    Rs   21:47   4:04 postgres: inofa greenerp2018 192.168.2.193(63056) SELECT
postgres 24737 38.2  0.8 35090844 1090260 ?    Rs   21:54   0:51 postgres: inofa greenerp2018 192.168.2.193(63202) SELECT
postgres 24837 70.3  0.8 35091552 1078752 ?    Rs   21:55   1:03 postgres: inofa greenerp2018 192.168.2.193(63223) SELECT
postgres 24368 44.3  0.8 35093552 1064208 ?    Rs   21:50   2:50 postgres: inofa greenerp2018 192.168.2.193(63124) SELECT
postgres 24835 52.3  0.8 35093740 1057660 ?    Rs   21:55   0:47 postgres: inofa greenerp2018 192.168.2.193(63222) SELECT
postgres 45282  0.0  0.8 35064744 1054188 ?    S     2020  84:47 /usr/pgsql-11.7/bin/postgres -D /data/ssd_pg_data/sale_pgdata_11

注意上图中的列VSZ是虚拟内存并不是实际占用的内存,RSS虽然是实际的内存,但是包括了共享的部分。而top命令中看到进程内存的百分比就是RSS内存占用总内存的百分比。

所以查看PostgreSQL进程占用的内存,正确的姿势应该是把共享的那部分内存给扣除掉,但是用ps命令没有办法扣除掉这部分内存。而实际上我们可以看/proc//smaps文件中查看Pss内存,Pss表示的内存是把共享内存平分到各个进程上的内存,这实际上是这个进程占用的实际内存:

[root@pg01 ~]# cat /proc/12047/smaps |more
00400000-00ad1000 r-xp 00000000 fd:01 42123205                           /usr/pgsql-11.7/bin/postgres
Size:               6980 kB
Rss:                 528 kB
Pss:                  67 kB
Shared_Clean:        512 kB
Shared_Dirty:          0 kB
Private_Clean:        16 kB
Private_Dirty:         0 kB
Referenced:          528 kB
Anonymous:             0 kB
AnonHugePages:         0 kB
Swap:                  0 kB
KernelPageSize:        4 kB
MMUPageSize:           4 kB
Locked:                0 kB
VmFlags: rd ex mr mw me dw sd 
00cd0000-00cd1000 r--p 006d0000 fd:01 42123205                           /usr/pgsql-11.7/bin/postgres
Size:                  4 kB
Rss:                   4 kB
Pss:                   0 kB
Shared_Clean:          0 kB
Shared_Dirty:          4 kB
Private_Clean:         0 kB
Private_Dirty:         0 kB
...
...
...

这个smaps看到的内存非常详细,有很多项,如果我们想查询出哪些进程占用内存多,不是很方便。

实际上CentOS7.X下提供了命令smem,可以方便的查看Pss内存。

使用smem查看进程占用的内存

smem工具可以方便的查看Pss内存,这个工具实际是一个python脚本。
smem工具一般默认都没有安装上,这个包是在EPEL扩展包中,所以需要先安装epel扩展包:

yum install -y epel-release

然后在安装smem:

yum install -y smem

用smem命令查看占用内存最多的前20个进程:

[root@PG02 ~]# smem -t -r  | head -20
  PID User     Command                         Swap      USS      PSS      RSS 
12035 postgres postgres: startup   recover        0   120800  5012485 10186640 
12047 postgres postgres: checkpointer             0   104684  4995433 10115820 
12032 postgres /usr/pgsql-11.7/bin/postgre        0   510344   664110  1054460 
28643 postgres postgres: inofa greenerp201        0   433236   512166   773388 
27838 postgres postgres: inofa greenerp201        0    19568   282248   914964 
27462 postgres postgres: inofa greenerp201        0    19820   279398   913364 
27913 postgres postgres: inofa greenerp201        0    10812   271796   906096 
12048 postgres postgres: background writer        0      168    68658   264096 
27139 postgres postgres: inofa greenerp201        0    26880    67974   229700 
27732 postgres postgres: inofa greenerp201        0    14272    36483   104760 
27264 postgres postgres: inofa greenerp201        0    15512    29736    90616 
28234 postgres postgres: inofa greenerp201        0    13904    23913    66956 
27861 postgres postgres: inofa greenerp201        0     7216    21375    61788 
27287 postgres postgres: inofa greenerp201        0     9236    18343    67220 
28654 postgres postgres: inofa greenerp201        0     8124    15647    70764 
  493 root     /usr/lib/systemd/systemd-jo        0     5760    13507    27548 
 1211 root     ../pyenv/bin/python clup_ag        0    13424    13469    14524 
  780 root     /sbin/dhclient -d -q -sf /u        0    12484    12680    14824 
  887 postgres postgres: inofa greenerp201        0    10104    12438    35852

如果完全不包括共享部分的内存,可以看上面“USS”列显示的内存。

最后把几类内存的名词解释一下:

  • VSS- Virtual Set Size 虚拟内存(包含共享库占用的内存)
  • RSS- Resident Set Size 实际使用物理内存(包含共享库占用的内存)
  • PSS- Proportional Set Size 实际使用的物理内存(比例分配共享库占用的内存)
  • USS- Unique Set Size 进程独自占用的物理内存(不包含共享库占用的内存)