此文章会帮助你理清Dockerfile中非常相似的两个指令(instructions):ADDCOPY。包含为什么Dockerfile中会出现两个功能如此相似的指令,以及日常使用中应该使用哪种更好。

当我们构建Docker image时,经常添加目录/文件至image中。此时便有了两种指令可选择:ADDCOPY。两种指令有着几乎相同的语法,且可以完成几乎相同的功能:

ADD <src>... <dest>
COPY <src>... <dest>

在这两种情况下,目录或文件<src>被复制并添加到容器的文件系统中指定的<dest>路径。 

ADD

COPY不同,ADD一开始便是Docker的一部分。除了简单的在构建中复制文件,ADD还有一些其他的小功能:

URL

ADD指令允许用户使用URL地址作为<src>参数,当获取到URL时,会从该URL下载一个文件并复制到<dest>

ADD http://foo.com/bar.go /tmp/main.go

上述语句会从URL foo.com下载文件,并添加到容器中文件系统下 /tmp/main.go<dest>也可以指定目标目录,表示下载文件存储至该目录下:

ADD http://foo.com/bar.go /tmp/

上述语句因为<dest>以斜杠( / )结尾,Docker将从URL获取到文件名,并将其添加到指定目录中。在本例中,命名为/tmp/bar.go的文件将被添加到容器的文件系统中。

unpacked  解压缩文件

ADD指令的另一个特性是自动解压缩文件。当<src>参数是一个可识别压缩格式(tar, gzip, bzip2, etc)的本地文件,那么它会被解压缩后添加至容器的文件系统中:

ADD /foo.tar.gz /tmp/

上述命令会将foo.tar.gz文件的内容被解压缩到容器的/tmp目录中。

不过,URL下载与自动解压缩特性不能同时使用,任何从URL下载的压缩文件都不会被自动解压缩。

 

 

COPY

显然,一个简单的ADD指令背后却有很多功能。虽然这使ADD相当通用,但同时使它有些不可预测。以下是2013年12月记录在ADD命令上的一个问题:

Currently the ADD command is IMO far too magical. It can add local and remote files. It will sometimes untar a file and it will sometimes not untar a file. If a file is a tarball that you want to copy, you accidentally untar it. If the file is a tarball in some unrecognized compressed format that you want to untar, you accidentally copy it.

目前ADD命令在我看来太神奇了。它可以添加本地和远程文件。它有时会解压缩文件,有时不会解压缩文件。如果一个文件是您想要复制的tarball文件,您会不小心解压缩它。如果该文件是某种无法识别的压缩格式的tarball文件,而您想要解压缩它,则会意外地复制它

人们的共识似乎是ADD试图做的太多,让用户感到困惑。而且,没有人想要打破ADD现有用法的向后兼容性,因此决定添加一条行为更可预测的新指令,COPY

当Docker 1.0版本发布时,也同时发布了一条新指令COPY。与ADD不同,COPY只是简单的将目录/文件原封不动的拷贝至容器中。

COPY不支持URL作为<src>的参数,所以它无法从远程下载文件,任何你想通过COPY添加至容器的目录/文件必须在本地主机中。

同时,COPY也不支持自动解压缩文件。如果你指定的<src>参数是一个压缩文件,COPY会直接将该文件添加至容器中,而不会去尝试解压缩它。

实际上COPY可以理解为ADD的精简版,它的意义在于毫无意外的满足 将目录/文件复制到容器 这一简单场景,不会像ADD可能会发生意料之外的情况。

 

 

如何选择

如果你还不清楚自己该使用哪个,Docker团队的建议是尽量在所有场景下都是用COPY。即便是需要添加远程文件至容器中,更多情况下更推荐使用RUN curl/wget来实现,例如:

ADD http://foo.com/package.tar.bz2 /tmp/
RUN tar -xjf /tmp/package.tar.bz2 \
  && make -C /tmp/package \
  && rm /tmp/package.tar.bz2

这里我们通过ADD指令从URL下载了一个包,之后是一个RUN指令,解压缩后尝试清理掉它。但实际上,由于压缩包检索(package retrieval)与rm命令在不同的层(layers)中,该命令不会对最终构建的image减少任何空间(该问题涉及docker 构建原理,详细说明可以参考该文章:Optimizing Docker Images )

所以在这种情况下,更好的做法是:

RUN curl http://foo.com/package.tar.bz2 \
  && tar -xjC /tmp/package \
  && make -C /tmp/package

使用RUN指令,curl下载压缩包通过管道直接将其导入tar命令中进行提取。这样,我们就不会在文件系统上留下需要清理的存档文件。

总之,在任何情况下都是用COPY(除非你确定你真的需要ADD

参考: https://www.ctl.io/developers/blog/post/dockerfile-add-vs-copy/