在数字化转型当下,越来越多事物在被电子数字化,我们在收获数字化便利好处的同时,也要面对数据信息更容易被泄漏、篡改、盗版等问题,而数字水印技术就是为解决上述问题的。
数字水印,是指将特定的信息嵌入数字信号中,数字信号可能是音频、图片或是视频等。数字水印可分为浮现式和隐藏式两种,明水印(visible watermarking),其所包含的信息可在观看图片或视频时同时被看见。盲水印(blind watermarking)是以数字数据的方式加入音频、图片或视频中,但在一般的状况下无法被看见。隐藏式水印的重要应用之一是保护版权,期望能借此避免或阻止数字媒体未经授权的复制和拷贝。数字水印技术是一门新兴的多学科交叉的应用技术,它涉及不同学科领域的理论和技术,如信号处理、图像处理、信息论、编码理论、密码学、检测理论、数字通信和网络技术等。
根据信息嵌入方式的不同,可将数字水印的技术方案分为空间域嵌入方案和变换域嵌入方案。最低有效位(Least Significant Bit, LSB)方法是最经典的空间域嵌入方案之一,通过直接修改图片像素值的最低有效位实现水印信息的秘密嵌入。LSB方法对图像视觉质量的影响很小,但是鲁棒性也很低,简单的JPEG压缩操作就能完全破坏掉嵌入的水印信息。在变换域方案中,离散傅立叶变换(Discrete Fourier Transform, DFT)、离散余弦变换(Discrete Cosine Transform, DCT)以及小波变换(Wavelet Transform, WT)都是常用的技术手段。基于变换域的数字水印嵌入方案具有较强的鲁棒性,能够抵抗常见的音视频操作和工具。
数字水印技术的原理、实现及其应用
嵌入数字作品中的信息必须具有以下基本特性才能称为数字水印:
a.. 隐蔽性:在数字作品中嵌入数字水印不会引起明显的降质,并且不易被察觉。
b.. 隐藏位置的安全性:水印信息隐藏于数据而非文件头中,文件格式的变换不应导致水印数据的丢失。
c.. 鲁棒性:所谓鲁棒性是指在经历多种无意或有意的信号处理过程后,数字水印仍能保持完整性或仍能被准确鉴别。可能的信号处理过程包括信道噪声、滤波、数/模与模/数转换、重采样、剪切、位移、尺度变化以及有损压缩编码等。
在数字水印技术中,水印的数据量和鲁棒性构成了一对基本矛盾。从主观上讲,理想的水印算法应该既能隐藏大量数据,又可以抗各种信道噪声和信号变形。然而在实际中,这两个指标往往不能同时实现,不过这并不会影响数字水印技术的应用,因为实际应用一般只偏重其中的一个方面。如果是为了隐蔽通信,数据量显然是最重要的,由于通信方式极为隐蔽,遭遇敌方篡改攻击的可能性很小,因而对鲁棒性要求不高。但对保证数据安全来说,情况恰恰相反,各种保密的数据随时面临着被盗取和篡改的危险,所以鲁棒性是十分重要的,此时,隐藏数据量的要求居于次要地位。
数字水印技术的基本思想源于古代的密写术。古希腊的斯巴达人曾将军事情报刻在普通的木板上,用石蜡填平,收信的一方只要用火烤热木板,融化石蜡后,就可以看到密信。使用最广泛的密写方法恐怕要算化学密写了,牛奶、白矾、果汁等都曾充当过密写药水的角色。可以说,人类早期使用的保密通信手段大多数属于密写而不是密码。然而,与密码技术相比,密写术始终没有发展成为一门独立的学科,究其原因,主要是因为密写术缺乏必要的理论基础。
如今,数字化技术的发展为古老的密写术注入了新的活力,也带来了新的机会。在研究数字水印的过程中,研究者大量借鉴了密写技术的思想。尤其是近年来信息隐藏技术理论框架研究的兴起,更给密写术成为一门严谨的科学带来了希望。毫无疑问,密写技术将在数字时代得以复兴。
机器学习领域产权保护也在用数字水印,如模型水印。
模型水印最早由KDDI研究所和国家信息学研究所的研究人员于2017年4月提出,其提出的目的是为了保护机器学习、深度学习等AI模型的知识产权。现有的模型水印技术从任务逻辑上看,都包含以下两个步骤:
1)植入水印:在模型的开发和训练阶段,向模型中采取特定策略植入数字水印;
2)提取水印:从要举证的模型中提取和恢复水印信息,将提取的水印与植入的水印进行比较,从而判断是否侵权。
不同的模型水印技术在植入水印和提取水印的策略上有所不同。大多数模型水印技术通过模型的输出来提取水印,因此这类模型水印技术的举证主要依赖目标模型的输出。另一部分模型水印技术将水印植入了模型文件中,并不在模型输出体现,这类模型水印技术在举证时就要求能够在白盒环境中访问目标模型的结构。
一般来说暗水印可以隐藏在大部分多媒体传输和存储载体中,比如图片、视频、音频、邮件、文档等都是不错的载体。基于图像的暗水印技术是暗水印里面最成熟的一种,嵌入方法也多种多样。根据嵌入维度不同,又可以细分为空域水印和变换域水印。空域水印可以简单的理解为直接对解码后的图像像素值进行编辑和嵌入信息;变换域水印是将图像的像素信息转换到变换域,然后在变换域添加信息后再转换到空域,这个过程中空域信息也会被修改。所以变换域水印也可以理解为间接的空域水印。
无线传感器网络(WSN)方式被认为是物联网应用领域的重要基础设施。这种方式使用了各种低成本和低功耗的连接互联网的设备,这些设备能从不同的情况感知周围的数据,并将它们转发到Internet。但是,传输层套接字中依赖公钥、私钥、数字签名和数字认证的传统安全机制,由于加解密操作成本高,不适合用于这类设备应对安全问题。这就使得轻量级安全算法和水印系统等技术成为可行选择。这些局限性业促使研究者对物联网相关领域中各种水印方法展开研究。原文中介绍了几个基于不同方法的水印技术研究,如哈希、深度学习、加密和脆弱水印。