碎纸片拼接复原的设计与实现
摘要
破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。由于人工拼接效率较低,我们利用MATLAB软件编写程序,实现碎纸片拼接技术的计算机化,实现批量拼接,以节省人力和时间。
吻合参数
最小的原则,可计算出下一张图片。重复此步骤,以此类推,每次都挑选出剩余图片中与前一幅图片吻合参数最小的作为与之相连接的碎纸图片。最后可得到
附件1的答案矩阵为:
008 | 014 | 012 | 015 | 003 | 010 | 002 | 016 | 001 | 004 | 005 | 009 | 013 | 018 | 011 | 007 | 017 | 000 | 006 |
附件2与附件1的模型求解方法相同,最后得到:
附件2的答案矩阵为:
003 | 006 | 002 | 007 | 015 | 018 | 011 | 000 | 005 | 001 | 009 | 013 | 010 | 008 | 012 | 014 | 017 | 016 | 004 |
(二)由于每片独立的拼接无法达到最佳效果。故我们以缩小比对范围的形式来进行优化。附件3类比于问题一,用相同的方法找到所有碎纸片的左边界,共11张,分别
049 | 061 | 168 | 038 | 071 | 014 | 094 | 125 | 029 | 007 | 089 |
根据行特征筛选出每行的碎纸图片以保证全部图片均得到分类。此时选取数量最少一行作为入手点,利用MATLAB软件进行图片拼接。但由于碎纸图片的行特征值有误差,故图片大块拼接正确,但与实际情况有细微差别。通过简单的人工检测得到准确行的排列顺序,由于行信息充足,借用第一问最终达到正确拼接效果。结果矩阵如 表12 所示。
英文字母最为密集行中点位置。需将附件4图片对应的矩阵转化为0-1列向量(空白行为0,反之则为1)。利用此方法筛选出位于同一行的碎纸片并进行纸片拼接。后续拼接方法同附件3。结果矩阵如 表13 所示。
(三)结合双面信息处理边界,得到边界特点。根据元音字母中心位置得出行高,从而更准确筛选同行图片。双面信息同时校准,更容易得到拼接顺序,人工干预少。结果矩阵如 表5 所示。
模型一简单易处理,适用于含大量信息的碎纸片拼接且准确度高;模型二针对文字内容的中英文差异分别利用吻合参数和行高作为标准来筛选图片;模型三深入生活实际,考虑日常生活中反正面印刷情况并结合英文印刷特点,实用性高,双面信息同时校准,人工干预少。