医学影像(Medical Imaging),是指利用某种介质(例如X射线、电磁、超声波等等)与人体相互作用,从而以影像方式将人体内部组织器官的结构和密度表现出来,然后提供给医生进行判断并对人体健康状况得出结论的一门科学。


医学影像仪器主要包含:

  1. X光影像仪器
  2. CT(Computerized Tomography Computed Tomography)
  3. 超声(分B超、彩色多普勒超声、心脏彩超、三维彩超)
  4. 核磁共振成像(MRI)

DICOM(医学数字成像和通讯),英文全称Digital Imaging and Communications in Medicine,是ACR(美国放射协会)和NAMA(美国国家电子制造商协会)联合开发医学数字成像和通讯的一个通用标准。


Dicom官方文档:https://www.dicomstandard.org/current/


患者的医学图像以DICOM文件格式进行存储,其中包含了图像信息以及患者的PHI(protected health information,即姓名、性别、年龄等),以及产生图像的设备的相关信息。如下图所示,以dcm后缀结尾的文件即DICOM文件,其存储的信息为二进制格式


DICOM文件的内容一般由一个DICOM文件头和一个DICOM数据集组成

每个DICOM文件都必须包含文件头,主要信息:

  1. 文件导言
  2. DICOM前缀
  3. 文件元信息元素

DICOM数据集是DICOM文件的主要组成部分

  1. TAG号
  2. 值表示
  3. 值长度
  4. 值域

基于DICOM3.0标准,每一张图都携带大量的信息,可以细分为以下四类:

  • Patient
  • Study
  • Series
  • Image

每一项信息都可以用DICOM TAG来标识,DICOM TAG由两个十六进制数组成,即(Group,Element)

每一项信息被包装成最基本的单元:Data Element(数据元素)。每个Data Element 由四部分组成:

  • DICOM TAG :存储该项信息的标识
  • VR(Value Representation):存储描述该项信息的数据类型
  • value length :存储描述该项信息的数据长度
  • value:存储描述该项信息的数据值

处理DICOM文件的现成库

  • C++:DCMTK
  • Java:dcm4che
  • Python:pydicom

安装pydicom

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pydicom

pydicom数据的读取


pydicom数据的处理


pydicom数据的保存


DICOM文件可以大致分为两部分:
一部分:与图像相关的元信息,包括患者信息,检查信息,序列信息,图像信息等等。
另一部分:图像的像素数据。 在解析DICOM文件中的像素数据的时候,我们先需要读取以下图像相关信息:
以下是某个CT影像中的图像信息示例: (0028,0002) Samples per Pixel VR: US Length: 2 Value: 1 (0028,0004) Photometric Interpretation VR: CS Length: 12 Value: MONOCHROME2 (0028,0010) Rows VR: US Length: 2 Value: 512 (0028,0011) Columns VR: US Length: 2 Value: 512 (0028,0030) Pixel Spacing VR: DS Length: 22 Value:
0.48828125\0.48828125 (0028,0100) Bits Allocated VR: US Length: 2 Value: 16 (0028,0101) Bits Stored VR: US Length: 2 Value: 12 (0028,0102) High Bit VR: US Length: 2 Value: 11 (0028,0103) Pixel Representation VR: US Length: 2 Value: 0 (0028,1050) Window Center VR: DS Length: 12 Value: 00100\00100 (0028,1051) Window Width VR: DS Length: 12 Value: 00500\00500 (0028,1052) Rescale Intercept VR: DS Length: 6 Value: -1000 (0028,1053) Rescale Slope VR: DS Length: 2 Value: 1 (0028,2110) Lossy Image Compression VR: CS Length: 2 Value: 01 (0028,2112) Lossy Image Compression Ratio VR: DS Length: 8 Value: 6.228918

1.(0028,0002) Samples per Pixel
每一个像素的取样数,一般来说,CT,MR,DR等灰度图像都是1,而彩超等彩图像都是3,分别表示R, G, B三个颜色通道。

2.(0028,0004) Photometric Interpretation
我们经常碰到的Photometric Interpretation有以下几种类型:
Monochrome2 一般的灰度图像都采用这种,Pixel值越大,图像就越白。
Monochrome1 只有部分CR, DR图像使用,Pixel值越大,图像就越黑。
Palette Colour 一般用于彩超图像,每个像素占用8位或者16位,调色板保存在[0028,1201]RedPaletteColorLookupTableData, [0028,1202]GreenPaletteColorLookupTableData, [0028,1203]BluePaletteColorLookupTableData的属性中。
RGB 这是最常用的彩图像格式。
YBR_FULL 另外一种彩
图像格式, 存储格式为Y(Luminance 亮度), B(Blueness 蓝色), R(Redness, 红色)
YBR_FULL_422 一般用于JPG有损压缩格式的彩图像,每两个像素共同使用32位,每一个像素都有自己的Y(Luminance 亮度),但是共享相同的B(Blueness 蓝色), R(Redness, 红色)。所以,它的像素值存储方式是:YYBR,YYBT,YYBR
YBR_RCT 用于JPEG 2000无损压缩彩
图*像,Reversible Color Transformation, 可逆色彩变换。
Y = (R+2G+B)/4, CB = B-G , CR = R - G
G = Y - (CR+CB)/4 , R = CR + G, B = CB + G
YBR_ICT 用于JPEG 2000有损压缩彩**图像 Irreversible Color Transformation, 不可逆色彩变换。
Y = + .29900R + .58700G + .11400B
CB = - .16875R - .33126G + .50000B
CR = + .50000R - .41869G - .08131B
3. (0028,0010)Rows
图像的高度

  1. (0028,0011)Columns
    图像的宽度

  2. (0028,0030)Pixel Spacing
    图像像素间距,读取Pixel Data的时候不需要,主要用于长度测量。

  3. (0028,0100)Bits Allocated
    一个像素取样点存储时分配到的位数,一般RGB的图像,每一个颜色通道都使用8位,所以一般取值为8。对于灰度图像,如果是256级灰阶,一般就是8位。如果高于256级灰阶,一般就采用16位。

  4. (0028,0101)Bits Stored
    一个像素取样点存储时使用到的位数。比方说示例中CT影像,采用的是4K灰阶,像素值取值范围为0~4095,所以使用到的位数为12位。

  5. (0028,0102)High Bit
    最高位序号,它定义了存储点在分配的内存中的排列方式,它的值是最后一个bit的序号。如果第一个bit放在0位,那么最后一个bit为Bits Stored -1。

  6. (0028,0103)Pixel Representation
    如果这个值为0, 这表明是无符号类型,其VR类型应该为US,Unsigned Short. 如果这个值为1, 这表明为有符号类型,其VR类型应该为SS,Signed Short.

  7. (0028,1050)Window Center 和 (0028,1051) Window Width
    窗宽窗位,不解释

  8. (0028,1052)Rescale Intercept 和 (0028,1053)Rescale Slope
    用于根据像素值计算原始值,比方说,CT可以用于计算HU值。
    比方说:HU = Rescale Slope * X + Rescale Intercept.

  9. (0028,2110)Lossy Image Compression
    当该值为1时,表明该图像曾经经过有损压缩处理。即使后来解压缩后,再用非压缩格式存储和传输,该值也需要保持为1.

  10. (0028,2112)Lossy Image Compression Ratio
    有损压缩压缩率。 对于多帧图像,我们还需要读取Number of Frames (0028,0008)来获取帧数,然后,逐帧读取Pixel Data。 对于彩*图像,我们还需要读取Planar configuration (0028,0006),它定义了各个彩色通道值在Pixel Data中排列的排列方式。 当此值为0的时候,它这样排列的RGBRGBRGBRGBRGB。 当此值为1的时候,它是这样排列的:RRRRR…GGGGG…BBBBB。 对于多帧图像,它是这样排列的:第一帧的RRR…,第一帧的GGG…,第一帧的BBB…,第二帧的RRR…,第二帧的GGG…,第二帧的BBB…