2024-11-28,由德克萨斯大学MD安德森癌症中心创建HNTS-MRG 2024 Challenge数据集,目的通过公开数据集推动自动分割算法的发展,这对于提高放射治疗的精确性和效率具有重要意义。
数据集地址:HNTS-MRG 2024|癌症放射治疗数据集|医学影像分析数据集
一、研究背景:
头颈癌(HNC)是全球范围内常见的癌症类型之一,放射治疗(RT)是其主要治疗手段。近年来,随着医学影像技术的发展,磁共振成像(MRI)因其在软组织对比度上的优势,成为引导放射治疗的重要工具。然而,肿瘤的精确分割(contouring)是放射治疗计划制定中的关键步骤,目前主要依赖于医生的手动操作,这一过程既耗时又存在主观性。
目前遇到困难和挑战:
1、手动分割效率低下:医生需要花费大量时间在MRI图像上手动勾勒肿瘤边界,这一过程效率低下且容易疲劳。
2、肿瘤分割的主观性:不同医生之间的分割结果可能存在差异,影响治疗计划的一致性和准确性。
3、缺乏大规模公开数据集:尽管AI技术在自动分割领域展现出巨大潜力,但缺乏大规模、高质量的公开数据集限制了算法的发展和验证。
数据集地址:HNTS-MRG 2024|癌症放射治疗数据集|医学影像分析数据集
二、让我们一起来看一下HNTS-MRG 2024 Challenge数据集
HNTS-MRG 2024 Challenge数据集是一个包含200个头颈癌病例的磁共振图像及其标注的公开数据集,旨在推动AI在头颈癌放射治疗自动分割领域的研究。
该数据集包含了150个病例用于训练和50个病例用于测试,涵盖了多种成像设备和协议获取的T2加权图像。每个病例都由3到4名专家医生独立标注,以确保数据的准确性和可靠性。
数据集构建:
数据集由美国德克萨斯大学MD安德森癌症中心收集和构建,包含了从实际放射治疗中收集的图像和标注,确保了数据集的临床相关性和实用性。
数据集特点:
1、大规模:包含200个头颈癌病例,为AI算法训练和测试提供了充足的数据。
2、多样性:数据来源于不同的成像设备和协议,反映了实际临床环境中的多样性。
3、高质量标注:由多名专家医生独立标注,提高了标注的准确性和一致性。
数据集使用方法 参与者可以使用该数据集来训练和测试他们的自动分割算法,并通过聚合Dice相似系数(DSCagg)来评估算法性能。
基准测试:
基准测试使用了nnU-Net架构,这是一种在医学图像分割领域广泛认可的方法,为参与者提供了一个性能比较的基准。
2024年HNTS-MRG数据科学挑战赛的总体概述。评估了两个任务,分别关注放疗前(任务1)和放疗中(任务2)使用MRI扫描进行肿瘤分割。公开发布了来自150名患者的训练数据,随后对50名最终测试患者的算法进行了内部评估。随后举行了一个赛后虚拟总结会议,会上公开宣布了获胜者。
这项研究的磁共振成像采集参数。显示的是中位数值及其范围。这些值是针对所有时间点(放疗前和放疗中)的整个数据集计算得出的。
放疗前(pre-RT)和放疗中(mid-RT)的T2加权(T2w)MRI扫描的比较,展示了未进行脂肪抑制的图像(T2w非脂肪抑制[NFS],顶行)和进行了脂肪抑制的图像(T2w脂肪抑制[FS],底行)。放疗前的扫描与相应的放疗中的扫描进行了共配准。
Simultaneous Truth and Performance Level Estimation (STAPLE) 算法共识过程的示例,该过程将多个独立标注者的分割(红色、黄色、蓝色、紫色轮廓结构)合并为单一的最终共识分割(绿色填充结构),用于主要的肿瘤体积。
这个挑战中掩模标记方案的视觉示例。背景 = 0,主要肿瘤体积(GTVp)= 1(绿色覆盖),转移性淋巴结(GTVn)= 2(黄色覆盖)。所示掩模是多个独立标注者共识分割的结果。可视化操作在3D Slicer中进行。
观察者间变异性(IOV)数据,针对放疗前(pre-RT)和放疗中(mid-RT)时间点的主要肿瘤体积(GTVp)和淋巴结肿瘤体积(GTVn)感兴趣区域进行分层。(A) Dice相似系数(DSC),(B) 95% Hausdorff距离(HD95),(C) 平均表面距离(ASD),(D) 2mm容忍度下的表面DSC(SDSC)。每个数据点对应于给定患者图像的所有观察者对的中位数度量值。每个盒子代表四分位距,水平线表示中位数得分。异常值显示为须外的单个点。对于DSC和SDSC,较高的值表示更大的一致性,而对于HD95和ASD,较低的值表示更大的一致性。
添加图片注释,不超过 140 字(可选)
训练集和保留的私有评估集(写作测试)中关键参数的分布。(A) T2加权MRI序列类型(Non-FS:非脂肪抑制,FS:脂肪抑制)。(B) 中期治疗时的肿瘤反应状态(NCR:非完全反应,Other:主要和淋巴结的完全和非反应的任何组合)。(C) 主要肿瘤体积(GTVp)和(D) 淋巴结肿瘤体积(GTVn),两者均按数据集的中位数分类为高于或低于中位数。(E) 人类乳头瘤毒(HPV)状态。(F) 肿瘤解剖亚位(BOT:舌根)。(G) 根据美国癌症联合委员会第八版分期系统,肿瘤T分期和(H) N分期。
任务1(放疗前分割,顶部)和任务2(放疗中分割,底部)的模型输入和输出的示例。
HNTS-MRG 2024挑战赛的初始注册者和最终参与者的地理分布,按大洲划分。(A) 初始注册者数量,显示在Grand Challenge网站上报名参加比赛的参与者分布。(B) 最终合格参与者数量,反映完成测试阶段提交并提交相应手稿的参与者。两张地图中的颜色比例代表每个大洲的Grand Challenge账户数量。对于最终合格参与者,只考虑了每个团队的主要联系人。
三、让我们一起展望HNTS-MRG 2024 Challenge数据集的应用场景
以前医学生和放射治疗师在学习如何识别和分割头颈癌肿瘤时,他们主要依靠的是教科书上的理论知识和有限的实习机会。在实际操作中,他们可能会看到一些案例的图片或者视频,但这些内容往往是静态的,数量有限,而且缺乏互动性。在实习期间,他们可能会有机会在资深医生的指导下观察几次真实的肿瘤分割过程,但这种学习机会非常宝贵,不是每个人都能有足够的实践机会。
现在有了HNTS-MRG 2024 Challenge数据集训练的系统
我们有了一个包含150个真实头颈癌病例的数据库,这些病例都配有专家级的标注。这意味着医学生和放射治疗师可以通过这个数据集训练的系统,进行大量的实践操作。
比如说,一个医学生可以通过这个系统,加载一个患者的MRI图像,然后尝试自己分割肿瘤。系统会提供专家的标注作为参考,学生可以立即看到自己的分割结果与专家标注的差异。这种即时的反馈是过去难以实现的,它能帮助学生快速学习和改进。
再比如,放射治疗师可以在准备实际治疗计划之前,先用这个系统模拟肿瘤分割。他们可以尝试不同的分割策略,看看哪种方法能得到更高的准确性评分。这种模拟训练不仅提高了他们的技能,也增强了他们对肿瘤形态和生长模式的理解。
总之,HNTS-MRG 2024 Challenge数据集和训练系统为头颈癌的临床研究和教育带来了革命性的变化,它让学习和实践变得更加高效、个性化,同时也为提高治疗质量提供了强有力的工具。