一、PatchCamelyon2018介绍
间接免疫荧光(IIF)是一种通过荧光标记的二级抗体间接检测患者血清中特定抗原的自体抗体的技术,广泛应用于如系统性红斑狼疮等自身免疫疾病的诊断。HEp-2细胞,因其表达多种细胞核抗原,成为IIF实验的理想基质,尽管存在来源争议,现认为是人类乳突病毒相关宫颈腺癌细胞。
随着显微成像硬件的最新进展,允许将载玻片数字化为全载玻片图像 (WSI),数字病理学领域正在迅速发展。这种数字化促进了图像分析算法来协助和自动化诊断任务。一种经过验证的方法是使用卷积神经网络 (CNN),这是一种深度学习模型,对从整张幻灯片图像中提取的补丁进行训练。这些基于补丁的预测的总和可以作为模型使用的幻灯片级表示来识别转移、癌症分期或诊断并发症。
二、PatchCamelyon2018任务
三、PatchCamelyon2018数据集
PatchCamelyon2018数据包含 400 个前哨淋巴结切片的 H&E 染色 WSI。使用 40 倍物镜(最终像素分辨率为 0.243 微米)在 2 个不同的中心采集载玻片并进行数字化。以 10 倍进行欠采样以增加视野。为了防止选择背景斑块,如果最大像素饱和度低于 0.07(经验证不会丢弃训练集中的肿瘤数据),则将WSI转换为 HSV、模糊并过滤掉斑块。基于补丁的数据集通过迭代选择 WSI 并以概率 p 选择正或负补丁来采样。一共从淋巴结切片的组织病理学扫描中提取的 327680 张彩色图像 (96 x 96px) 组成。每幅图像都标有二进制标签,表明存在乳腺癌转移。该数据集分为包含 262144 个示例的训练集,以及包含 32768 个示例的验证和测试集。拆分之间的 WSI 没有重叠,并且所有拆分的正例和负例之间都具有 50/50 的平衡。正标签表示斑块的中心32x32px区域至少包含一个肿瘤组织像素。贴片外部区域的肿瘤组织不会影响标签。
数据下载:
https://patchcamelyon.grand-challenge.org/Download/
四、技术路线
1、将图像缩放到固定大小96x96,然后采用均值为0,方差为1的方式进行归一化处理,再将数据分成训练集和验证集。
2、搭建ResNet2d网络,使用AdamW优化器,学习率是0.001,batchsize是512,epoch是500,损失函数采用交叉熵。
3、训练结果和验证结果
4、验证集分类结果
5、测试集分类结果