南开大学参研OIA系列数据集 面向社会公开发布


来源:南开大学新闻网 更新时间:2019/12/18 阅读次数:

  11月29日,南开大学计算机学院-北京上工医信科技有限公司联合实验室首次推出标准化眼科图像分析(OIA,Ophthalmic Image Analysis)系列数据集(简称:OIA系列数据集),并为北京大学“智慧之眼”国际眼底图像智能识别竞赛提供了数据支持。为了更好地推动人工智能技术在眼科图像智能识别领域的发展,经竞赛专家委员会讨论决定,OIA系列数据集在竞赛后正式对全社会公开发布、以推动AI+医疗数据分析领域的蓬勃发展。

  高质量的训练数据集对于人工智能的分析水平高低十分重要,决定了一项技术能否从实验室真正走向临床应用。此前有6个国际公开的数据集(DRIVE、Kaggle DR、Messidor-2、IDRiD、Palm、STARE),并没有中国数据集的身影。此次,南开大学智能计算系统(NKiCS)研究室联手北京上工医信科技有限公司、中国微循环学会、北京大学健康医疗大数据国家研究院、同仁医院眼科专家组等,共同从来自全国26个省份,400多家临床医院的160多万张眼底图像库中,通过专业人员抽取、眼科专家标注、计算机专家建模评测,发布了面向糖尿病视网膜病变分类和病变点分割的数据集OIA-DDR,以及基于眼底图像的多类型病变分类的数据集OIA-ODIR。

  OIA-DDR数据集和OIA-ODIR数据集是OIA系列数据集的两个子集。其中,OIA-DDR数据集包含13673张眼底图像,是我国目前最大的公开眼底图像数据集,包含了四种糖尿病视网膜病变相关的病变点的标注,757张包含像素级和bounding-box级的病变点标注。OIA-ODIR数据集包含10000张眼底图像,取样人群年龄涵盖全年龄段人群,其中30周岁至80周岁的人群占比超过96%;该数据主要针对眼部多疾病同步诊断,每张眼底图像包含8个疾病标签,分别为:正常N、糖网病D、青光眼G、白内障C、老年黄斑变性A、高血压H、近视M、其他疾病/异常O。OIA-ODIR数据集是国际上首次推出的基于一张眼底图像的多类型病变检测数据集。除了OIA-DDR和OIA-ODIR之外,OIA系列数据集预计在近两年推出针对青光眼、黄斑变性、白内障和更多眼底疾病种类的数据。

  OIA是基于临床环境的、高质量的、数据样本充分的系列数据集,填补了中国眼科图像数据领域的空白,已经发布的OIA-DDR和OIA-ODIR在世界上位于公开数据集前列,主要特色有:临床医生对患者图像-文字诊断关联结构的专家标注、7种不同眼底疾病标签的多病变标签(世界首次)、全国26个省400余家医院的临床数据来源、757张图片含病变点标注(世界第一)、4种糖尿病视网膜病变相关病变点超精细标注、42种不同品牌相机拍摄的兼容度、专家组标注和中国医学装备协会认证等。

  附:OIA系列数据集链接:https://github.com/nkicsl/OIA