PER(人员),LOC(位置),ORG(组织)和MISC(其他,包括所有其他类型的实体) https://www.clips.uantwerpen.be/conll2003/ner/ 4 2010 I2B2 2010 I2B2 NER任务考虑了临床数据,重点关注临床问题、测试和治疗实体类型 https://www.i2b2.org/NLP/Relations/ 5 DDIExtraction2013(
The 2012 informatics for integrating biology and the bedside (i2b2) project temporal relations challenge corpus (in short, i2b2 temporal corpus) (29, 30): It contains 310 de-identified discharge summaries
最初,他的研究方向是自然语言处理,与MSRA的研究员合作,他参与的 “病历共指消解系统” 在由 MIT 举办的集成生物学及内部信息挑战赛(I2b2 Challenge)上取得第一,参与撰写的 2 篇论文也先后发表
系统通过经验证的ETL过程从EDC获取并迁移表型信息到GORdb,同时将去标识化的结构化EHR数据加载到整合生物学与临床信息学(i2b2)星型模式中,包含诊断、药物、程序等多维度临床数据。
最初,他的研究方向是自然语言处理,通过与有丰富经验的学者合作,他参与研究的“病历共指消解系统”在由MIT举办的集成生物学及内部信息挑战赛(I2b2 Challenge)上取得第一,参与撰写的2篇论文也先后发表
对于生物医学方面,大型语料库如PubMed、PubMed Central(PMC),以及临床数据集如MIMIC-Ⅲ、eICU和i2b2,使模型能够学习领域特定语言和临床推理模式。
与疾病相关的实体,可以使用以下数据集:NCBI2010 i2b2/VABC5CDR对于与药物/化学品相关的实体,可以使用以下数据集:BC5CDRBC4CHEMD对于与基因相关的实体,可以使用以下数据集:
逻辑系统支持跨句推理 1.3 方法分析 代表性工作: FastContext(EMNLP 2020):采用有限状态 transducer 级联架构,在临床文本中实现: 创新点:动态规则优先级调度算法 性能:在i2b2
我们提出的方法的早期实验在i2b2数据集上实现了98.91%的召回率。此性能与当前非结构化临床文本去识别的最先进模型相当。 Early experimentation of our proposed approach achieved 98.91% recall rate on i2b2 dataset.
低资源与跨领域迁移突破 少样本学习机制革新推动资源效率提升: 元知识蒸馏:COPNER在医疗域(I2B2’14)仅1-shot即达64.3 F1,超基线9.2点 跨模态增强:PCBERT用字形拼音多模态在中文低资源
Anusri Pampari、Preethi Raghavan、Jennifer Liang 和 Jian Peng 作者利用来自 i2b2 数据集的专家临床记录注释。
我们提出的方法的早期实验在i2b2数据集上实现了98.91%的召回率。此性能与当前非结构化临床文本去识别的最先进模型相当。 Early experimentation of our proposed approach achieved 98.91% recall rate on i2b2 dataset.