CHIP2019评测任务1概述临床术语标准化任务-USB迷|专注于互联网分享

2024年4月28日发(作者：公羊良骏)

第

卷第

期

中文信息学报

JOURNAL

Vol. 35, No. 3

Mar.，2021

2021

年

月

CHINESE

INFORMATION

PROCESSING

文章编号：

1003-0077(2021)03-0094-06

2019评测任务1概述：临床术语标准化任务

黄源航

，焦晓康

，汤步洲

1>3,

陈清财

“3,

闫峻

(1.

哈尔滨工业大学计算机科学与技术学院，广东深圳

518055;

医渡云（北京）技术冇限公司，北京

100191; 3.

鹏城实验室，广东深圳

518055)

摘要：第

五届中国健康信息处理会议

（China Conference on Health Information Processing

，

CHIP2019)

组织了中

文临床医疗信息处理方面的三个评测任务，其中任务1为临床术语标准化任务。该任务的主要目标是对中文电子

病历中挖掘出的真实手术实体进行语义标准化。评测数据集中所有手术原词均来自于真实医疗数据，并以《

ICD9-

2017

协和临床版》手术词表为标准进行了标注。共有

支队伍报名参加了评测，最终有

支队伍提交了

组结

果。该评测以准确率作为最终评估标准，提交结果中最高准确率达到

94.83

%。

关键词：中国健康信息处理会议；临床术语标准化；自然语言处理

中图分类号：

TP391

文献标识码：

Overview of the CHIP2019 Shared Task I rackl

：

Normalization

of Chinese Clinical Terminology

HUANG

Yuanhang〗，JIAO

Xiaokang2，TANG

Buzhou

丨

s，CHEN

Qingcai

丨

3，YAN

Jim

2，

(1. School of Computer Science and Technology，

Shenzhen. Guangdong 518055

Harbin Institute of Technology»

，

China; 2. Yidu Cloud (Beijing) Technology Co.

，

Ltd.

Beijing 100191, China

；

3. Peng Cheng Laboratory. Shenzhen. Guangdong 518055, China)

Abstract

：

The 5th China Conference on Health Information Processing held a shared task including three tracks on

ChinevSe clinical medical information processing. The first track is normalization of Chinese clinical terminology that

assigns standard terminologies to surgical entities extracted from Chinese electronic medical records. All surgical en

tities in the Trackl dataset were collected from real medical data and annotated with standard surgical terminologies

of "IC'D9-2017 Clinical Edition". A total of 56 teams signed up for the track* and eventually 20 teams submitted 47

system runs. Accuracy is used to measure the performances of all systems, and the highest accuracy of all submitted

system runs reached 0.9483.

Keywords

：

China Conference on

ral language processing

Health Information Processing

；

normalization of Chinese clinical terminology

；

natu

临床上，由于医疗人员的记录风格存在差异.关

()引言

随着信息技术的快速发展，计算机技术在医疗

领域得到了广泛的应用。如何利用计算机相关技术

处理海量的临床医疗数据是诸多学者一直在研究的

热点问题。其中，临床术语标准化是临床医疗信息

处理领域的一个重要研究方向。

于同一种诊断、手术、药品、检查、化验、症状等往往

会有成百上千种不同的写法。比如，在中文临床医

疗文本中，“先天性脊柱侧弯”可以表述为“先天性脊

柱侧凸也可以表述为“先天性脊柱侧弯畸形”；在

英文临床医疗文本中，

“heart

attack

”"

”

和

“

myo

cardial

infarction

”

都可以代表“心肌梗塞”的含义。

临床术语标准化就是要为临床上各种不同表述找到

收稿日期：

2020-06-15

定稿日期：

2020-08-21

基金项目：国家自然科学基金

(61876052);

国家自然科学联合重点基金（

U1813215);

广东省自然科学基金（

2020KZDZX1222);

深圳市

基础研究项目（

JCY_|20067)

3期

黄源航等：

CHIP

2019评测任务1概述：临床术语标准化任务

对应的标准表述。有了术语标准化的基础，研究人

员才可以对临床医疗文本进行后续的统计分析。目

前部分医疗机构采用人

方式将临床术语手动规范

化为标准术语，但是由于临床术语专业性较强，并且

表述方式过于多样，这种方式对工作人员专业知识

要求较高，所需人力成本巨大，得到的标准化结果也

往往不够准确。

第五届中国健康信息处理会议（

2019)组

织了与中文临床医疗信息处理相关的三项评测任

务，其中评测任务1为临床术语标准化任务。该评

测任务鼓励参赛者使用计算机技术对中文电子病历

中挖掘出的真实手术实体进行语义标准化.即给定

一手术原词，将其自动映射为手术词表中对应的手

术标准词。本次评测数据集由医渡云（北京）技术有

限公司提供，其中的手术原词全部来自真实医疗数

据。训练数据由专业人员依据《

ICD

9-2017协和临

床版》手术词表对手术原词进行了人工标注，将手术

原词手动映射为手术词表里的手术标准词，标注样

例如表1所示，其中多个标准词用分隔。参

赛队伍需要构建系统将测试数据中的手术原同映射

到给定手术词表里的手术标准词。本次评测以准确

率（

accuracy

)作为评估指标。最终，排名第一的参

赛队伍提交结果的准确率为94.83%。本文将对此

次评测任务中的数据、各支队伍的提交结果以及评

价指标进行分析和总结。

表

I CHIP2H19

评测任务丨标注数据样例

原始词标准词

横结肠造口还纳术

横结肠造口闭合术

右肾上腺巨大肿瘤切除术肾上腺病损切除术

左侧单侧乳房根治性切

除术

单侧根治性乳房切除术

经皮三叉神经半月节射

频热凝术

三叉神经半月节射频热凝术

右肾探查.右肾根治术

肾探查术

：^

#单侧科切除术

USB迷 | 专注于互联网分享

CHIP2019评测任务1概述临床术语标准化任务

与本文相关的文章

评论列表 (0)