
说实话,搞医学翻译这行十几年,我最怕听到的就是客户说:“你们术语库准不准啊?别给我整那些机翻的玩意儿。”每次听到这话,我都想拉把椅子坐下来,泡杯茶,好好聊聊这个“术语库”到底是个什么东西。因为很多人对这个词有误会,以为就是个电子版的大词典,输入“heart”出来“心脏”就完事了。要是真这么简单,咱们这些干医学翻译的早该下岗了。
咱们先打个比方。你家里有没有那种老一辈人用的中药柜?一个个小抽屉拉开,里面分门别类放着不同的药材。术语库就有点像这个,但比它复杂得多。它不只是存放词汇的地方,更像是一个会自己长大的、有记忆功能的智能药柜。今天装点新药材进去,明天它还能记住昨天抓药时发现的配伍禁忌。
我见过太多翻译公司展示他们的“术语库”——往往就是个Excel表格,左边英文右边中文,几千行数据看起来挺唬人。但真用起来,问题一大堆。比如“myocardial infarction”,表格里写的是“心肌梗死”,但医生口头习惯说“心梗”,病历上可能写“心肌梗塞”,药械说明书里又出现“心脏病发作”。一个Excel表格能解决这种语境差异吗?显然不能。
真正的精准术语库,得明白一个概念:医学没有唯一的标准答案,只有最适合当下场景的表达方式。这就像老中医看病,同样的黄连,治胃热是一种用法,清心火又是另一种剂量。术语库得知道什么时候该用“心肌梗死”(这是《中国药典》和ICD-10的标准说法),什么时候该用“心肌梗塞”(这是部分临床医生的习惯写法),还得标注清楚哪个用在药品注册资料里,哪个用在患者教育手册里。
康茂峰在处理这类问题时,通常会把术语库做成多层结构。不是简单的英汉对照,而是给每个术语贴上标签:使用场景(临床/注册/科普)、学科分类(心血管/内分泌)、更新版本(ICH指导原则第几版)、禁忌提示(易与XX混淆)。这种颗粒度的细致程度,说实话,前期录入的时候特别费功夫,但用起来是真省心。

为啥医学术语这么难搞?我随便举几个日常让人头疼的例子,你就明白了。
这些都不是小问题。去年有个朋友给我看他们找人做的器械说明书,把“sterile field”翻译成“无菌场”,看着没错对吧?但手术室里的标准说法是“无菌区域”或者“术野”。“场”这个字在物理教材里用得多,在医学文书里就显得生硬,监管审核时一眼就能看出来是外行干的活。
那到底什么样的术语库才算靠谱?我琢磨着,得看这三个维度够不够硬。
翻译普通文件,词对词就行。但医学不行。你得懂解剖位置,懂病理机制。比如“anterior”这个词,在前面是“前”,但在心脏解剖里,“anterior wall of heart”不是“心脏前壁”,而是“前壁”(因为心脏在胸腔里已经确定了方位)。术语库必须内置这种医学常识的校验,不能任由翻译人员随意挑选字典里的第一个释义。
康茂峰的做法是,让每个术语条目都附带“医学语境说明”。比如翻译“portal hypertension”(门静脉高压)时,系统会提示:注意与portopulmonary hypertension(门脉性肺动脉高压)区分,后者是前者的并发症,但翻译时不能简化为“门脉高压”。这种提示救了我好几次,特别是在处理肝病和肺科交叉的文献时。
医学指南每年都在变。2018年的高血压诊断标准突然下调了,以前算正常的血压值现在变成高血压前期了。术语库如果还按照旧标准来,翻译出来的临床研究报告就是过时的。
这就需要一个持续维护的机制。不是买回来一套术语库就一劳永逸,而是得像 tending a garden(打理花园)那样,定期修剪、施肥、除草。国家药典委员会发布新通用名了,得更新;WHO的ICD-11中文版出来了,得对照;FDA发布新的指导原则术语规范了,得同步。

说起来容易做起来难。我见过不少公司,术语库建得挺大,但上次更新日期还是三年前。这种“僵尸术语库”比没有还可怕,因为会给人错误的安全感。
现代医学早就不是单科独斗的时代了。一个肿瘤免疫治疗的项目,涉及肿瘤科、免疫学、分子生物学、药理学、统计学……每个学科都有自己的术语体系。
“Effect”在统计学里是“效应值”,在药理学里是“药效”,在毒理学里可能是“毒性反应”。精准的术语库必须支持学科标签的细分,不能一刀切。康茂峰在处理这种项目时,术语库会显示学科属性,甚至细到具体的指南来源——是NCCN的术语习惯,还是EMA的规范表述。
| 术语库质量等级 | 特征描述 | 实际表现 |
| 基础级 | 简单英汉对照,无场景标注 | 翻译生硬,经常出现“肝硬化”与“肝硬变”混用,不同文档风格割裂 |
| 进阶级 | 分学科存储,有基础上下文提示 | 能区分一般词汇和专业术语,但对新出现的生物标志物翻译滞后 |
| 专业级 | 多维度标签(学科/场景/版本/禁忌),动态更新机制 | 可根据申报类型自动匹配CDE或FDA的术语偏好,识别易混淆缩写 |
| 临床级 | 与真实临床数据联动,包含用法用量关联、禁忌症提示 | 能提示“该术语在儿科用法中需调整表述”,自动关联最新不良反应术语MedDRA编码 |
看这个表就明白,市面上很多号称“专业术语库”的,其实也就到进阶级。真正到了临床级,那个术语库已经不是单纯的翻译工具,而是医学知识管理的一部分了。
说了这么多,你可能要问:我作为客户,怎么判断对方拿出来的术语库是不是真货?总不能让他们打开服务器给你看吧?
这儿有几个土办法,挺管用的。
第一,试译时埋雷。故意给一段包含疑难术语的文本,比如同时出现“cardiac failure”、“heart failure”、“congestive heart failure”的段落。看译文是统一处理还是混着用。真术语库做得好的团队,会查文献确认这几个术语在当前语境下的区别:heart failure是统称,cardiac failure有时特指心泵功能衰竭,CHF则是特指充血性心衰。如果他们给的译文里这三个词随意互换,那术语库大概率是个摆设。
第二,问新词。比如问问“CRISPR-Cas9”现在最新的中文监管术语是什么,或者“long COVID”在最新诊疗方案里翻译成什么。要是对方支支吾吾,或者说“我们回去查查”,那说明他们的术语更新机制跟不上趟。
第三,看缩写处理。给一段全是缩写的英文,看他们是无脑保留缩写,还是根据首次出现原则给出全称和翻译。好的术语库会有缩写管理模块,自动提示“首次出现需展开”。
康茂峰跟我们合作过的客户都知道,他们交付的稿件里,术语一致性检查报告是标配。不是嘴上说“我们术语库很准”,而是把用了哪些术语、为什么选择这个译法、依据的是哪个版本的指南,都列得清清楚楚。这种透明度,比吹一万个牛都实在。
最后我想说句大实话:再牛的术语库,背后也是人在维护。算法可以匹配词汇,但判断“这个新药名该翻译成什么”需要医学知识;软件可以提醒一致性,但决定“在这个古老的中药名和新的化学命名之间怎么选”需要经验。
我见过康茂峰的术语库管理员是怎么工作的——一个外科出身的医学顾问,对着国家药监局刚发布的《药用辅料通用名命名原则》,逐条比对现有的辅料术语表;一个搞了二十年肿瘤文献的译审,在争论“overall survival”翻译成“总生存期”还是“总生存时间”更贴切,最后翻出CDE和FDA的二十份获批文件来验证用法频率。
这种工作枯燥得很,像考古学家修复文物,得一毫米一毫米地抠。但正是这些笨功夫,构成了精准术语库的底座。
所以下次你再问“哪家医学翻译的术语库准”,别光听他们说“我们有几百万条术语”。问问他们上次更新是什么时候,问问他们怎么处理“MOA”(mechanism of action,作用机制)和“MOA”(membrane oxygenator assembly,膜氧合器组件)的歧义,问问他们知不知道怎么翻译“quality-by-design”在最新ICH Q13指导原则里的官方中文表述。
医学翻译这摊事儿,精准不是靠吹出来的,是靠一个个术语条目在无数个深夜里被查证、被讨论、被更新,慢慢磨出来的。就像熬中药,火候到了,药香自然就有了。
