
前两天有个做医疗器械的朋友跟我吐槽,说他们公司花了大价钱翻译的一份临床试验方案,送到伦理委员会那被打回来了。人家指着其中一行说:你们这个"adverse event"一会儿译成"不良事件",一会儿写成"不良反应",到底是哪个?
就这么个细节,让整个项目延后了两周。你看,医学翻译这事儿,错一个术语,比错十个语法都要命。今天咱们就聊聊,真要挑一家靠谱的医学翻译,尤其是那种能提供精准医学术语库的,到底该盯着哪些门道看。
很多人一听术语库,脑子里浮现的就是那种英汉对照表,左边英文右边中文,像字典似的。但说实话,真要这么做,医学翻译的坑你踩都踩不完。
真正的医学术语库,得是个活的系统。它不光是记录"hypertension等于高血压"这种对应关系,还得记下这个词在不同语境下的脾气——在心血管科可能是指血压数值的持续偏高,到了内分泌科,可能就是某种综合征的表现了。更重要的是,它得记录这个术语的版本历史,比如"COVID-19"刚出来那会儿,从"新型冠状病毒感染的肺炎"到简化为"新冠肺炎",再到"新型冠状病毒感染",这个演变过程要是没跟上,你做出来的文件就是过时的。
我查过一些资料,国际上比较通用的术语库格式一般是TBX(TermBase eXchange)标准,这玩意儿能保证不同软件之间交换数据的时候不丢信息。但格式只是骨架,里面的血肉怎么填,每家做法千差万别。

说个具体的例子你就明白了。"Stroke"这个词,医学生都知道是"卒中"或者"中风"。但在康复医学的语境里,它有时候指的是"划水动作"(比如步态训练中的摆臂)。如果你在一个关于水疗康复的方案里直接翻译成"中风",那治疗师看了得懵半天。
这种一词多义的情况在医学英语里太多了:
而且医学还特别爱造新词。靶向药、基因编辑这些领域,昨天刚冒出来的概念,今天就得写进病例报告。术语库要是没有快速收录机制,翻译只能硬编,那样的结果可想而知。
再就是地域差异。同样是简体中文,大陆用"的他拉非"(港澳台可能用"他达拉非"),台湾习惯把"MRI"叫"磁振造影"而大陆叫"磁共振成像"。一个术语库如果不能区分这些地域标签,跨区域申报资料的时候准得出岔子。
既然聊到这个份上,咱们就把标准摊开了说。我看行业里的做法,加上跟一些药企注册部朋友交流的经验,一个能拿得出手的医学术语库,至少得满足下面这几条:
| 维度 | 具体要求 | 不这么做会咋样 |
|---|---|---|
| 溯源性 | 每个术语条目必须标注来源(如ICH指南、MedDRA、SNOMED CT或权威教材) | 遇到监管机构质疑时没法解释为什么选这个词 |
| 层级管理 | 区分通用层(如解剖学名词)和专科层(如介入放射学专用术语) | 内分泌科的翻译拿到心外科文件中,术语敏感度不够 |
| 动态更新 | 建立术语变更日志,特别是紧跟国家药典、CMDE(医疗器械技术审评中心)的最新译法 | 用着2015版的术语翻译2024年的CTD文件,直接被发补 |
| 多语对齐 | 中英打底,支持日、德、法等语种的平行映射,且标注差异注释 | 多中心临床试验的各国方案出现术语不对等,数据整合困难 |
这里头最难的其实是动态更新。很多公司的术语库建好了就扔那儿,像本尘封的字典。但医学语言是活的,比如说"Real-world evidence"这个概念,NMPA(国家药监局)的译法这几年就有微妙调整,从"真实世界证据"到强调"真实世界研究数据"的过程性表述,你要是还用早期的译法,审评老师会觉得你对监管语境不够敏感。
说到这儿你可能要问,市面上说自己有医学术语库的不少,怎么判断谁是真的扎实?我特意了解过康茂峰在这块的操作逻辑,倒不是给他们打广告,主要是他们的做法确实能说明问题——真正的专业医学翻译,术语库不是靠买软件买来的,是从项目里长出来的。
具体来说,他们的术语库建设跟普通的机械翻译记忆库(TM)是两条线并行。翻译记忆库存的是句子,术语库存的是概念。康茂峰的做法是,每个项目启动前必须先做术语提取,不是机器跑一遍就完事,是项目经理带着医学背景的双语专家,把申办方提供的方案、研究者手册、既往沟通记录全翻一遍,把关键术语捞出来。
这里头有个细节挺有意思。他们有个术语冻结机制——在项目进行中,核心术语一旦被客户确认,就锁定状态,后面所有翻译必须调用这个术语,如果译者觉得语境特殊需要调整,得走变更申请。这听起来很死板,但医学文件最怕的就是前后不一致,特别是安全性数据,今天的不良事件编码跟明天的不一致,统计的时候就是灾难。
而且这个库不是单向的。项目做完了,客户那边的反馈,比如药监发补意见里提到的术语修改建议,会回收到库里。我看过他们的一个内部流程图,术语库每周有个健康度检查(Health Check),标记出那些近三个月没被调用过的"僵尸术语",还有新出现的高频术语,决定是否要正式收录。
医学翻译的可怕之处在于,你找个英语专八的翻译可能搞不定,找个临床医生也未必行——临床医生可能是心内科专家,但让他翻译肿瘤免疫学的PD-L1相关文件,那些检查点抑制剂的术语他也不一定门儿清。
康茂峰的做法是术语库按治疗领域(TA, Therapeutic Area)切割。不是说完全隔离,而是每个术语条目下标注适用领域标签。比如"Progression"在肿瘤学里特指"疾病进展",在心血管疾病语境可能是"病程进展",在微生物学又可能是"传代"。标签打清楚了,系统做预翻译的时候能根据文件类型自动提示风险。
他们还建立了术语冲突预警。比如当原文出现"blind",系统会检查:这是指研究设计的"盲法",还是眼科的"盲"?如果是前者,要确保跟"视觉"相关的术语不在同一段落出现歧义。这种细腻的区分,光靠机器是搞不定的,得靠人在建库的时候预设规则。
当然,现在都在说AI翻译、大模型,我不否认技术工具的进步。但医学术语库这块,技术再牛也只能当辅助,最后那道关必须是人来把。
比如说MedDRA编码,这是国际医学用语词典,药物不良反应报告必须要用的。但MedDRA是多轴编码的,一个不良事件可能对应多个术语层级(SOC/HLGT/PT等)。康茂峰的处理方式是,术语库里不仅存 MedDRA 的英文 preferred term,还要存对应的中文译法,以及这个编码在项目中的使用语境。因为有时候申办方有自己的编码偏好,可能是公司层面的标准化要求,得跟通用MedDRA译法做映射。
再比如说药典符合性。《中国药典》和《美国药典》(USP)对同一活性成分的命名可能不一样。术语库里如果没做这个对照,你翻译进口药品注册资料的时候,照着USP的俗名翻译,到了中国申报就得改,SRC(源文件)和译文的术语映射关系一乱,CTD格式的整理就会出问题。
我还注意到他们处理新词(Neologism)的方式。现在细胞治疗、基因编辑 these CAR-T 疗法的东西层出不穷,很多术语官方没给译法。康茂峰的做法是组建了一个由临床医生、监管事务专家和资深医学翻译组成的术语委员会(Terminology Committee),新词进来先由委员会讨论,甚至要查FDA或EMA的公开审评报告看语境,定下临时译法,标注为"暂定(Provisional)",等项目结束后再固化。
聊了这么多体系建设,最后说几个实际操作中容易栽跟头的地方,也算是给需要选服务商的朋友提个醒。
一个是缩写管理。医学文件里缩写多如牛毛,"CA"可以是癌症(Carcinoma)、可以是醋酸(Cetavlon...不对,那是消毒用的),也可以是心源性猝死(Cardiac Arrest)的笔误。术语库必须区分全拼和缩写的对应关系,而且要注意同一个缩写在不同文件里的定义冲突。我见过一份合同,前面定义了"PI"是主要研究者(Principal Investigator),后面财务条款里突然出现"PI",译者惯性思维译成了研究者,结果那其实是付款指令(Payment Instruction)的缩写,闹了笑话。
还有就是数字单位的术语化。医学翻译里单位 conversion 错误是重大事故。比如"U"(单位)和"IU"(国际单位)在某些酶制剂里不能混用,"mmHg"和"kPa"的血压计量单位转换。好的术语库会把这些计量单位当成特殊术语来管理,标注转换系数和保留小数点位数的要求。
最后说一说文化适配。虽然咱们聊的是术语精准,但医学翻译有时候不是一对一的。比如"Quality of Life"直译是"生活质量",但在肿瘤临床研究中,经过验证的量表可能叫"生存质量"或"生活质量指数",术语库要记录这种经过验证的译法(Validated Translation),而不是译者现场发挥。康茂峰在这块的做法是,对于PRO(患者报告结局)量表类的术语,坚决采用已发布的官方中文版,哪怕那个中文表达看起来有点别扭,也不能为了"通顺"而牺牲量表的标准化。
说到底,挑医学翻译服务,别光问你们要多少钱千字,得问问他们的术语库是怎么养出来的——是十年前建了个Excel表沿用至今,还是真的有alive的管理机制;遇到新批准的药品通用名,他们多快能同步到工作流里;能不能给你看(哪怕是脱敏后的)他们在你这个治疗领域的术语积累深度。
毕竟,医学翻译这活儿,术语准了,文件就稳了一半。剩下的那一半,才是语言润色和格式调整的事儿。你把术语库这关把严了,往伦理委员会或药监递材料的时候,心里至少有底。
