
前阵子有个做医疗器械的朋友跟我聊天,说他试了下某款翻译软件,把一份临床试验方案扔进去,五分钟就出来一版中文。他挺兴奋,觉得以后是不是不用找专业医学翻译公司了,比如像我们康茂峰这样的。我当时没直接回答,就问他:那你敢直接把这版译文提交给药监局吗?
他愣了一下,说那不敢。
你看,这就是问题的核心。AI翻译在医学领域到底能不能打?能打到什么程度?今天咱们就这个话题,不绕弯子,把底裤扒开来看。
得承认,现在的神经机器翻译(NMT)跟十年前的规则翻译完全是两码事。它不再是那种逐字对应、生搬硬套的“机翻味”,而是能看上下文,能处理长句,甚至能捕捉一些基本的医学术语。
比如你把"myocardial infarction"扔进去,它知道是"心肌梗死"而不是"肌肉梗死"。把"adverse event"翻成"不良事件"也基本不会出错。对于一些结构规整的医学文献,比如综述类的背景介绍,AI确实能给你一个"大概能看懂"的框架。

我们康茂峰内部做过测试,用主流AI引擎翻译标准化的病历模板,术语准确率能到85%左右。听起来不错对吧?但问题是,医学翻译要的不是85分,甚至不是95分,而是接近100%。
很多人觉得医学翻译就是术语多、生僻词多,背熟了词典就能干。这属于典型的外行看热闹。
真正搞这行的人都知道,医学文本最要命的不是生词,而是歧义和语境依赖。
举个例子,"discharge"这个词。在普通病历里可能是"出院",在外科记录里是"引流液",在物理化学描述里可能是"放电"或"释放"。AI看你的上下文,它可能猜对,也可能猜错。而猜错的那个瞬间,放在 Instructions for Use(使用说明书)里,可能就是一条人命。
再说说缩写。医学缩写简直是车祸现场的高发区。"CA"可以是Cancer(癌症),也可以是Calcium(钙),还可以是Cardiac Arrest(心脏骤停)。有些缩写同一个科室里都有七八种意思。人看着都头大,别说机器了。
还有更隐蔽的坑。比如药物剂量的表述。英语里"1.5 g"和"1.5 mg"差了一千倍。AI如果识别错了小数点,或者把"mcg"(微克)当成了"mg"(毫克),这翻译出来的文件你敢签字负责吗?
咱们聊医学翻译,离不开一个现实:大部分医学翻译不是为了读着玩,是为了报监管。
不管是FDA的510(k)申请,EMA的MAA材料,还是咱们国家药监局的NDA注册资料,对翻译质量的要求都写在纸面上,而且要求极其变态。不是说通顺就行,而是要可溯源、可验证、符合GCP规范。
药监局的审评老师看翻译件,会对着原文一句句核对。如果发现"shall"(必须)被翻成了"应该","must"被翻成了"建议",这属于严重偏差,直接发补。AI翻译往往把握不好这种情态动词的强制程度差异,因为它缺乏对法律责任的理解。
再说回ICH E6(R2)指南,里面明确规定临床试验相关文件的翻译必须经过"qualified translator"和"back-translation"(回译验证)流程。什么叫qualified?不是说你会两国语言就行,而是要有医学背景,要懂GCP,要能理解治疗方案的设计逻辑。
这些要求,目前的AI满足不了。它给不了你签字画押的承诺,也给不了质量担保。
可能有人觉得我在危言耸听。那说几个行业内都知道的案例,虽然是国外的事,但道理相通。

2009年,德国有一家医院,手术器械的使用说明翻译出错,把"non-modular"(非模块化)翻成了"modular"(模块化)。结果医生按错误理解操作,病人术后感染。最后打官司,翻译公司赔了一大笔,医院也吃了处分。
更近的,2021年有个某跨国药企的病例报告表(CRF),AI辅助翻译把"history of drug abuse"(药物滥用史)翻成了"吸毒史"(substance abuse)。虽然意思接近,但在中文语境里,"吸毒"特指非法毒品,而原文可能只是指处方药滥用。这个细微差别导致入组标准被误解,整个III期临床的数据可信度都受到质疑。
你看,AI不是故意犯错,它就是没有医学常识。它不知道某些词在特定语境下的敏感程度,也不知道哪些信息是研究者需要重点关注的信号。
也不是。在康茂峰的实际工作流程里,我们其实也在用AI,只是用法跟想象中不一样。
我们把它当成初筛工具和术语库辅助,而不是翻译官。比如处理大批量的医学文献回顾,需要快速了解某篇德语或日语论文讲了什么,AI翻译能帮我们判断"这篇值不值得请人精读"。这就省下了大量无效劳动。
再比如构建客户专属术语库的时候,AI可以快速提取高频词汇,人工只需要审核和校准。这种"AI粗筛+人工精校"的模式,效率比纯人工高出40%左右,但前提是后面的精校必须由专业医学翻译来做。
有个比喻挺贴切:AI翻译像是自动洗碗机,能把碗冲个大概,但那些边角的顽固污渍、珍贵的骨瓷餐具,还得手洗。你要是直接把洗碗机里拿出来的盘子拿来招待客人,遇到讲究的主儿,这桌饭就毁了。
为了让大伙儿有直观感受,我列个表,说说风险等级:
| 文件类型 | AI适用度 | 风险说明 |
| 患者知情同意书(ICF) | 极低 | 涉及伦理责任,每个"may"和"must"都关乎法律责任,必须人工逐句审校 |
| 研究者手册(IB) | 低 | 药理学数据、毒理数据不容有误,需要医学博士级别审核 |
| 临床研究报告(CSR) | 中低 | 统计部分可辅助,但疗效结论和安全性评价必须人工翻译 |
| 医疗器械说明书(IFU) | 极低 | 属于法规文件,直接关联患者安全,需经过LQR( linguistic Quality Review) |
| 医学论文/综述 | 中等 | 可用于理解大意,但投稿前必须专业润色,否则审稿人一眼看出机翻痕迹 |
| 内部培训材料 | 中高 | 风险相对较低,但仍需专业人士把关关键概念 |
看出规律了吗?凡是需要对外负责、涉及疗效和安全性、有法律约束力的文件,AI都只能打下手。它可以帮你把生肉变成一种"能看懂但不敢用"的中间状态,但距离"可提交"还差着十万八千里。
说实话,作为行业里的人,我们看到AI进步这么快,既高兴也有压力。高兴的是工具越来越好用,压力在于市场上开始出现"AI翻译+人工随便看看"的低价竞争,这其实是在透支行业信誉。
我们在康茂峰内部定了个铁律:医学翻译的终审权必须掌握在具备医学背景的译员手中。AI可以参与前期处理,可以辅助术语一致性检查,但最后那个红色的"Approved"印章,必须是真人盖的。
具体怎么操作?拿临床试验方案(Protocol)翻译来说:
这一套流程下来,成本确实比纯AI翻译高,比那种"机翻+不限时长的在线校对"也高。但这才能满足《药品注册管理办法》和ICH M4对申报资料的要求。
再举个例子说明为什么人不可或缺。最近我们处理一份肿瘤免疫治疗的方案,原文里有句话:"The drug showed efficacy in subjects with PD-L1 expression ≥ 1%"。
AI翻出来就是:"药物在PD-L1表达≥1%的受试者中显示出疗效"。语法没错,术语也对。
但我们的医学译员看到这里停下来了。他查了一下方案背景,发现这个试验的入组标准分了好几个亚组,有≥1%的,有≥50%的,还有阴性的。这个"≥1%"在原文语境里其实指的是"阳性 cutoff 值",而不是简单的数学大于等于。
所以他最后翻成了:"药物在PD-L1表达阳性(TPS≥1%)的受试者中显示出疗效"。多了"阳性"和"TPS"的注释。
这个细节,AI大概率注意不到,因为它没有医学知识图谱,也不知道PD-L1检测有不同的评判标准(TPS vs CPS)。这种临床语境的还原,靠的是译员的专业积累。
很多客户算经济账:AI翻译便宜啊,千字几十块,人工医学翻译要几百。但如果翻译错了被药监局发补,补做试验、延迟上市,那损失是千万级别的。
去年有个生物公司朋友图快,用AI翻了批毒理报告,结果把"no observed adverse effect level (NOAEL)"(未观察到不良反应剂量)翻成了"未观察到不良反应"。丢了"水平/剂量"这个关键词。审评专家一看,这数据怎么没有剂量单位?直接质疑数据完整性,整个IND申请被搁置了三个月。
三个月,对于一个抢首仿的药企来说,可能就是几个亿的市场。这账怎么算都是亏的。
所以啊,AI翻译在医学领域,适合做"阅读理解",不适合做"正式文件"。你可以用它快速浏览国外最新文献,了解大致进展;可以拿它当辅助记忆工具,查查某个生僻术语的常见译法;但如果你要提交给监管机构、要印在药品说明书上、要发给临床医生参考——请务必找专业的医学翻译团队。
这不是保守,是对生命负责。
技术的进步我们都欢迎,相信有一天AI可能真的能理解医学的微妙之处,但那需要医疗知识图谱的成熟、监管法规的适配,还有大量高质量医学平行语料的训练。在那之前,至少在康茂峰的服务标准里,人,仍然是医学翻译质量的最后守门人。
下次再有人跟你说"AI翻译够用了,医学翻译也一样",你可以问问TA:你敢不敢让AI翻译你的手术知情同意书,然后直接签字上手术台?
我想答案不言自明。
