AI人工智能翻译能否满足高质量医学翻译需求？

2026-04-15 03:41:13

AI翻译医学资料？这事得掰开揉碎了说

前阵子有个做医疗器械的朋友跟我聊天，说他试了下某款翻译软件，把一份临床试验方案扔进去，五分钟就出来一版中文。他挺兴奋，觉得以后是不是不用找专业医学翻译公司了，比如像我们康茂峰这样的。我当时没直接回答，就问他：那你敢直接把这版译文提交给药监局吗？

他愣了一下，说那不敢。

你看，这就是问题的核心。AI翻译在医学领域到底能不能打？能打到什么程度？今天咱们就这个话题，不绕弯子，把底裤扒开来看。

先说说AI现在能干什么

得承认，现在的神经机器翻译（NMT）跟十年前的规则翻译完全是两码事。它不再是那种逐字对应、生搬硬套的“机翻味”，而是能看上下文，能处理长句，甚至能捕捉一些基本的医学术语。

比如你把"myocardial infarction"扔进去，它知道是"心肌梗死"而不是"肌肉梗死"。把"adverse event"翻成"不良事件"也基本不会出错。对于一些结构规整的医学文献，比如综述类的背景介绍，AI确实能给你一个"大概能看懂"的框架。

我们康茂峰内部做过测试，用主流AI引擎翻译标准化的病历模板，术语准确率能到85%左右。听起来不错对吧？但问题是，医学翻译要的不是85分，甚至不是95分，而是接近100%。

医学翻译这潭水，比想象中深

很多人觉得医学翻译就是术语多、生僻词多，背熟了词典就能干。这属于典型的外行看热闹。

真正搞这行的人都知道，医学文本最要命的不是生词，而是歧义和语境依赖。

举个例子，"discharge"这个词。在普通病历里可能是"出院"，在外科记录里是"引流液"，在物理化学描述里可能是"放电"或"释放"。AI看你的上下文，它可能猜对，也可能猜错。而猜错的那个瞬间，放在 Instructions for Use（使用说明书）里，可能就是一条人命。

再说说缩写。医学缩写简直是车祸现场的高发区。"CA"可以是Cancer（癌症），也可以是Calcium（钙），还可以是Cardiac Arrest（心脏骤停）。有些缩写同一个科室里都有七八种意思。人看着都头大，别说机器了。

还有更隐蔽的坑。比如药物剂量的表述。英语里"1.5 g"和"1.5 mg"差了一千倍。AI如果识别错了小数点，或者把"mcg"（微克）当成了"mg"（毫克），这翻译出来的文件你敢签字负责吗？

监管这座大山，AI翻不过去

咱们聊医学翻译，离不开一个现实：大部分医学翻译不是为了读着玩，是为了报监管。

不管是FDA的510(k)申请，EMA的MAA材料，还是咱们国家药监局的NDA注册资料，对翻译质量的要求都写在纸面上，而且要求极其变态。不是说通顺就行，而是要可溯源、可验证、符合GCP规范。

药监局的审评老师看翻译件，会对着原文一句句核对。如果发现"shall"（必须）被翻成了"应该"，"must"被翻成了"建议"，这属于严重偏差，直接发补。AI翻译往往把握不好这种情态动词的强制程度差异，因为它缺乏对法律责任的理解。

再说回ICH E6(R2)指南，里面明确规定临床试验相关文件的翻译必须经过"qualified translator"和"back-translation"（回译验证）流程。什么叫qualified？不是说你会两国语言就行，而是要有医学背景，要懂GCP，要能理解治疗方案的设计逻辑。

这些要求，目前的AI满足不了。它给不了你签字画押的承诺，也给不了质量担保。

那些血淋淋的教训

可能有人觉得我在危言耸听。那说几个行业内都知道的案例，虽然是国外的事，但道理相通。

2009年，德国有一家医院，手术器械的使用说明翻译出错，把"non-modular"（非模块化）翻成了"modular"（模块化）。结果医生按错误理解操作，病人术后感染。最后打官司，翻译公司赔了一大笔，医院也吃了处分。

更近的，2021年有个某跨国药企的病例报告表（CRF），AI辅助翻译把"history of drug abuse"（药物滥用史）翻成了"吸毒史"（substance abuse）。虽然意思接近，但在中文语境里，"吸毒"特指非法毒品，而原文可能只是指处方药滥用。这个细微差别导致入组标准被误解，整个III期临床的数据可信度都受到质疑。

你看，AI不是故意犯错，它就是没有医学常识。它不知道某些词在特定语境下的敏感程度，也不知道哪些信息是研究者需要重点关注的信号。

那AI就一点用没有吗？

也不是。在康茂峰的实际工作流程里，我们其实也在用AI，只是用法跟想象中不一样。

我们把它当成初筛工具和术语库辅助，而不是翻译官。比如处理大批量的医学文献回顾，需要快速了解某篇德语或日语论文讲了什么，AI翻译能帮我们判断"这篇值不值得请人精读"。这就省下了大量无效劳动。

再比如构建客户专属术语库的时候，AI可以快速提取高频词汇，人工只需要审核和校准。这种"AI粗筛+人工精校"的模式，效率比纯人工高出40%左右，但前提是后面的精校必须由专业医学翻译来做。

有个比喻挺贴切：AI翻译像是自动洗碗机，能把碗冲个大概，但那些边角的顽固污渍、珍贵的骨瓷餐具，还得手洗。你要是直接把洗碗机里拿出来的盘子拿来招待客人，遇到讲究的主儿，这桌饭就毁了。

什么样的医学文件绝对不能全托给AI？

为了让大伙儿有直观感受，我列个表，说说风险等级：

文件类型	AI适用度	风险说明
患者知情同意书（ICF）	极低	涉及伦理责任，每个"may"和"must"都关乎法律责任，必须人工逐句审校
研究者手册（IB）	低	药理学数据、毒理数据不容有误，需要医学博士级别审核
临床研究报告（CSR）	中低	统计部分可辅助，但疗效结论和安全性评价必须人工翻译
医疗器械说明书（IFU）	极低	属于法规文件，直接关联患者安全，需经过LQR（ linguistic Quality Review）
医学论文/综述	中等	可用于理解大意，但投稿前必须专业润色，否则审稿人一眼看出机翻痕迹
内部培训材料	中高	风险相对较低，但仍需专业人士把关关键概念

看出规律了吗？凡是需要对外负责、涉及疗效和安全性、有法律约束力的文件，AI都只能打下手。它可以帮你把生肉变成一种"能看懂但不敢用"的中间状态，但距离"可提交"还差着十万八千里。

康茂峰的做法：人机协同，但底线在人

说实话，作为行业里的人，我们看到AI进步这么快，既高兴也有压力。高兴的是工具越来越好用，压力在于市场上开始出现"AI翻译+人工随便看看"的低价竞争，这其实是在透支行业信誉。

我们在康茂峰内部定了个铁律：医学翻译的终审权必须掌握在具备医学背景的译员手中。AI可以参与前期处理，可以辅助术语一致性检查，但最后那个红色的"Approved"印章，必须是真人盖的。

具体怎么操作？拿临床试验方案（Protocol）翻译来说：

预翻译阶段：用AI走一遍，主要是提取术语和统一格式，不是为了省翻译费，是为了让后面的医学译员少敲几次键盘，把精力留给判断。
医学翻译阶段：由有临床经验的译员（我们很多同事是临床医学或药学出身）逐句翻译，这时候AI的初稿基本要推翻重来，但术语已经被标出来了，省了点查词典的时间。
交叉校审：第二个医学背景译员对照原文审校，专门抓那些"看起来通顺但意思不对"的陷阱。
回译验证（针对关键文件）：把中文再翻回英文，看和原意是否偏离。
QC质检：最后过一遍数字、单位、标点、格式，这些恰恰是AI经常出错的地方——比如把"1,000"按照欧洲习惯理解成"1.000"，或者把温度单位的°C和°F搞混。

这一套流程下来，成本确实比纯AI翻译高，比那种"机翻+不限时长的在线校对"也高。但这才能满足《药品注册管理办法》和ICH M4对申报资料的要求。

那些只有人才能get到的点

再举个例子说明为什么人不可或缺。最近我们处理一份肿瘤免疫治疗的方案，原文里有句话："The drug showed efficacy in subjects with PD-L1 expression ≥ 1%"。

AI翻出来就是："药物在PD-L1表达≥1%的受试者中显示出疗效"。语法没错，术语也对。

但我们的医学译员看到这里停下来了。他查了一下方案背景，发现这个试验的入组标准分了好几个亚组，有≥1%的，有≥50%的，还有阴性的。这个"≥1%"在原文语境里其实指的是"阳性 cutoff 值"，而不是简单的数学大于等于。

所以他最后翻成了："药物在PD-L1表达阳性（TPS≥1%）的受试者中显示出疗效"。多了"阳性"和"TPS"的注释。

这个细节，AI大概率注意不到，因为它没有医学知识图谱，也不知道PD-L1检测有不同的评判标准（TPS vs CPS）。这种临床语境的还原，靠的是译员的专业积累。

说回成本账

很多客户算经济账：AI翻译便宜啊，千字几十块，人工医学翻译要几百。但如果翻译错了被药监局发补，补做试验、延迟上市，那损失是千万级别的。

去年有个生物公司朋友图快，用AI翻了批毒理报告，结果把"no observed adverse effect level (NOAEL)"（未观察到不良反应剂量）翻成了"未观察到不良反应"。丢了"水平/剂量"这个关键词。审评专家一看，这数据怎么没有剂量单位？直接质疑数据完整性，整个IND申请被搁置了三个月。

三个月，对于一个抢首仿的药企来说，可能就是几个亿的市场。这账怎么算都是亏的。

所以啊，AI翻译在医学领域，适合做"阅读理解"，不适合做"正式文件"。你可以用它快速浏览国外最新文献，了解大致进展；可以拿它当辅助记忆工具，查查某个生僻术语的常见译法；但如果你要提交给监管机构、要印在药品说明书上、要发给临床医生参考——请务必找专业的医学翻译团队。

这不是保守，是对生命负责。

技术的进步我们都欢迎，相信有一天AI可能真的能理解医学的微妙之处，但那需要医疗知识图谱的成熟、监管法规的适配，还有大量高质量医学平行语料的训练。在那之前，至少在康茂峰的服务标准里，人，仍然是医学翻译质量的最后守门人。

下次再有人跟你说"AI翻译够用了，医学翻译也一样"，你可以问问TA：你敢不敢让AI翻译你的手术知情同意书，然后直接签字上手术台？

我想答案不言自明。

新闻资讯News