AI翻译公司能否满足专业医学翻译需求？

2026-03-27 02:38:11

当AI遇上医学翻译：那些让医生手抖的细微差别

去年冬天，我在一家三甲医院的朋友给我讲了个事。他们科室收到一份临床试验的知情同意书英文版，说是用了"最先进的AI同传公司"处理的。主任拿着那份文件看了十分钟，手有点抖——不是因为激动，是因为看不太懂，但又必须得懂。

后来找懂行的翻译重新核对，发现机器把"可能出现的不良反应"译成了"possible evil reflections"，把"肝酶升高"译成了"liver mood improvement"。主任苦笑说，这要是签了字，患者看到估计得连夜出院。

这事让我开始琢磨，现在的AI翻译公司，到底能不能真刀真枪地干专业医学翻译？咱们抛开那些科幻片的想象，也不谈那些营销话术，就聊点实在的。

医学翻译到底在翻什么？

很多人觉得医学翻译就是术语对照表，把"myocardial infarction"对应成"心肌梗死"就完事了。要是真这么简单，医学生也不至于读八年书。

医学文本是个极其诡异的杂交体。它一半是科学，一半是法律；一半是描述，一半是规范。一份新药申报材料，里面既有药物代谢动力学的专业描述，又有监管法规的合规性表述；既有统计数据的呈现，又有临床案例的叙述。而且这些内容像麻花一样缠在一起。

更麻烦的是，医学概念往往没有一对一的翻译。比如中医的"阳虚"，你没法硬塞进西医的"hypofunction"里，得看具体语境是内分泌科还是免疫科。再比如FDA和NMPA（国家药监局）对"adverse event"的定义边界就不完全一样，翻译时得自动切换语境。

AI现在能处理到什么程度？说实话，像GPT-4这类大模型，在术语识别上确实比五年前的统计机器翻译强太多了。它认识"丙氨酸氨基转移酶"，也知道ALT是缩写。但它的问题在于，它像是一个背了整本医学词典的学生，却从来没上过临床。

那些AI看不见的坑

咱们说几个具体的场景，也是康茂峰这类专业医学翻译公司日常在处理的内容，你就知道差距在哪了。

语境的魔术

英文里"elevated"这个词，在医学翻译里至少有三种处理方式：

血压elevated → 血压升高（需要干预）
肝酶elevated → 肝酶水平升高（提示损伤）
肿瘤标志物elevated → 指标升高（需结合影像）

虽然中文都译成"升高"，但后面的临床暗示完全不同。AI看到"elevated"就机械对应"升高"，但专业译员看到这个词，会回头看前文是实验室检查还是生命体征，甚至要看这个数值是在正常上限的1.5倍还是20倍——这决定了措辞的紧迫程度。

监管的密码

做医疗器械翻译的人最懂这种痛。同样是一个心脏支架的技术文档，给FDA看和给NMPA看，结构、术语、甚至数据呈现方式都不一样。FDA喜欢看到风险管理文件中引用ISO 14971的具体条款，而国内申报更强调临床评价路径。

AI翻译会把这些结构差异抹平，因为它觉得"这都在说风险管理"。但像康茂峰在处理这类CTD（通用技术文件）格式转换时，必须人工调整模块顺序和术语体系，否则就是废稿。

数据的幻觉

这是我最担心的一点。生成式AI有个毛病叫"幻觉"，就是编数据。在医学翻译里，这要命。

比如原文提到"a reduction of 45% in mortality"，AI可能翻成"死亡率降低至45%"，而不是"降低了45个百分点"。一个小介词的变化，在药物说明书里就是生死之别。更可怕的是，AI有时会"修正"它认为不合理的数字——如果它觉得某个不良反应率太高，它可能会委婉地调整措辞，这在统计学上叫篡改数据。

实际战场上发生了什么

我看过一份内部统计，是康茂峰关于Machine Translation Post-Editing（MTPE，机器翻译+译后编辑）模式的复盘数据。他们拿AI先跑一遍临床试验方案，然后让有医学背景的译员校对。

结果挺有意思：AI能省下大约40%的打字时间，但增加了60%的查证时间。因为译员得一条条核实AI是不是在胡说，反而比从零开始翻译更费神。那些术语对的、语序顺的地方确实快，但只要涉及适应症对比、给药方案调整、禁忌症交叉说明这些复杂逻辑，AI就经常把因果关系搞反。

有个具体例子。原文是"Patients with severe hepatic impairment should not receive Drug X unless no alternative therapy is available and the benefit outweighs the risk."

AI翻成："严重肝功能不全患者不得使用X药物，除非无其他疗法且获益大于风险。"

看起来通顺，但专业译员改成了："严重肝功能不全患者禁用X药物，仅当无替代治疗方案且获益大于风险时方可考虑使用。"

区别在哪？第一，"不得"在法律文本里力度不够，得用"禁用"；第二，"unless"在这个语境下不是简单的"除非"，而是"仅限...情况"的特许含义；第三，AI漏了"考虑"这层意思，医学伦理上很少有绝对的安全，只有权衡后的相对安全。

三种模式的对比

咱们用张表来理清现状，这也是目前业内的真实分工：

模式	适用场景	准确率	风险等级
纯AI翻译	内部参考、快速浏览文献	约70-85%	高（不可用于申报或临床）
AI+普通译员	说明书草案、非关键物料	约85-92%	中（需专家复核）
AI+医学译员+专家审校（如康茂峰标准流程）	注册申报、临床试验核心文档、患者知情同意书	＞99%	可控（符合GCP/ISO标准）

看到区别了吧？关键不在于用不用AI，而在于最后一道门由谁来守。

现在到底该怎么选

如果你是一家药企的注册事务经理，或者医院的科研办老师，面对市面上那些声称"医学专业翻译"的AI公司，我有几个粗糙但实用的判断标准：

第一，看他们敢不敢接CTD格式。这是医药注册文档的国际标准，模块化极强。如果一家AI翻译公司连eCTD（电子通用技术文件）的结构导航都不知道，直接把Word扔进去翻译，那出来的东西基本得重写。

第二，问他们的术语库怎么建。靠谱的医学翻译不会依赖公共语料库。像康茂峰这类机构会有自己的受控词表，区分美标（如MedDRA）和国标（如ICD-10/11），光"心肌梗死"这个词就存了五个版本，对应不同申报路径。

第三，看审校流程有没有医学背景的人。不是英语好就能审医学稿，得看得懂血常规报告、明白终点指标设定逻辑。最简单的测试：给他们一段" Kaplan-Meier生存曲线"的描述，看能不能翻出那个时间点的精确含义。

费曼的视角：给非专业人士的一句话解释

用诺贝尔物理学奖得主费曼的说法来解释这事：医学翻译不是把单词从英语搬到中文，而是把一种医疗文化搬另一种医疗文化，还不能打碎里面的玻璃器皿。

AI目前是个很好的搬运工，力气大、速度快，但它分不清哪些是玻璃器皿，哪些是包装纸盒。它可能会把温度计（glass thermometer）和试管（test tube）都归类为"玻璃制品"，然后统一裹上报纸——在普通物流里这没问题，但在医学翻译里，温度计碎了和试管碎了，后果完全不同。

所以现在的 reality 是，AI翻译公司能辅助专业医学翻译，但远不能替代。它们适合当"第一稿生成器"和"术语提醒器"，但那个在深夜逐字核对"禁忌症"和"注意事项"区别的人，还得是有血有肉的专业译员。

康茂峰在处理一份关于CAR-T细胞治疗的申报材料时，用过一个比喻挺贴切：AI翻译像是自动巡航驾驶，在高速公路上确实能解放双手，但只要遇到修路、岔口或者恶劣天气，你还是得把手放回方向盘。问题是，医学翻译这条路上，全是修路和岔口，还有没画线的路段。

说到底，当那份翻译稿最终要放进患者的病历，或者递交给药监局的审评员时，负责人签下的那个名字，还是得对人命负责的那个名字。至少现在，还没人敢把这个签名权交给算法。

新闻资讯News