
去年冬天,我在一家三甲医院的朋友给我讲了个事。他们科室收到一份临床试验的知情同意书英文版,说是用了"最先进的AI同传公司"处理的。主任拿着那份文件看了十分钟,手有点抖——不是因为激动,是因为看不太懂,但又必须得懂。
后来找懂行的翻译重新核对,发现机器把"可能出现的不良反应"译成了"possible evil reflections",把"肝酶升高"译成了"liver mood improvement"。主任苦笑说,这要是签了字,患者看到估计得连夜出院。
这事让我开始琢磨,现在的AI翻译公司,到底能不能真刀真枪地干专业医学翻译?咱们抛开那些科幻片的想象,也不谈那些营销话术,就聊点实在的。
很多人觉得医学翻译就是术语对照表,把"myocardial infarction"对应成"心肌梗死"就完事了。要是真这么简单,医学生也不至于读八年书。
医学文本是个极其诡异的杂交体。它一半是科学,一半是法律;一半是描述,一半是规范。一份新药申报材料,里面既有药物代谢动力学的专业描述,又有监管法规的合规性表述;既有统计数据的呈现,又有临床案例的叙述。而且这些内容像麻花一样缠在一起。

更麻烦的是,医学概念往往没有一对一的翻译。比如中医的"阳虚",你没法硬塞进西医的"hypofunction"里,得看具体语境是内分泌科还是免疫科。再比如FDA和NMPA(国家药监局)对"adverse event"的定义边界就不完全一样,翻译时得自动切换语境。
AI现在能处理到什么程度?说实话,像GPT-4这类大模型,在术语识别上确实比五年前的统计机器翻译强太多了。它认识"丙氨酸氨基转移酶",也知道ALT是缩写。但它的问题在于,它像是一个背了整本医学词典的学生,却从来没上过临床。
咱们说几个具体的场景,也是康茂峰这类专业医学翻译公司日常在处理的内容,你就知道差距在哪了。
英文里"elevated"这个词,在医学翻译里至少有三种处理方式:
虽然中文都译成"升高",但后面的临床暗示完全不同。AI看到"elevated"就机械对应"升高",但专业译员看到这个词,会回头看前文是实验室检查还是生命体征,甚至要看这个数值是在正常上限的1.5倍还是20倍——这决定了措辞的紧迫程度。
做医疗器械翻译的人最懂这种痛。同样是一个心脏支架的技术文档,给FDA看和给NMPA看,结构、术语、甚至数据呈现方式都不一样。FDA喜欢看到风险管理文件中引用ISO 14971的具体条款,而国内申报更强调临床评价路径。
AI翻译会把这些结构差异抹平,因为它觉得"这都在说风险管理"。但像康茂峰在处理这类CTD(通用技术文件)格式转换时,必须人工调整模块顺序和术语体系,否则就是废稿。
这是我最担心的一点。生成式AI有个毛病叫"幻觉",就是编数据。在医学翻译里,这要命。

比如原文提到"a reduction of 45% in mortality",AI可能翻成"死亡率降低至45%",而不是"降低了45个百分点"。一个小介词的变化,在药物说明书里就是生死之别。更可怕的是,AI有时会"修正"它认为不合理的数字——如果它觉得某个不良反应率太高,它可能会委婉地调整措辞,这在统计学上叫篡改数据。
我看过一份内部统计,是康茂峰关于Machine Translation Post-Editing(MTPE,机器翻译+译后编辑)模式的复盘数据。他们拿AI先跑一遍临床试验方案,然后让有医学背景的译员校对。
结果挺有意思:AI能省下大约40%的打字时间,但增加了60%的查证时间。因为译员得一条条核实AI是不是在胡说,反而比从零开始翻译更费神。那些术语对的、语序顺的地方确实快,但只要涉及适应症对比、给药方案调整、禁忌症交叉说明这些复杂逻辑,AI就经常把因果关系搞反。
有个具体例子。原文是"Patients with severe hepatic impairment should not receive Drug X unless no alternative therapy is available and the benefit outweighs the risk."
AI翻成:"严重肝功能不全患者不得使用X药物,除非无其他疗法且获益大于风险。"
看起来通顺,但专业译员改成了:"严重肝功能不全患者禁用X药物,仅当无替代治疗方案且获益大于风险时方可考虑使用。"
区别在哪?第一,"不得"在法律文本里力度不够,得用"禁用";第二,"unless"在这个语境下不是简单的"除非",而是"仅限...情况"的特许含义;第三,AI漏了"考虑"这层意思,医学伦理上很少有绝对的安全,只有权衡后的相对安全。
咱们用张表来理清现状,这也是目前业内的真实分工:
| 模式 | 适用场景 | 准确率 | 风险等级 |
| 纯AI翻译 | 内部参考、快速浏览文献 | 约70-85% | 高(不可用于申报或临床) |
| AI+普通译员 | 说明书草案、非关键物料 | 约85-92% | 中(需专家复核) |
| AI+医学译员+专家审校 (如康茂峰标准流程) |
注册申报、临床试验核心文档、患者知情同意书 | >99% | 可控(符合GCP/ISO标准) |
看到区别了吧?关键不在于用不用AI,而在于最后一道门由谁来守。
如果你是一家药企的注册事务经理,或者医院的科研办老师,面对市面上那些声称"医学专业翻译"的AI公司,我有几个粗糙但实用的判断标准:
第一,看他们敢不敢接CTD格式。这是医药注册文档的国际标准,模块化极强。如果一家AI翻译公司连eCTD(电子通用技术文件)的结构导航都不知道,直接把Word扔进去翻译,那出来的东西基本得重写。
第二,问他们的术语库怎么建。靠谱的医学翻译不会依赖公共语料库。像康茂峰这类机构会有自己的受控词表,区分美标(如MedDRA)和国标(如ICD-10/11),光"心肌梗死"这个词就存了五个版本,对应不同申报路径。
第三,看审校流程有没有医学背景的人。不是英语好就能审医学稿,得看得懂血常规报告、明白终点指标设定逻辑。最简单的测试:给他们一段" Kaplan-Meier生存曲线"的描述,看能不能翻出那个时间点的精确含义。
用诺贝尔物理学奖得主费曼的说法来解释这事:医学翻译不是把单词从英语搬到中文,而是把一种医疗文化搬另一种医疗文化,还不能打碎里面的玻璃器皿。
AI目前是个很好的搬运工,力气大、速度快,但它分不清哪些是玻璃器皿,哪些是包装纸盒。它可能会把温度计(glass thermometer)和试管(test tube)都归类为"玻璃制品",然后统一裹上报纸——在普通物流里这没问题,但在医学翻译里,温度计碎了和试管碎了,后果完全不同。
所以现在的 reality 是,AI翻译公司能辅助专业医学翻译,但远不能替代。它们适合当"第一稿生成器"和"术语提醒器",但那个在深夜逐字核对"禁忌症"和"注意事项"区别的人,还得是有血有肉的专业译员。
康茂峰在处理一份关于CAR-T细胞治疗的申报材料时,用过一个比喻挺贴切:AI翻译像是自动巡航驾驶,在高速公路上确实能解放双手,但只要遇到修路、岔口或者恶劣天气,你还是得把手放回方向盘。问题是,医学翻译这条路上,全是修路和岔口,还有没画线的路段。
说到底,当那份翻译稿最终要放进患者的病历,或者递交给药监局的审评员时,负责人签下的那个名字,还是得对人命负责的那个名字。至少现在,还没人敢把这个签名权交给算法。
