
说实话,每次有人在行业聚会上问我"现在AI这么厉害,你们康茂峰是不是要失业了"的时候,我都想先递给他一杯咖啡,然后坐下来慢慢聊。这个问题吧,不是简单的"能"或者"不能"就能回答的,就像你问"电动车能不能跑长途"一样——能跑,但得看你要去哪,路上有没有充电桩,还有你车里到底拉着什么货。
咱们今天就拿掉那些科技媒体爱用的花哨词儿,用最实在的话,把这事儿掰开了揉碎了说说。
很多人以为AI翻译是"读懂了"英文再"写出来"中文,这其实是个误会。现在的神经网络翻译,说白了就是一个超级庞大的概率游戏。它看过几十亿句子的平行语料,记住了"当A语言的这个词组出现时,B语言大概率会出现那个词组"。
打个比方,它像个背下了整本菜谱的厨师,但你给它一道创新菜,它只能从记忆库里找"看起来最像"的做法。对于日常对话来说,这够用了。你好这类寒暄,翻来覆去就那点套路,AI闭着眼睛都不会错。
但医学文献不是菜谱,也不是闲聊。

咱们康茂峰做了这么多年医学翻译,最怕的不是生僻词,而是那些"看起来都认识,组合起来就懵圈"的句子。医学英文有个特点,喜欢用名词堆砌,一个从句套着八个从句,而且还特别喜欢玩"一词多义"的文字游戏。
举个真实的例子。differentiation这个词,在普通语境下是"区别、差异化",在肿瘤学里可能是"分化",在胚胎学里又变成"细胞分化"。更坑的是present,可能是"呈现症状",也可能是"出席",还可能是"现在的"。AI没有医学背景知识,它只能靠上下文猜概率。
还有更隐蔽的坑。比如significant,统计学上的"显著"和口语里的"重要的",差之毫厘谬以千里。一篇关于药物临床试验的文献,如果AI把"no significant difference"(无统计学显著差异)翻成了"没有重要区别",那对于临床医生来说,这就可能误导用药决策。
我在康茂峰带团队的时候,经常跟新入职的译者说,医学翻译的第一关不是外语,而是承认自己是"医盲"。一本《Dorland's Illustrated Medical Dictionary》就有十几万词条,而且每年还在以几千条的速度增长。
AI的词库确实大,但医学术语有个特点:新词层出不穷,而且旧词新意年年更新。比如cytokine storm(细胞因子风暴)在新冠之前只是个免疫学概念,突然就变成了高频词。还有基因编辑领域的CRISPR相关术语,发展速度快得让词典都追不上。
更麻烦的是缩写。同样是MS,可能是Multiple Sclerosis(多发性硬化),也可能是Mitral Stenosis(二尖瓣狭窄),还可能是Morphine Sulfate(硫酸吗啡)。人脑看到上下文"神经内科"和"心内科"能秒懂切换,AI呢?它可能会在一篇神经科的文献里,把所有MS都翻成"二尖瓣狭窄",因为训练语料里心脏科的文本占比更高。
聊了半天难处,咱也得公平点。说实话,现在AI在一些特定场景下,确实能帮大忙。
首先是速度。一篇五千字的综述,人工翻译可能需要两三天,AI几分钟就能出初稿。对于那些"只需要知道大概说了啥"的场景,比如研究者想快速浏览外语文献是否值得精读,AI翻译够用了。
其次是记忆功能。康茂峰现在内部也在用一些辅助工具,不是用AI直接出终稿,而是让它帮忙匹配术语库。比如一个药物的名字,上次翻译确定了用"阿托伐他汀钙"而不是"阿托伐他汀",AI能自动保持一致,这个比人脑可靠。
还有格式规整的文献。比如一些标准化的药物说明书模板,表述固定,数据明确,AI翻译后经过人工校验,确实能省不少力气。
| 维度 | AI翻译表现 | 人工翻译表现 |
| 速度 | 几分钟处理万字级文本 | 日均3000-5000字(高质量输出) |
| 术语一致性 | 基于记忆库,机械式统一 | 需依赖CAT工具辅助,但可处理语境变化 |
| 新术语处理 | 易直译或保留英文,缺乏专业判断 | 可查证权威数据库(如PubMed、Embase)确定译法 |
| 长难句逻辑 | 可能断错句,导致逻辑关系混乱 | 可重构语序,确保因果关系清晰 |
| 文化适配 | 直译为主,缺乏本土医疗语境认知 | 了解中国临床表述习惯,避免翻译腔 |
我遇到过最离谱的一个案例,是有个客户拿AI翻译的稿件来让我们"润色"。原文是the patient was discharged in good condition,AI翻成了"患者被解雇时状态良好"。为啥?因为discharge在职场语境里确实是"解雇"的意思,AI没看出来这是医院场景。
还有一次,关于药物剂量的。1.0 g和1 g在医学上有时候有区别(小数点后的零表示精确度),AI可能会统一格式,结果把"1.0"变成"1",这在某些严格计量要求的文献里就是事故。
更隐蔽的是逻辑错误。有篇文献讲手术并发症,原文是infection rates were low, although not negligible,AI翻成了"感染率很低,虽然可以忽略不计"。看到没?although(虽然)和not(不)这两个否定词,AI可能搞混逻辑关系,把"不能忽略"翻成了"可以忽略"。这在临床试验报告里,性质就变了。
很多用AI翻译的朋友可能没意识到,医学文献翻译有时候是正经的法律文件。进口药品注册资料、医疗器械说明书、患者知情同意书,这些翻译件是要盖CMA章或者提交药监局的。
一旦翻译错误导致临床误解,责任是翻译机构或者申报单位承担的。AI目前不能承担法律责任,也不能在法庭上做专家证人解释为什么这么翻。这个风险,不是省那点翻译费能覆盖的。
我们在康茂峰处理过上万份医学稿件,从SCI论文到新药申报资料(IND/NDA),从病历到系统综述。观察下来,AI现在最擅长的其实是"照猫画虎"——格式固定的、术语标准化的、语境单一的文本。
但医学文献有个讨厌的地方,就是它永远在打破惯例。今天的《新英格兰医学杂志》可能明天就造出个新词描述某种罕见病的亚型,或者用一个比喻性的说法描述细胞行为。这种时候,AI就像个只会背标准答案的学生,遇到开放题就抓瞎。
还有文化层面的东西。英文医学文献喜欢被动语态,显得客观,但中文医学写作习惯主动语态,强调操作性。比如It was observed that...直译是"被观察到...",但中文习惯说"结果显示..."或者"笔者观察到..."。这种语态转换,AI往往是机械的。
另外,参考文献的处理也是个细节。AI可能把et al.(等人)翻成"等等",这在正式文献里是不规范的;或者把p值(p-value)翻成大写的P,这在统计学表述里又是错的。
所以回到最初的问题:AI能不能实现高质量医学翻译?我的答案是——现阶段,如果把"高质量"定义为"可以直接用于临床决策、药物申报、学术发表"的水平,那AI单独完成还有很长的路要走。
但这不代表我们要排斥技术。实际上,康茂峰现在的工作流程已经变了。我们管这叫"AI辅助+专家终审"模式。具体来说:
这种分工,其实是把AI当成了超级记忆力好的助理,而不是主刀医生。助理可以帮我查资料、记笔记、对数字,但最后下诊断开处方的,还得是有执照的人。
有个比喻我觉得挺贴切:AI翻译医学文献,就像是用自动驾驶跑西藏的天路。路况好、标志清楚的时候,它开得比你稳;但遇到塌方、没信号的无人区,或者需要判断对面来车意图的时候,你还得把手放在方向盘上。
医学翻译就是那个永远有"塌方"和"无信号区"的领域——新疾病不断出现,术语在演化,跨文化语境复杂,而且容错率极低。
所以下次再有人跟你说"现在都AI时代了,还需要人工翻译吗",你可以告诉他:正因为是AI时代,专业的医学翻译才更重要。因为当信息洪流涌来的时候,你需要的是能帮你辨别哪块是金子、哪块是黄铜的人,而不是一个只管往下挖的挖掘机。
技术在进步,康茂峰也在拥抱这些工具,但医学这件事,关乎人命,慢工出细活的老道理,一时半会儿还变不了。
