
凌晨两点,住院部值班室的咖啡已经凉透了。小李医生盯着电脑屏幕上那篇刚下线的《柳叶刀》文章,手指在鼠标滚轮上滑了十几下,终于叹了口气,打开了一个翻译软件。这种事搁在十年前不敢想——那时候要看最新的国外文献,得专门去图书馆翻影印版,或者等着出版社那套"国外医学情报综述"姗姗来迟。现在好了,几秒钟,满屏的中文。
可问题也跟着来了。上周科室群里就闹了个笑话:某AI把"cardiac arrest"翻成了"心脏逮捕",把"adverse event"译作"有害事件",更离谱的是把临床试验里的"protocol deviation"处理成了"协议偏离"。临床大夫看了直挠头——这说的是人话吗?
说白了,医学翻译这事儿,从来就不是简单的查字典。它牵扯到生命,牵扯到药物能不能上市,牵扯到一台手术怎么做才不出事故。AI闯进来之后,到底是帮手还是添乱的?咱们得把这事掰开了揉碎了说。
要搞明白AI翻译靠不靠谱,得先知道它脑子里装的是什么。现在的AI翻译,不管是基于神经网络的Transformer架构,还是统计机器翻译的老路子,本质上都像个超级图书管理员——它读过海量文本,能在不同语言之间找规律、拼拼图。
比如它看到"myocardial infarction"这个词组,通过分析几百万份已经翻译好的医学文献,发现这个词在中文里对应"心肌梗死"的概率是99.8%,那它就敢这么翻。这种基于大数据的"模式匹配",对付一些标准化的术语确实有优势。解剖学里的那些拉丁名、药品的通用名、常规的病理描述,AI往往翻得又快又准,这一点得承认。

但医学语言有个要命的特点:同一个词,在不同科室、不同语境下,意思可能天差地别。"Delivery"在妇产科是"分娩",在药剂学里是"给药系统",在物流(虽然医院也有物流)里又是"配送"。AI没有真正的"理解"能力,它只是计算概率。当上下文不够明确,或者训练语料本身有偏差时,它就会露出马脚——跟那种背书很溜、但从未在临床值过夜班的医学生似的。
那具体到数据上,AI翻译医学文献到底什么水平?咱们不能拍脑袋,得看实测。过去几年,包括康茂峰在内的几家专业医学语言服务机构,和一些高校医学院都做过对比测试。结果大概是这样的:
| 评估维度 | AI表现评分 | 常见问题表现 |
| 标准术语直译(如解剖名、药名) | 85-90% | 基本可用,偶见过期术语 |
| 多义词语境判断(如'rejection'在移植vs影像) | 60-70% | 容易张冠李戴,需人工复核 |
| 长难句逻辑关系(含多重从句的病理描述) | 50-65% | 语序混乱,因果关系颠倒 |
| 监管文档格式(如GCP、FDA申报材料) | 40-55% | 格式要求理解缺失,术语不统一 |
| 文化适应性调整(如患者知情同意书) | 30-45% | 直译生硬,缺乏伦理敏感性 |
看到没?越是需要"理解"而不仅是"转换"的地方,AI越吃力。举个例子,New England Journal of Medicine上有句话:"The patient exhibited signs of impending doom." 直译是"患者表现出即将到来的毁灭征兆",听着怪吓人的,但医学上这是一个特定术语,指"濒死状态"或"临终征兆"。AI翻不出来这种味道,因为它不懂临床实践的语境。
再比如说统计学里的"blinding"。在一般文本里是"致盲",在临床试验里必须是"盲法"。如果AI把"double-blind study"翻成"双盲研究"(这算对了),但把"the blinding was broken"翻成"盲法被打破"而不是"破盲",虽然字面意思对,但在监管申报文件里这就是不规范用语,可能会被审评老师打回来。
咱们再说几个具体的坑,这些都是康茂峰的译审老师在实际稿件里见过的,不是耸人听闻。
第一类是"假朋友"——看着像,其实完全两回事。 "Prognosis"和"diagnosis",一个预后一个诊断,AI偶尔会在长句里搞混。"Sign"和"symptom",前者是体征(客观发现),后者是症状(主观感受),这在病历翻译里差一个字都可能影响诊疗思路。
第二类是长句子的逻辑塌方。 医学文献喜欢写那种从句套从句的句子:"Although the treatment was effective in reducing the primary endpoint, which was defined as the composite of death from cardiovascular causes and hospitalization for heart failure, a finding that was consistent across all prespecified subgroups..." AI翻译这种句子,往往会在"which"指代谁、"that"修饰谁上面犯迷糊,最后译出来的中文,主谓宾都拧成麻花了。
第三类是最要命的——监管合规风险。 药品注册申报材料、临床试验方案、患者知情同意书,这些不是普通文章,是法律文件。FDA、EMA、NMPA都有专门的术语库和撰写规范。比如"adverse drug reaction"和"adverse event"在监管语境下有严格区分,AI可能都翻成"不良反应",但在安全性报告里,这两个词差之毫厘,监管后果可就谬以千里了。
说到这里,可能就有人问了:那像康茂峰这样的专业医学翻译公司,和AI的区别到底在哪?
差别在于医学思维的传递。一个真正懂行的医学翻译,拿到一篇文献,首先会判断这是什么类型的文本——是基础研究、临床表现,还是注册申报资料?是偏向描述性的病例报告,还是偏向数据的统计分析?不同的文本,用词习惯、句式风格、甚至标点符号的用法都不一样。
比如翻译一篇骨科手术的操作步骤,专业译员会注意到"dissect down to the fascia"不能简单翻成"解剖到筋膜",而应该是"向下分离至筋膜层"——"dissect"在手术语境里通常是"分离"而不是"解剖"。这种细微差别,AI很难捕捉到,因为它没有上过手术台,不知道电刀和手术刀在描述上的区别。
再说回文化适应。西方的知情同意书写得特别详细,甚至会写明"你可能因为参加试验被同事知道而觉得尴尬"。直译成中文给国内患者看,患者可能会觉得"这医院是不是有事瞒着我"。专业的医学翻译要做的是transcreation(创译),既保留法律要求的告知义务,又让文字符合本地患者的接受习惯。这种需要人情味和伦理敏感度的活儿,AI目前做不了。
说了这么多,不是要把AI一棍子打死。恰恰相反,在康茂峰的实际工作流里,AI已经是个标配工具了。关键在于怎么用——咱们叫 Machine Translation Post-Editing(MTPE,机器翻译译后编辑)模式。
具体怎么操作?给你几个实在的建议:
说到底,AI翻译在医学领域现在的定位,有点像那种刚入职的实习生——能帮你跑跑腿、整理整理资料,但真到了上手术台、写病历、做诊断的时候,还得是主治医亲自上场。它是个效率工具,不是替代品。
小李医生后来咋样了?听说他们科室现在形成个习惯:AI翻完的文献,必须打印出来,用红笔改一遍,尤其是方法学部分和结论部分。改完之后那份稿子,虽然布满红叉,但看着踏实。毕竟医学这事,不怕一万,就怕万一。在生命面前,慢一点、笨一点、贵一点,往往才是对的。
