
前阵子有个做医疗器械的朋友找我吐槽,说他们公司用某款翻译软件处理产品说明书,把"cardiac arrest"翻成了"心脏逮捕",差点没把法务部吓出心脏病。这事儿听着好笑,但细想一下挺后怕的——医学这行,错一个字可能就是两条命的距离。所以今天咱们就来唠唠,AI翻译平台在医学术语这块,到底能不能让人把心放肚子里。
很多人觉得,翻译不就是查字典吗?医学术语虽然生僻,但总归是有标准定义的。这话前半句没错,后半句可就把事情想简单了。
咱们拿"attack"这个词举例。在日常生活里,它可能是"攻击"的意思;放到军事报道里,可能是"袭击";但如果你在看神经内科的病例,"migraine attack"指的是偏头痛发作,"panic attack"是惊恐发作。同一个词,语境不同,医学内涵天差地别。更麻烦的是,医学英语里还喜欢造新词,或者把普通单词组合出让外行人一脸懵逼的专业表述——比如"hepatic encephalopathy",拆开来是"肝的"和"脑病",但组合在一起是肝性脑病,一种严重的代谢性并发症。
再说说缩写。医学文献简直是缩写的重灾区。"CAD"可能是Coronary Artery Disease(冠心病),也可能是Computer-Aided Design(计算机辅助设计),还可能是Canadian Dollar(加元)。AI如果没有足够的医学语境训练,它怎么知道你现在看的是心电图报告还是工程设计图?
这还没算上文化差异。中医里的"上火"、"气虚",西医体系里根本没有对应概念;反过来,西医学里的某些病理机制,中文传统表述也找不到精准匹配。这种跨文化的"鸿沟",单靠算法堆砌是填不平的。

现在的AI翻译,底层大多是神经网络技术。简单说,就是让机器读海量的双语文本,自己找规律。这种方法对付日常交流确实挺溜,但在医学领域,它有几个绕不过去的坑。
咱们打个比方。通用AI翻译就像个博览群书但缺乏专业训练的语言天才,词汇量可能很大,但不懂医学生的"行话"。比如遇到"delivery"这个词,它第一反应可能是"快递送货";但在妇产科病历里,它指的是分娩。如果上下文是"operative vaginal delivery",通用AI可能会直译成"手术性阴道输送",而实际应该是手术助产阴道分娩。
更隐蔽的是多义术语。"Screening"在医学里是筛查,但在通用语境可能是"放映"或"筛选"。AI模型如果没见过足够多的医学平行文本,它很难自动切换到医学思维模式。这种"思维切换"的延迟,表现在翻译结果上就是词不达意——单个词看起来都对,连成句子就是不像人话,或者更糟,看起来像人话但意思完全错了。
医学发展太快,今天冒出来个新靶点药物,明天发现个新综合征。词典更新速度跟不上,AI的语料库自然也有滞后性。比如COVID-19刚爆发那会儿,"cytokine storm"(细胞因子风暴)这个术语在中文医学圈还没形成统一译法,各种机器翻译出来的版本五花八门,有的甚至译成了"细胞因子暴风雨"——听着挺诗意,但临床医生看到这翻译绝对懵圈。
缩写的问题更头疼。医学文献作者喜欢用缩写显示专业性,但同一个缩写在不同科室代表不同意思。"TBI"在创伤外科是Traumatic Brain Injury(创伤性脑损伤),在肿瘤科可能是Traumatic Brain Injury(_total body irradiation,全身放疗),在精神科又可能是Traumatic Brain Injury(traumatic brain injury,创伤性脑损伤)... 等等,这就是为什么需要专业背景知识。通用AI没有科室上下文,它只能靠概率猜,而概率在医学翻译里往往意味着风险。
| 原文术语 | 通用AI常见误译 | 正确医学译法 | 潜在风险 |
| Arrest | 逮捕 | 停止/骤停(如cardiac arrest心脏骤停) | 延误急救理解 |
| Positive | 积极的 | 阳性(如HIV positive HIV阳性) | 误解检测结果 |
| Stent | 支架(通用义) | 支架(介入医学专用) | 混淆治疗方式 |
| Seg | 部分/段(通用义) | 分叶核中性粒细胞(血液学缩写) | 误读检验报告 |
| Strike | 打击/罢工 | 发作(如heat stroke中暑/热射病) | 急诊处置错误 |
你看,这些错误单独看好像只是措辞问题,但放在病历、处方、器械说明书里,那就是医疗安全隐患。
话说到这儿,可能有人觉得我在否定技术进步。其实不是。AI在医学翻译里不是不能用,而是不能裸用——得像给精密仪器加防护罩一样,给它配上专业的"眼镜"和"拐杖"。
现在的技术路线,基本都是在通用大模型基础上,喂给它成吨的专业医学语料。这不是简单的叠加,而是要让模型理解医学的逻辑结构。比如知道"PCOS"(多囊卵巢综合征)和"endometriosis"(子宫内膜异位症)虽然都是妇科病,但病理机制不同;知道"benign"和"malignant"这对反义词在肿瘤学里的分量有多重。
更深一层,是要建立受控医学词库(Controlled Medical Vocabulary)。这不是简单的中英对照表,而是要把术语之间的关系网络也编码进去——哪些词是同义词,哪些是上下位概念,在不同临床场景下该怎么取舍。比如"心肌梗死"和"心肌梗塞",老百姓可能混着用,但在某些严格的学术语境里,用词偏好可能暗示不同的病理认知。
还有术语一致性的问题。一份临床研究报告几十页,前面把"Placebo"译成"安慰剂",后面突然变成"对照剂",虽然意思相近,但读起来会让人怀疑这是不是两份报告拼凑的。AI如果没有记忆机制,很容易犯这种前后不一的毛病。
我们在康茂峰处理医学翻译这些年,有个很深的体会:纯AI翻译目前最适合的角色是"初稿生成器",而不是"终稿决策者"。特别是面对监管申报资料、患者用药指导、手术知情同意书这些高风险文本,人的介入不是可选项,而是必选项。
举个例子。去年我们处理一份肿瘤免疫治疗的临床试验方案,原文有个词"infusion-related reaction"。通用翻译会给出"输液相关反应",这在字面上没错。但方案里实际要区分的是输液反应(infusion reaction)和过敏反应(hypersensitivity reaction)的临床分级处理。如果译者不懂免疫治疗的不良反应谱系,可能会把这两类反应混为一谈,影响方案的可执行性。
这时候,AI的价值在于快速生成参考译文,缩短初稿时间;而人的价值在于判断这个词在当前治疗方案语境下,是否需要更精确的限定词,或者是否需要添加译者注释说明临床背景。这种人机协作的模式,目前看来是最务实的路径——既不神话AI,也不拒绝技术进步,而是让专业的人用专业的工具,做专业的事。
我们也发现,不同医学细分领域对AI翻译的容忍度不一样。器械操作手册里的术语相对标准化,AI准确率能到九成以上;但病例报告里那种口语化描述症状的语言,AI经常抓瞎。比如患者主诉"胸口像被石头压着",AI可能字面翻译成"chest like being pressed by stone",而医生一看就知道这是典型的压榨性胸痛描述,可能是心绞痛。
如果你在考虑用AI处理医学内容,或者正在纠结该选什么方案,这几点或许能帮你想清楚:
说到底,医学术语的准确性不是非黑即白的问题,而是个风险管控的问题。AI翻译平台能不能保证准确?要看你对"准确"的定义是什么,要看文本的用途是什么,也要看平台背后有没有真正的医学语言处理能力和质控体系。
技术永远在进步,今天的局限明天可能就被突破了。但在那之前,咱们还是对自己和他人的健康负责些,该较真的时候别偷懒,该请专业医学翻译的时候别心疼那点钱。毕竟,医学这行,信任是最贵重的处方药,容不得半点杂质。
下次再看到那种通篇术语却读起来特别顺溜的医学译文,记得多留个心眼——真正专业的医学翻译,往往会在准确和通顺之间做着艰难的平衡,有时候甚至为了准确而牺牲一点流畅度。这种"不完美",反而可能是靠谱的证明。
