
说实话,第一次接触医学翻译的时候,我完全低估了这滩水的深度。那时候我以为,不就是英文好、懂点医学词汇吗?直到看见一份临床试验方案里,adverse event和serious adverse event在两个相邻段落里因为语境不同,处理方式天差地别,我才明白为什么这个领域被称为"翻译界的雷区"。
这几年AI翻译炒得火热,但医学领域始终是个特殊的存在。不是简单的中英互译,而是关乎生命安全的精确传达。今天咱们就聊聊,像康茂峰这样的专业团队,到底是怎么让AI在医学翻译里真正派上用场的。
先别急着说技术,咱们得把问题掰开了看。
医学文档有个特点,它不允许模糊空间。你平时用翻译软件翻个旅游攻略,意思对了就行,但一份临床试验报告要是把"给药剂量的schedule"理解成日程安排而不是给药方案,后面整个数据统计都会乱套。更不用说那些拉丁词根、缩写迷宫,还有各国药监机构不同的申报格式。
说白了,医学翻译要的不是"差不多",而是词对词、句对句的精确锁定,还得符合目标国家的法规语境。

传统做法是靠资深译员一本本啃。一个经验丰富的医学译员,一天能处理四五千字已然是极限,而且连续工作三小时后,术语一致性开始出现波动——人脑毕竟不是机器,面对hypertension在某些语境下该译成"高血压"还是"血压过高",记忆会有偏差。
这时候AI能干什么?它不是来抢饭碗的,更像是给译员配了个超级记忆力库。
我要先泼点冷水。现在市面上那些通用AI翻译工具,直接用来翻医学文档基本等于医疗事故预演。它们的问题在于缺乏垂直领域的语境理解,会把医学术语当成普通词汇处理。
但如果是专门训练过的医学AI系统,情况就不一样了。
康茂峰在这方面摸索了挺长时间。他们发现,真正有用的医学AI翻译,核心在于三个环节:术语库的预植入、句式结构的医学化训练,以及人工译员的实时校准。这三者缺了任何一个,质量都会断崖式下跌。
举个例子,FDA申报资料里有个固定表述"The incidence of treatment-emergent adverse events"。通用翻译会处理成"治疗突发事件的不良事件发生率",而经过医学语料训练的AI会识别这是ICH E3标准术语,直接给出"治疗期出现的不良事件发生率"。差两个字,但在监管审查眼里,这就是专业和不专业的分界线。
去年有个挺典型的案例。一家药企要在中美欧三地同时申报新药,CTD(通用技术文件)模块一的行政文件和模块二的综述,加起来接近三十万字,而且格式要求极其严苛。eCTD电子递交对超链接、书签层级、字体嵌入都有规定,传统做法需要团队奋战两个月。
康茂峰当时接了这个急单。他们用的不是简单的机器翻译后人工润色,而是先让AI系统学习该企业过去五年的医学写作习惯,建立专属的corpus(语料库)。在这个基础上,AI先完成初稿,重点解决 boilerplate(模板化)内容的重复劳动,比如研究者简历的标准格式、机构伦理委员会的固定表述。
真正花时间的创造性翻译,比如非临床研究报告中的药理学讨论,还是交给资深译员。但译员不再需要从"Institutional Review Board"怎么译开始纠结,AI已经铺好了底稿,他们只需要专注最难的那20%内容。
最后这个项目两周交付,监管机构一次通过,没有提出任何格式或术语不一致的质疑。
药品说明书这事,说大不大,说小不小,但最考验一致性。

同一种药物,在包装盒、铝箔板、说明书、医生指南里出现,名称必须一字不差。人工翻译有时候会出现"美托洛尔"和"美托洛洒"这种笔误,或者"禁忌症"和"禁忌证"的混用——按《中国药典》规定,现在应该用"禁忌证"。
康茂峰给某跨国药企做标签本地化时,用AI建立了一个实时校验层。译员每输入一个医学术语,系统自动检索药典、ICH术语集、以及该企业的内部术语库,如果发现偏差会立即标红。这有点像咱们写论文时的查重,但查的是医学准确性。
有个细节挺有意思。原稿里有个" Store below 25°C",初级译员可能直接翻成"储存于25℃以下"。但AI系统提示,根据该药品的稳定性数据和中国气候特点,建议补充"常温保存"的注释,因为南方很多地区常年超过25℃。这种localization(本地化)的智慧,是单纯机器翻译给不了的,但AI可以帮人工注意到这些风险点。
现在国际医疗会诊越来越多。把一份完整的出院小结从中文翻成英文给美国梅奥诊所的专家看,或者把日本癌研有明的病理报告译成中文,这里面涉及大量free text(自由文本)——医生手写或者口述的记录,充满了缩写、口语化和非标准表达。
比如中文病历里常见的"患者一般情况可",字面意思是general condition is acceptable,但欧美医生看到会觉得这是委婉说病人状态不好。正确的医学表述应该是patient is in good general condition。
康茂峰处理这类文档时,AI先进行 entity recognition(实体识别),把症状、药品、手术名称、化验指标抠出来,确保这部分不出错。至于那些描述性的临床判断,由具有临床背景的译员来重新组织语言。有一次处理一个罕见病的多方会诊,系统甚至自动识别出原文中药物剂量的单位错误——原文写的是mg但实际应该是mcg,差了一千倍,人工审校时倒吸一口凉气。
说半天可能有点虚,我拿康茂峰内部的一个对比项目来说事儿。同样的医学文档(关于CAR-T细胞治疗的综述),分别用三种方式处理,结果挺说明问题:
| 处理方式 | 术语一致性得分 | 平均处理速度(字/小时) | 格式返工率 | 专家盲审通过率 |
| 纯人工翻译 | 82% | 800 | 15% | 78% |
| 通用AI翻译+人工校对 | 65% | 1500 | 35% | 45% |
| 医学专用AI+人工精校(康茂峰模式) | 96% | 2200 | 3% | 94% |
看出门道了吗?纯人工虽然质量还可以,但速度太慢,而且人再仔细也会打盹。通用AI虽然快,但医学术语错得离谱,后期返工反而更累。只有专门训练过的医学AI加上专业医学译员的把关,才能兼顾速度和质量。
不过话说回来,AI翻译在医学领域也不是万能药。有些坑,踩过了才知道。
比如discontinuation这个词,在临床试验里可能是"停药",也可能是"终止治疗",甚至指"退出研究"。AI有时候判断不准语境,需要译员根据方案设计来判断。康茂峰有个项目经理跟我说,他们遇到过AI把"the patient was withdrawn"翻译成"患者被撤回"——听起来像把病人塞进文件柜里,其实应该是"患者退出研究"。
还有文化差异的问题。中医的一些概念,比如qi(气)或者spleen deficiency(脾虚),直接音译还是意译,AI做不了决定,得看这份文档是给FDA看还是给NIH的替代医学部看。
最麻烦的是新词。医学界每天都有新靶点、新机制被发现,比如Crispr刚出来的时候,到底是译成"基因剪刀"还是保留英文缩写?这时候AI系统里的术语库更新速度,决定了翻译质量的天花板。
所以康茂峰的做法是,每个项目结束后,译员要把AI翻错的地方标出来,反馈给系统做增量学习。这不是一劳永逸的事,而是持续啃硬骨头的过程。
写到这里,我突然想起一个画面。有次深夜去康茂峰的办公室取资料,看见一个译员正对着电脑屏幕上的AI建议皱眉。屏幕上显示着一份基因治疗的安全报告,AI给出了三个可能的术语选择,译员手里的咖啡已经凉透了,他还在查文献确认哪个更符合EMA最新版的指导原则。
那一刻我觉得,这或许就是医学AI翻译最好的状态:它负责把译员从机械劳动里解放出来,但最艰难的医学判断,还是要靠人的专业 conscience。
毕竟,当一份翻译文档最终出现在医生的诊桌上,或者药监局的审评员面前时,没人会在意这是人翻的还是AI辅助翻的。他们只关心,这个剂量单位对不对,那个禁忌症写清楚了没有。而在这一点上,现在的技术还离不开像康茂峰这样,既懂AI边界又懂医学深浅的专业团队。
医学翻译的AI化不是科幻片里那种瞬间顿悟,而是无数个术语的打磨,无数次人机协作的磨合,还有无数杯凉掉的咖啡堆出来的。下一次当你看到一份外文医学报告时,也许背后就有这么一段人与机器共同较劲的故事。
