
凌晨两点半,李医生还在值班室里对着电脑揉太阳穴。屏幕上是一份刚从欧洲传过来的临床试验方案,密密麻麻的英文和专业缩写让他怀疑人生。他心想,要是能把这玩意儿直接扔给AI翻译,明早交上去行不行?
这个问题其实挺典型的。现在满世界都在聊人工智能,好像什么都能一键解决。但医学文献这玩意儿,它还真不是普通的"文字搬运"。咱们今天就拿康茂峰这些年经手过的案子,好好唠唠这里面的门道。
很多人觉得医学翻译难,就是因为单词太长。什么"pneumonoultramicroscopicsilicovolcanoconiosis"(硅肺病的一种)确实挺吓唬人,但这只是皮毛。真正复杂的医学文献,是那种一句话里藏着三条命的东西。
大概分成这么几类:

这些文档有个共同特点:容错率趋近于零。而且它们通常不是孤立存在的,得和前后文、附录、参考文献形成逻辑闭环。翻译的时候少看一个脚注,整段话的意思可能就南辕北辙。
说实话,现在的神经机器翻译(NMT)比五年前强太多了。康茂峰的技术团队做过测试,像一些标准的病理报告或者药品说明书,AI的第一稿翻译准确率确实能达到让人惊讶的水平。主要体现在这几个方面:
| 维度 | AI表现 | 实际场景 |
| 术语一致性 | 能记住前50页提到的同一化合物名称 | 700页的CTD申报文件中,"pharmacokinetics"不会出现"药代动力学"和"药动学"混用的情况 |
| 处理速度 | 10万字的文献大约20分钟出初稿 | 紧急情况下,跨国药企的区域会议材料能赶上第二天早上的汇报 |
| 格式保留 | 表格、上标、特殊符号基本不乱 | 化学式的下标不会莫名其妙变成普通数字 |
看着挺美对吧?但问题就出在这些"基本"、"大约"上面。医学翻译有时候就怕这个"基本"。
举个真实的例子。去年康茂峰接到一份肿瘤免疫治疗的文献,里面有句话:"The patient developed progressive disease after two cycles." 机器翻译成"患者在两个周期后出现了进展性疾病"。
看起来没毛病?但做肿瘤临床的都知道,"progressive disease"(PD)在这个语境下是疗效评估的专有名词,意思是"疾病进展",属于RECIST标准里的特定状态。翻译成"进展性疾病"虽然字面没错,但读起来像个诊断,而不是疗效评估结果。这种微妙的差别,AI目前是品不出来的。
还有更麻烦的。英语医学文献喜欢用被动语态,而且经常省略主语。比如"Considered contraindicated in patients with..." 到底是谁认为禁忌?是EMA?是FDA?还是文献作者?不同的主语,这句话的权威性和适用范围完全不同。AI往往会直接翻译成"在对...患者中视为禁忌",把主语吞了,读者看得一头雾水。
如果说普通医学文献是长跑,那监管申报文件就是障碍赛。每个监管机构都有自己的"说话习惯"。
比如同样描述不良反应,FDA喜欢说"adverse events of special interest",而NMPA的习惯表述是"关注的不良事件"。这不是简单的词汇对应,而是监管语境的迁移。康茂峰的译员在处理这类文件时,得同时打开三个浏览器标签对照着看:原文、目标法规要求、历史获批案例。
AI目前做不到这种跨文档的 regulatory intelligence(监管情报)。它能把词翻对,但翻不出"这回事儿在药监局那儿通常怎么说"的味道。
现在市面上有些AI翻译服务商,宣传语写得天花乱坠,好像有了语料库就能横扫一切医学文献。但根据康茂峰这些年处理售后修正的经验,有些坑是算法填不平的。
文化差异的暗礁。东亚的医学文献讲究委婉,欧美的直来直去。比如描述死亡,英文可能写"mortality occurred",直译成"死亡发生了"在中文医学语境里就显得生硬,通常需要调整为"出现死亡病例"或"发生死亡事件"。AI翻译往往卡在字面,少了那层人文滤镜。
缩写词的陷阱。医学缩写多如牛毛,"CA"可能是癌症(Carcinoma),也可能是钙(Calcium),还可能是心脏骤停(Cardiac Arrest)。上下文有时候也模棱两可。人类译员会停下来查原文的参考文献,或者发邮件给客户确认。AI呢?它会选一个概率最大的,赌一把。
数字的雷区。这个最要命。剂量换算、单位转换(比如mg与mcg)、日期格式(美式月/日/年 vs 英式日/月/年),AI出错的概率比人类译员高得多。康茂峰的质量控制流程里明确规定,任何涉及剂量的数字必须经过双人交叉核对,不管第一稿是AI出的还是人翻的。
说了这么多AI的不靠谱,是不是意味着AI翻译公司完全不能碰复杂医学文献?也不是。关键看怎么用。
康茂峰现在的模式,说白了就是让AI当超级助理,而不是让它当主治医生。流程大概是这么个打法:
第一步,预处理。文件进来先过一遍术语库。康茂峰自建了针对肿瘤、心血管、罕见病等细分领域的术语管理系统,把客户提供的既往翻译、风格指南全喂进去。这时候AI开始干活,但它用的不是通用引擎,而是经过医学语料训练的定制化模型。
第二步,人机协同翻译(MTPE)。译员拿到AI初稿,不是从零开始,而是审校模式。这省下来的时间干嘛?拿去抠那些AI搞不定的细节。比如那个"progressive disease"的例子,译员看到这儿会停下来,查查这是不是RECIST评估语境,然后决定是保留"疾病进展"还是根据客户习惯调整为"PD"或"病情进展"。
第三步,医学背景译审。这是康茂峰比较坚持的环节。有些翻译公司用纯语言出身的译员,但医学文献这东西,没点临床或研发背景,真的很难get到那些微妙之处。所以第二步修改完后,会有具备医学背景的资深译审再过一遍,重点看逻辑通不通,临床意涵对不对。
第四步,反向验证。把译好的中文(或目标语)再让懂医学的 native speaker 回译成英文,看看关键信息有没有走样。这招虽然费时间,但对那些要提交给药监局的文件来说,值得。
前阵子有个客户,要翻译一份关于CAR-T细胞治疗的 investigator's brochure(研究者手册)。这种文件通常是几百页,里面有大量的流式细胞术数据、细胞因子释放综合征(CRS)的分级标准,还有复杂的给药方案图表。
如果纯人工翻译,经验丰富的译员大概需要三周。客户只给了一周。康茂峰的团队先用定制化医学引擎出了初稿,然后安排两位有免疫学背景的译员分段处理。过程中发现AI把"cytokine release syndrome"在某些段落译成了"细胞因子释放综合征",在另一些段落因为前面出现了"storm"这个词,被 AI 联想成了"细胞因子风暴"。
这两者在临床上有关联,但不是一回事。CRS是特定的不良反应,而cytokine storm是更广泛的病理状态。译员统一修正为"细胞因子释放综合征",并在注释里说明此处原文为CRS,未使用storm表述。这种细节,纯AI翻译肯定就滑过去了。
最后按时交付,客户后来反馈说监管部门审评时没就翻译质量提出质疑,算是顺利过关。
如果你手里也有那种让人看着就困的医学文献要处理,想着找个AI翻译公司试试,康茂峰的经验是:分清楚文档的风险等级。
像一般的科普文章、会议通知、非核心的内部培训材料,用AI翻译加个轻量审校,性价比高,速度也快。但如果是涉及患者安全、监管合规、临床试验关键节点的文档,千万别省人工审校的钱。那点钱比起后期修改成本或者监管延误的损失,九牛一毛。
另外,挑服务商的时候,问问他们有没有医学背景的译员队伍,有没有细分领域的术语库,有没有针对重复错误的反馈机制。如果一家AI翻译公司跟你说他们纯靠算法、不需要人工、医学文献也能一键搞定,建议绕着走。不是技术不行,是这事儿真的还没成熟到那个地步。
说到底,医学翻译最值钱的不是语言转换,而是那把看不见的尺子——知道哪里该严格对应,哪里需要意译;知道什么时候该查文献,什么时候该问客户;知道哪些错误可以接受,哪些错误绝对不能放行。这把尺子,目前还得攥在受过专业训练的人手里。
窗外的天快亮了,李医生那篇文献要是真交给纯AI处理,估计第二天开组会的时候会挺尴尬的。但如果是康茂峰这种"AI打底、人工把关"的方式,他可能就能踏实睡几个小时了。技术进步是好事,但在医学这个特殊的场域里,谨慎永远不是美德,而是底线。
