
前几天朋友给我发了张照片,是他从医院带回来的外文药品说明书,下面还配了手机自动翻译的中文版本。他问我:"你看这翻译得对吗?能照着吃吗?"我盯着那行"Take one tablet daily"被译成"拿一个药片日常"的文字,心里咯噔一下。这大概就是很多人最关心的问题了——现在AI翻译这么厉害,医学这种专业性极强的东西,它真的能搞定吗?
在说医学翻译之前,咱们得先理解一下这些AI翻译工具到底在干什么。很多人以为它们像字典一样,只是查词对应,其实不是。现在的神经网络翻译(就是深度学习那种),更像是一个超级聪明的"概率猜测器"。
怎么理解呢?想象你从小读遍了世界上所有的医学文献、病历、药品说明书,你的脑子里形成了一个巨大的语言地图。当看到"hypertension"这个词时,你不是在查字典,而是基于之前读过的几百万份资料,直觉性地知道这个词在中文语境里大概率对应"高血压",而不是"高压管理"或者"紧张情绪"。
这个过程听起来挺牛的,对吧?它确实在大多数时候管用。对于通用领域的翻译,比如旅游对话、日常邮件,现在的AI准确率确实能达到让人惊艳的程度。有些测试数据显示,主流神经网络翻译在通用语料上的BLEU评分(一种衡量翻译质量的指标)已经能达到0.8以上,接近人工水平。

问题就出在这里——医学不是通用领域。
咱们先说说医学语言的特殊性。你可能觉得医学就是术语多、生僻词多,这只是表面。真正麻烦的是医学语言的精确性要求和上下文依赖性达到了一种近乎苛刻的程度。
举个例子,"delivery"这个词在日常英语里是"快递、送达",在医学里可能是"分娩"。看起来AI应该能根据上下文分辨?但实际情况复杂得多。比如"emergency delivery"在产科是"急诊分娩",在医疗器械领域可能是"紧急输送(设备)"。如果病历里写的是"The patient had a difficult delivery history",AI如果误判上下文,可能会翻译成"患者有困难的快递历史"——虽然听起来荒谬,但确实是真实发生过的错误。
在康茂峰处理过的审校案例中,我们发现AI在处理多义词时的错误率比在通用文本中高出3到4倍。特别是当遇到缩略语时,简直是灾难现场。"MI"可能是"Myocardial Infarction(心肌梗死)",也可能是"Mitral Insufficiency(二尖瓣关闭不全)",甚至只是"Medical Investigation(医学调查)"。没有足够上下文支撑,AI往往只能选一个概率最大的,但医学容不得这种"大概也许可能"。
还有一点很多人没意识到,医学翻译不只是语言转换,还涉及法规合规和文化适配。比如药品说明书里的副作用警告,在美国可能是密集的法律术语堆砌,直接翻译成中文的话,中国患者可能根本看不懂,或者看了反而恐慌。这时候需要译者根据中国的药监要求和读者习惯进行"创译"(transcreation),而不是字面直译。
AI目前还不具备这种文化敏感性,它更像是一个"忠实的复制者",而不是"聪明的沟通者"。
说了这么多感性的,咱们看看客观数据。根据《医学翻译质量评估标准》以及一些学术论文(比如发表在《翻译研究前沿》上的相关研究),目前即使在训练数据充足的语种(比如英中、英日)之间,AI在医学专利和临床试验方案翻译中的初稿准确率大概在75%到85%之间。
听起来不低?但你要知道,医学翻译的行业标准要求错误率必须低于0.1%,特别是涉及剂量、禁忌症、手术部位这种关键信息时,是零容忍的。也就是说,AI翻译100句话,可能有15到25句存在问题,而行业标准只允许0.1句有问题。
这个差距,目前完全靠人工来弥补。
| 评估维度 | 通用文本AI表现 | 医学文本AI表现 | 医学行业标准要求 |
| 术语准确率 | 95% | 82% | 99.9% |
| 数字/剂量错误率 | <1% | 5-8% | 0% |
| 句式通顺度 | 92% | 78% | 95% |
| 法规合规性 | 不适用 | 45% | 100% |
在康茂峰参与的一些医学翻译项目中,我们做过对比测试。发现AI翻译最容易栽跟头的地方,往往不是那些明显的生僻词,而是看起来"很简单"的常识性表述。
比如"Dr. Smith is tied up in surgery right now"这句话,AI可能会翻译成"史密斯医生现在在手术中被绑住了"(tied up理解为捆绑),而正确理解应该是"史密斯医生正在做手术,暂时脱不开身"。这种错误在通用翻译里可能好笑一下就过去了,但在医患沟通邮件里,可能会让病人以为医生出了什么意外。
还有更隐蔽的。缩写和拉丁文在医学里到处都是。"q.d."(每日一次)、"b.i.d."(每日两次)、"prn"(需要时),AI有时候会漏掉,有时候会把"q.n."(每晚)和"q.h."(每小时)搞混。每小时吃一次药和每晚吃一次药,这区别可就是生与死的区别了。
也不是。说实话,在康茂峰的工作流程里,AI已经成了一个效率工具,而不是替代方案。
比如处理大量医学文献的初步筛选,或者处理格式固定的实验记录,AI能快速给出"大概意思",帮助译员快速理解文本框架。这时候它就像一个聪明的实习生,能帮你打好草稿,但最后把关的必须是经验丰富的专业译者。
特别是在译后编辑(Post-Editing)模式下,由机器先翻译,专业医学译员再进行审校和修正,这种方式在成本和时间上确实有优势。但关键点在于:译员必须能够识别出AI犯的错误,而这需要非常扎实的医学背景和翻译经验。不是随便找个会外语的人就能做AI审校的。
所以回到最开始的问题——AI翻译技术能不能保证医学翻译的准确性?
答案是:目前还不能独立保证。
现在的技术条件下,医学翻译仍然需要"人"作为最终的质量关卡。AI可以处理重复性、模板化的内容,提高基础效率,但在涉及临床决策支持、患者用药指导、医疗器械操作说明这些高风险领域,人工翻译和专家审校依然是不可或缺的。
而且医学本身就在不断发展。昨天刚出现的新药、新的治疗方法、新的手术技术,AI的训练数据里可能根本没有。它基于"过去学到的知识"来猜测新东西,这在医学这种日新月异的领域,本身就是个风险点。康茂峰的译者团队几乎每个月都会遇到新出炉的医学术语,这些都需要人工及时更新术语库,而不是等着AI自己"学会"。
如果你只是想知道某篇医学新闻的大致内容,AI翻译够用了,看个热闹没问题。但如果你要翻译的是:
千万别依赖纯AI翻译。哪怕你找的是便宜的非专业人工翻译,也比直接拿AI结果要强。医学翻译的门槛不在于语言,而在于对医学逻辑的理解。
换句话说,AI是工具,医学翻译是专业活。就像计算器再快,做账的还是得懂会计;相机再智能,拍婚纱照的还是得懂光影构图。现在的AI翻译,大概就相当于一个医学词汇量很大、但临床经验为零的医学生——它知道很多词,但还没学会怎么为生命负责。
朋友后来把那页说明书发给了康茂峰做医学翻译的同事,半小时后收到了准确的版本。他说:"原来'once daily'后面跟着的是具体服用时间要求,AI翻漏了半句话。"是啊,有时候就是漏掉的那一点点,决定了到底能不能救命。
