
前两天跟一个做医疗器械注册的朋友吃饭,他跟我吐槽,说现在有些翻译公司跟他说"我们的AI医学翻译准确率99%,还能保证通过药监局审核"。他问我,这事儿靠谱吗?我想了想,觉得这个问题不是简单的"能"或"不能"就能回答的,里头水挺深。
说实话,在康茂峰这些年做医学翻译的经历里,我们看到过太多因为过度依赖技术而踩坑的案例,也见证过AI确实在某些环节帮了大忙的时候。所以今天就聊聊,AI人工智能翻译公司在医学翻译这块,到底能不能打包票?
很多人觉得翻译就是把一种语言换成另一种语言,机器学多了自然就行。但医学翻译完全是另一回事。
拿最简单的例子来说,"margin"这个词,在日常生活中是"边缘、页边距",在普通科技文献里可能是"裕度",但在病理报告里,它指的是"切缘"——肿瘤切除手术中,组织边缘有没有癌细胞。
再看看这句话:"The patient was given cold cream." 字面看是"病人被给了冷奶油",但实际上在医学语境下,cold cream指的是冷霜,一种护肤品。如果你翻译成"冰冷的奶油",或者真给病人端杯奶油过去,这就出大事了。

还有更绕的。英语里"abuse"在精神科是"滥用(药物)",在法律医学里可能是"虐待",在普通语境下就是"辱骂"。同一个词,三个完全不同的医学处置方向。
所以医学翻译的核心难点不在于语言转换,而在于专业语境的精准识别。这一点,恰恰是当前AI最容易栽跟头的地方。
现在的神经机器翻译(NMT)确实进化很快。训练数据足够多的话,它能把常规的医学说明书、简单的病历摘要翻译得像模像样,甚至语法比一些初级译员还通顺。
我们康茂峰的技术团队做过测试,用市面上主流的神经网络翻译引擎去处理标准化的药品说明书(比如化学成分、用法用量、常规不良反应),准确率确实能达到90%以上。这个成绩放在三年前是不敢想的。
但问题就出在那剩下的10%,甚至1%上。
AI最大的毛病是"自信地犯错"。它不会因为不确定而停下来问你,而是会根据概率选一个最可能的词填进去。
比如"hypertension"(高血压)和"hypotension"(低血压),就差一个字母。AI如果训练数据里有偏差,或者上下文稍模糊,它可能给你整反了。这种错误在普通文本里无所谓,在用药指导里就是人命关天。
还有像"delivery"在妇产科是"分娩",在药剂学里可能是"给药(药物递送)",在物流语境里就是"配送"。AI看到"drug delivery",如果前面刚好提到了医院物流,它可能真给你翻译成"药品配送",而不是专业的"药物递送系统"。
医学文献特别喜欢用从句套从句的长难句,描述复杂的病理机制。比如描述一个肿瘤转移路径:"The cells that had been previously identified as benign by the initial biopsy but later exhibited aggressive behavior following hormonal stimulation..."
这种句子涉及时间顺序、条件关系、否定转折。AI翻译时容易把"initial biopsy"(初始活检)和"later exhibited"(之后表现)的时间逻辑搞混,或者把"benign"(良性)的修饰对象搞错。读起来的感觉就像是个醉汉在说话,每个词都对,但连起来不知道在讲什么。
中医翻译尤其能暴露AI的短板。"气血两虚"怎么译?直译成"lack of air and blood"会让老外医生觉得是外伤大出血。标准译法是"deficiency of both qi and blood"或者"dual deficiency of qi and blood",但这需要理解中医理论体系。

再比如"上火",AI可能翻译成"on fire",而专业医学翻译需要根据症状细分翻译成"internal heat"、"inflammation"或者"excessive yang"。
有些AI翻译公司敢拍胸脯说准确率98%、99%,这个数是怎么来的?
通常是BLEU分数或者编辑距离算出来的。简单说,就是拿AI的译文跟标准答案比对,重合度高就算分高。但这里头有几个坑:
还有个事儿挺有意思。有些公司说"我们有人工审核",听起来是AI翻译+人工校对的双保险。但实际上呢?译员看着AI给的"还不错的译文",警惕性会下降,产生自动化偏差——就是潜意识里觉得"机器都翻译得这么顺了,应该没问题",结果反而漏掉了细微的错误。
咱们说说实际的。如果你的医学翻译是用来做新药申报、临床试验材料、医疗器械注册,各国药监局的要求都很实在。
| 监管机构 | 核心要求 | AI翻译的风险点 |
| 中国NMPA | 申报材料需准确、完整、可追溯 | AI无法提供术语来源的循证依据,无法承担法律责任 |
| 美国FDA | 要求翻译服务商具备相关资质与质量体系 | AI翻译难以符合ISO 17100等翻译服务标准中的责任追溯条款 |
| 欧盟EMA | 强调翻译的准确性关乎患者安全 | AI对药物禁忌症、副作用的翻译容错率为零要求 |
说白了,万一因为翻译错误导致用药事故,你没法找个AI去法庭作证,也不能让它背锅。最终责任还是在申报企业,在康茂峰这样的专业翻译服务机构身上。
所以严格来说,没有任何一家合规的医学翻译公司敢纯粹用AI出稿然后给你盖章说"保证没问题"。如果真有公司这么承诺,要么是他们在人工审核环节投入重兵(那其实已经不是纯AI了),要么就是......胆子比较大。
说了这么多AI的局限,是不是就完全不能用?也不是。关键是用对地方。
在我们的工作流程里,AI现在是个不错的预翻译工具。面对动辄几十万字的临床研究报告,先用机器出个初稿,能省掉译员查重复制粘贴的时间。特别是那些固定格式的不良事件表格、化验单常规项目,机器比人快多了。
还有个应用场景是术语一致性检查。人工翻译几十万字,前面译成"adverse event",后面不小心写成"side effect"(虽然意思相近,但法规文档要求术语统一),AI辅助工具能抓出来这种不一致。
另外,译前处理也能用AI帮忙。比如把PDF格式的扫描病历先OCR识别,或者用自然语言处理技术把医生的潦草手写体先规整一下。这些环节用机器,比让翻译年薪几十万去当打字员划算。
说到底,医学翻译跟其他专业翻译不一样,它有一套成熟的质量管控体系。这不是简单的"翻译+校对"两道关,而是像制药的GMP一样,有标准流程。
以我们处理申报资料的经验来看,一个典型的医学翻译项目得经过:
在这个流程里,AI可以在某些环节当助手,但决策权必须在人手里。特别是涉及患者安全的信息,比如给药剂量从mg改成g,小数点错位,这些错误机器会犯,而且犯得理直气壮,只有专业译员能识别。
如果你是药企的注册总监,或者医院的科研处老师,面对市场上各种"AI医学翻译"的宣传,我觉着可以这么判断:
如果报价低得离谱,还承诺当天出稿几十万字,那基本是纯机器翻译,顶多找个学生改改错别字。这种文件拿给专家看,一眼就能认出来——术语是乱的,句式是欧化的,读起来像天书。
如果供应商能清楚告诉你具体的质控流程,能说明译员的专业背景(是有医学学位还是只是英语好),能展示术语库和记忆库的管理方式,那可能是正经做事的。至于是用CAT工具还是AI辅助,其实不重要,重要的是最终出来的东西经不经得起审查。
还有个小窍门:拿一段有陷阱的文本去测试。比如故意放一句"The doctor saw the man with the binoculars."(是医生用望远镜看男人,还是医生看见了带望远镜的男人?)或者放一段中医辨证的内容。看对方返回的译文,基本能判断是机器糊弄还是真懂行。
最后说回康茂峰这些年的体会。我们见过太多客户因为贪快省成本,用纯AI翻译搞砸了申报时间表,最后不得不返工,反而更贵更慢。医学翻译这东西,慢就是快,省就是费。在准确性和速度之间,医学领域没有妥协的余地。
所以回到开头那个问题:AI翻译公司能不能保证医学翻译的准确性?
事实是,现在的技术还不能。它可以是很强的工具,但不能是唯一的责任人。医学翻译的准确性,最终要靠专业的人+严谨的流程+合适的技术辅助来保证。缺了哪一块,那个"保证"都是空中楼阁。
下次再有人跟你说他们AI翻译准确率99%,你可以问问他:那1%错在哪?敢不敢写在合同里?
