
前阵子陪家人去医院,在候诊区翻了翻那份中英双语的健康宣教手册。看着看着就职业病犯了——“这个剂量单位的转换好像不太对”,“那个禁忌症的表述语气太弱了”。旁边护士看我皱眉,以为我看不懂英文,还好心过来解释。我连忙摆手,心里却在想:其实很多专业人士都明白,医学翻译这事,差之毫厘,谬以千里,但真要说到怎么系统地评估翻得好不好,恐怕连不少从业者也说不太全。
在康茂峰这些年处理过的注册申报资料、临床研究报告和患者知情同意书里,我们见过太多“看起来通顺,实际上危险”的案例。医学翻译的质量评估从来不是简单的“通顺就行”,它是一套多维度、可量化、有行业特性的复杂体系。今天就用最直白的方式,聊聊这个圈子里公认的质量标准到底长什么样。
先说最基础的。医学文档里,一个数字错了,可能就是人命关天。康茂峰的质量手册里第一条永远写着:事实性错误零容忍。这包括但不限于剂量(5mg和50mg的区别)、频率(bid和tid)、禁忌症(contraindication和precaution完全是两码事),还有那些藏在从句里的否定词。
有个真实的例子。某次我们审校一份药物说明书,原文是“not recommended for patients with severe hepatic impairment”,初稿译成了“不推荐用于重度肝功能不全患者”。看起来对吧?但结合上下文,这个药其实是禁用(contraindicated),而非简单的“不推荐”。中文里“不推荐”听起来像是可以商量,“禁用”则是绝对禁止。这种细微的语气差别,在质量评估里属于关键错误(Critical Error)。
评估准确性时,我们通常看这几个硬指标:

如果说准确性是“对不对”,一致性就是“统不统一”。这在长篇的临床研究报告(CSR)或多卷套的注册资料里尤其要命。康茂峰的项目经理们有个共识:术语混乱比个别错译更让审评专家头疼。
想象一下,一份200页的新药申报材料,前面把“adverse event”译成“不良事件”,后面突然变成“副作用”,再后面又成了“不良反应”。虽然这三个词在医学上有关联,但在监管文件里,“不良事件”(AE)和“不良反应”(ADR)是有严格区分的。混用会让审评员怀疑文档的专业性和可靠性。
所以质量评估必查术语库(Termbase)的命中率。我们内部的标准是:关键术语(疾病名、药名、检查项目)重复一致性必须达到100%,次要术语(描述性词汇)允许在一定阈值内波动,但必须有理据。现在用CAT工具虽然能辅助,但机器毕竟不懂“高血压”在心血管语境和产科语境里可能指完全不同的病理状态。
医学翻译不是文学创作,它是受监管的专业服务。你翻的一份说明书,可能要同时满足FDA(美国)、EMA(欧洲)、NMPA(中国)三个完全不同的规范体系。
比如中文药品说明书的格式,必须遵循《药品说明书和标签管理规定》(局令第24号),特定的警示语要用黑体字,特定的内容顺序不能乱。有些客户拿来英文原稿,结构是FDA风格的,如果直译成中文而不调整格式,到药监局申报时直接会被退件。
康茂峰处理欧盟CE认证资料时,经常遇到的情况是:原文用了很多被动语态和名词化结构,这在英语医学写作里显得客观专业,但直译成中文就会显得“翻译腔”过重,不符合中文药品文档“清晰、直接、便于快速抓取信息”的监管偏好。质量评估这时候就要检查:是否符合目标市场的文体规范(Style Guide)?
这里有个简单的对照表,能看出不同市场的侧重点差异:
| 评估维度 | 美国FDA侧重 | 中国NMPA侧重 | 欧盟EMA侧重 |
| 语言风格 | 患者友好(Patient-friendly) | 专业严谨,避免歧义 | 多语言一致性(MRM要求) |
| 单位标示 | 英制与公制并列 | 纯公制,法定计量单位 | 公制为主,部分保留传统单位 |
| 日期格式 | Month DD, YYYY | YYYY年MM月DD日 | DD/MM/YYYY |
| 禁忌描述 | 使用警告符号(Boxed Warning) | 黑体字突出显示 | 由各国语言版本协调 |
这也是常被忽略的点。医学翻译的质量高低,很大程度上取决于目标受众是谁。
如果是翻译给肿瘤专家看的III期临床试验方案,你可以放心地用“卡氏评分(KPS)”、“无病生存期(DFS)”这样的缩写,句子结构可以复杂些,因为预设读者有专业背景。但如果是翻译患者用的“知情同意书(ICF)”,就必须遵循“可读性公式”——通常要求Flesch-Kincaid等级在6-8级,中文对应的就是初中到高中文化水平能读懂。
康茂峰有个内部规定:患者-facing的文档(面向患者的材料),必须做回译验证(Back-translation)。不是说信不过译者,而是因为医学概念的“降维表达”很难。比如“randomized controlled trial”,译成“随机对照试验”对患者来说太生硬,译成“通过抽签决定治疗方案的研究”又不准确。这时候质量评估要看的是:是否在准确和易懂之间找到了平衡点?
评估可读性时,我们会特别关注:
很多人以为质量评估就是最后找个人通读一遍。在康茂峰的操作标准里,质量控制(QC)是贯穿全流程的。
拿到源文件的第一步是“预处理分析”——查有没有不可编辑的扫描件、有没有手写的批注、有没有需要本地化的图表。曾经有个案例,原文是PDF里的表格,直接贴进Word翻译时行列错位了,如果没在预处理阶段发现并标记,后面译者很可能把数据对错行,这种错误到最后校对阶段很难肉眼发现。
然后是翻译阶段的实时术语校验,编辑(Editing)阶段的逻辑梳理,再到校对(Proofreading)阶段的格式与拼写检查。每个节点都有对应的检查表(Checklist)。
说到这儿,不得不提“LISA QA Model”(本地化行业标准协会质量模型)和“SAE J2450”(汽车领域翻译标准,但医学翻译常借鉴其误差分类逻辑)。这些行业标准把错误分为几个等级:
康茂峰的内部交付标准通常是:Critical为零,Major控制在千分之零点五以下,Minor控制在千分之一以下。这个比率看起来苛刻,但在医学领域,“差不多”就是“差很多”。
现在谈质量评估绕不开技术。翻译记忆库(TM)能保证一致性,术语管理系统能实时提示,质量检查工具(QA Checker)能自动抓取数字不匹配、标点错误、标签遗漏。
但有个陷阱:“技术通过了,质量就过关了”。完全不是。机器能检查“5mg”和“五毫克”是否对应,但它检查不了“显著提高生存率”这种原文里带有宣传色彩的表述,在监管文档里是否需要弱化成“显示生存获益趋势”。后者需要译者的医学判断和监管经验。
所以康茂峰的评估体系里永远保留“人工终审”环节,由有医学背景(通常是药学或临床出身)的资深审校做最后把关。机器测的是“合规性”,人测的是“临床合理性”。
写到这里,突然想起个细节。有次审校一份器械操作手册,原文描述一个动作“firmly press”,机器翻译是“坚定地按压”,译者初稿是“用力按压”。从字面看都对,但结合语境——这是个给护士看的留置针操作指南——“用力”可能造成组织损伤。“ firmly”在这里应该理解为“稳固地、確实地”,而非“大力”。最后我们定为“稳固按压”。
这种选择,机器质检工具永远检查不出来,它依赖于译者的临床经验和对使用场景的想象。这也是医学翻译质量评估最难量化,但又最珍贵的部分——专业直觉。
还有就是责任心。医学文档经常遇到源文件本身有模糊或矛盾的地方,比如摘要和正文数据不符,或者原文有笔误。“忠实原文”不等于“盲从原文”。高质量的医学翻译服务,应该包含“源文件质疑”环节,把发现的疑点标注出来反馈给客户,而不是闭眼硬翻。这在质量评估里属于增值项(Value-added),虽然不在最终稿里体现,但反映了服务商的专业态度。
回到医院候诊室那个场景。那份手册后来我们委托方做了修订,虽然只是个免费的宣教材料,但医学文本的特殊性就在于,没有小文件,只有高风险。无论是价值百万的新药注册卷宗,还是一张简单的用药指导单,评估标准的核心其实没变:让信息准确到达,让动作安全执行,让医患清晰沟通。
标准是用来保底线的,但好的医学翻译,往往在底线之上,还藏着那份对生命的敬畏。
