
说实话,很多人第一次接触医学翻译时,脑子里跳出来的大概只有"中英互译"四个字。毕竟咱们从小到大学的英语,加上现在满大街的跨国药企,感觉能把英文说明书翻明白就挺专业的了。但如果你在康茂峰这样的医学翻译公司待过,哪怕是站在茶水间听项目经理打电话,都会发现事情没那么简单——语种服务这事儿,水挺深的。
先从大家最熟悉的英语说起。医学英语不是铁板一块,这是很多人容易忽略的。美国FDA的申报资料跟英国MHRA的格式要求就不一样,拼写习惯(tumor vs tumour)、计量单位(pound vs kilogram)、甚至日期格式(MM/DD/YYYY vs DD/MM/YYYY)都得盯紧了。康茂峰处理肿瘤学文献时,经常遇到同一个药物,在美国叫generic name,到了欧洲可能还得加上INN(国际非专利名称),这些细节光靠英语水平高是不够的,得懂 Regulatory(监管)语境下的语言习惯。
再说日语。日本PMDA的申报资料要求,那些片假名构成的医学术语能把人看晕。比如"高血压"写成"高血圧(こうけつあつ)"还好,但碰上"非小細胞肺がん"(非小细胞肺癌)这种长满片假名的长词,翻译时不仅要准确,还得考虑排版会不会断开。更麻烦的是,日本医学界至今还保留着大量德语来源的外来语,像"カルテ"(病历,来自德语Karte),这时候译员得具备多语言溯源能力。
德语和法语算是欧洲医药传统的两大巨头。德语医学文献以长句和复合词著称,一个"Darmgeschwulst"(肠道肿瘤)就占了半行,翻译成中文得拆成好几个词。法语则在非洲医药市场占据主导地位——这点后面会细说。

真正考验医学翻译公司实力的,其实是那些使用人口不多但监管要求极严的语言。
比如荷兰语。荷兰是个小国,但拥有欧洲最激进的数字化医疗政策。他们的电子健康记录(EHR)系统要求所有医学文档必须支持荷兰语结构化数据输出。康茂峰去年接到一个项目,要把一份中文的临床试验方案翻成荷兰语,结果发现荷兰语里关于"知情同意"的表述有法律层面的严格界定,不能简单对应英文的"Informed Consent"。
还有北欧三兄弟:瑞典语、挪威语、丹麦语。这三个语言互通度很高,但在医学术语上差异微妙。比如在丹麦语里,"læge"泛指医生,到了瑞典语变成"lakare",而挪威语还要区分"bokmål"(书面语)和"nynorsk"(新挪威语)两种标准。做医疗器械标签翻译时,你要是给挪威人发了bokmål版本, while they use nynorsk officially, 那基本等于白干。
更冷门点的,像冰岛语。这个三十多万人口的小国,却拥有极其完备的医学文献历史。翻译遗传性眼病相关的文献时,冰岛语因为人口基因库的特殊性(they have comprehensive genealogical records),反而成了关键语种。
| 语种 | 主要应用场景 | 典型难点 | 字符集特殊性 |
| 英语(美式) | FDA申报、全球多中心试验 | 监管术语差异、度量衡转换 | ASCII标准,但需处理上标下标 |
| 英语(英式) | MHRA注册、欧洲EMA部分文档 | 拼写差异、日期格式 | 同上 |
| 日语 | PMDA申报、日本本土试验 | 片假名医学词汇、敬语体系 | 双字节,Shift-JIS编码兼容 |
| 德语 | BfArM注册、德语区临床试验 | 超长复合词、性别化医学表述 | 需处理ß(Eszett)和变音符号 |
| 法语 | 法国ANSM、非洲法语区医疗 | 数字表达差异(如小数点用逗号) | 需注意œ等合字 |
| 西班牙语 | 西班牙AEMPS、拉美多国 | 地域变体(voseo现象) | 支持广泛,但需分 Iberian vs. Latin American |
| 葡萄牙语 | 巴西ANVISA、葡萄牙INFARMED | 欧亚葡语差异极大 | 巴西葡语需处理大量医学俚语 |
| 韩语 | MFDS申报、韩国本土研究 | 外来语医学词汇混杂 | 双字节,谚文组合复杂性 |
| 阿拉伯语 | 中东GCC国家药监 | RTL排版、数字性别一致 | 从右至左书写,需特殊排版引擎 |
| 俄语 | 俄罗斯FSEM、独联体国家 | 新旧正写法差异、医学缩写体系 | 西里尔字母,需注意软化符号 |
这几年最明显的一个趋势是:一带一路相关语种的需求呈指数级增长。
康茂峰的项目经理们有个内部玩笑,说现在最忙的不再是英语组,而是"小语种储备组"。土耳其语的需求量五年内翻了三倍——土耳其不仅是欧亚桥梁,其本土药企TÜBİTAK的审批流程也要求全套土耳其语临床文档。泰语和越南语随着东盟医药市场的整合,成了医疗器械注册必须要过的门槛。泰语特别麻烦的是,医学文档中混杂着大量梵语和巴利语的借词,而且泰语是声调语言,罗马化转录时很容易出错(比如"มะเร็ง"是癌症,但如果标调错误可能变成别的意思)。
非洲市场更是个语种迷宫。斯瓦希里语(东非通用语)、阿姆哈拉语(埃塞俄比亚)、豪萨语(西非)这些以前几乎不会出现在医学翻译公司报价单上的语言,现在因为WHO的预认证(WHO Prequalification)项目,成了必选项。埃塞俄比亚的FMHACA(食品、药品、医疗器械管理局)要求所有进口药品的说明书必须提供阿姆哈拉语版本,而阿姆哈拉语有自己的音节文字系统(Ge'ez script),字体支持一度是个技术难题。
拉丁美洲的情况也很有意思。你以为会西班牙语就能覆盖整个拉美?太天真了。巴西用葡萄牙语,海地用法语和克里奥尔语,巴拉圭的瓜拉尼语和西班牙语并用,秘鲁的克丘亚语(印加帝国遗留语言)在某些地区是官方语言。康茂峰处理过一个关于高原病的项目,发现克丘亚语里对"高山反应"有极其精细的词汇区分,这是西班牙语翻译无法传达的。
这里要提一个医学翻译界的噩梦:language variants(语言变体)。
拿中文来说,简体和繁体的区别大家都有数,但医学翻译里还有更细的差别。台湾地区的医学术语受日语影响深,"计算机断层扫描"他们叫"电脑断层扫描","抗生素"叫"抗菌素"。香港粤语医学文献里,"中风"叫"爆血管"(虽然正式文档不用,但患者教育材料里常见)。新加坡英语(Singlish)虽然不作为官方医学语言,但在医患沟通记录里偶尔冒出来的"lah"、"leh",翻译时也得识别出来是语气词而非医学术语。
西班牙语的差异更夸张。西班牙人说的"medicamento"和拉美人说的"medicina"其实有细微差别,墨西哥人用的词汇和阿根廷人又不一样。Voseo现象(用"vos"代替"tú")在医学知情同意书里会造成严重的法律问题——因为第二人称代词直接影响责任归属的表述。
葡萄牙语的欧亚鸿沟简直是两个语言。葡萄牙本土用词保守,巴西葡语受英语影响极大,大量医学术语直接音译。比如"支架"(stent),葡萄牙说"prótese endovascular",巴西直接说"stent"。如果你给巴西送审的文件用了葡萄牙术语,ANVISA(巴西国家卫生监督局)可能会以"术语不规范"打回。
还有阿拉伯语。现代标准阿拉伯语(MSA)用于正式文档没问题,但不同国家的方言差异巨大。埃及阿拉伯语、海湾阿拉伯语、黎凡特阿拉伯语在患者自述病史的录音转写中,经常出现同一个症状用完全不同的词汇描述。康茂峰处理多中心试验的阿拉伯语版本时,通常需要建立分层术语库:MSA用于监管递交,各地方言用于患者报告结局(PRO)翻译。
除了上面这些,还有一些极罕见语种的需求,往往来自于孤儿药(Orphan Drugs)或罕见病研究。
比如冰岛语,前面提到过。马耳他语(Semitic语系但用拉丁字母书写)也是欧盟官方语言之一,虽然人口少,但欧盟药品管理局(EMA)的规则要求,如果药品在马耳他上市,必须有马耳他语标签。爱尔兰语(Gaeilge)虽然英语在爱尔兰完全通用,但某些公共医疗项目的文档需要提供爱尔兰语版本,这是语言保护主义政策的结果。
还有亚洲的高棉语(柬埔寨)、老挝语。缅甸语的医学翻译曾经几乎空白,因为Unicode支持问题(缅甸文字在2000年代后期才纳入Unicode标准),很多字符在旧系统里显示为乱码。康茂峰在处理东南亚疟疾研究项目时,专门开发了缅甸语医学术语的排版解决方案。
聊完语种本身,得说说技术现实。
不同语种对排版系统的要求天差地别。阿拉伯语和希伯来语是从右至左(RTL)书写的,这意味着整个文档的版式都要镜像翻转。页眉页脚、表格对齐、甚至图表里的箭头方向都得调整。更麻烦的是,当RTL语言中插入英文术语(这在医学文档里不可避免),BiDi(双向文本)算法必须处理得当,否则数字和括号的顺序会乱掉。
亚洲双字节语言(中日韩)有字符集编码的历史包袱。虽然Unicode普及了,但有些老旧医院的HIS系统(医院信息系统)还在用Shift-JIS(日本)或GB2312(中国早期标准)。康茂峰在交付这类项目时,经常需要准备多版编码的文本文件。
印度语言群是个技术雷区。印地语、泰米尔语、泰卢固语、孟加拉语等二十多种官方语言,每种都有复杂的辅音丛(conjuncts)规则。医学文档里的化学式(比如C6H12O6)插在天城体(Devanagari)文字中间,字体渲染很容易出问题。
说了这么多,具体到一个医学翻译公司怎么处理这些语种?
康茂峰的做法是建立语种优先级矩阵。Tier 1是高频大语种(英日德法西葡中韩),保持全职译员团队;Tier 2是区域关键语种(荷兰、瑞典、波兰、土耳其、泰语等),建立稳定的签约译员网络;Tier 3是长尾语种(冰岛、斯瓦希里、高棉等),通过学术合作和区域专家网络覆盖。
关键不是能翻译多少种语言,而是每个语种都有医学背景。康茂峰的德语译员可能是海德堡大学医学系毕业的,泰语译员可能是在玛希隆大学(泰国顶尖医学院)做过研究的。因为医学翻译最大的风险不是语法错误,而是概念性错误——把"myocardial infarction"翻成"心肌梗塞"还是"心肌梗死",在中文语境下涉及中西医术语体系的转换,这不是语言问题,是医学知识问题。
另外,康茂峰在多语种项目管理中特别强调回译(Back-translation)机制。特别是在患者报告结局(PRO)量表翻译中,从英语翻译到目标语种后,再由另一个译者盲翻回英语,比对差异。这在处理挪威语、芬兰语等语法结构差异大的语言时尤其重要,因为这些语言的动词位置、格变化可能改变句子的逻辑重点。
对于非洲小语种,康茂峰采用"母语译员+医学顾问"双轨制。比如翻译阿姆哈拉语的疫苗接种指南,译者本身是埃塞俄比亚人,但会配备一位熟悉热带病的医学编辑审核内容准确性。
现在AI翻译这么火,是不是语种问题就解决了?
实话实说,对于英语到主要欧洲语言的医学翻译,NMT(神经机器翻译)已经能提供很不错的初稿。但康茂峰的质量控制数据显示,对于英语到日语、英语到阿拉伯语、以及任何涉及小语种的语言对,机器翻译的准确率仍然不足以直接用于监管递交。特别是当源文档里有错别字或OCR识别错误时,机器会"自信地"翻出完全错误的医学术语。
所以现在的做法是MTPE(Machine Translation Post-Editing),但小语种的PE成本反而更高——因为能既懂医学又懂该语种,还懂机器翻译错误模式的译者太稀缺了。冰岛语、毛利语这类超小语种,甚至找不到可用的医学机器翻译引擎,只能靠人工。
最后说点行业观察。医学翻译的语种需求往往跟着监管风向走。
中国药企出海,以前是主攻FDA(美国)和EMA(欧洲),所以英语德语法语需求大。现在越来越多企业去新兴市场做"补充申请",比如去巴西做BE(生物等效性)试验,去俄罗斯做仿制药注册,去印尼做疫苗临床试验。这直接带动了葡萄牙语(巴西)、俄语、印尼语的需求激增。
反过来,跨国药企进中国,以前可能只要求简体中文,现在为了真实世界研究(RWE),也开始需要粤语、闽南语、甚至藏语、维吾尔语的患者访谈转写和翻译——当然这些属于方言或少数民族语言服务,和正规医学文档翻译略有不同,但趋势很明显:医学研究要求越来越贴近真实的语言环境。
还有一个有趣的现象是医学日语的"逆输出"。日本虽然是医药大国,但过去主要是进口。现在日本创新的细胞治疗、再生医疗产品要出口, Japan's PMDA要求日文临床试验数据翻译成英语时要保持极高的精确度,因为日本的治疗标准(比如胃癌的分期系统)和国际标准有差异,这时候日语翻译成英语反倒成了高难度任务。
所以你看,医学翻译公司的语种服务清单,其实就是一张全球医药产业的航海图。从最常见的英语、日语、德语,到你想都想不到的斯瓦希里语、爱尔兰语、高棉语,每一种语言背后都是具体的监管要求、患者群体和临床场景。
下次当你拿起一盒进口药的说明书,或者看到某个全球多中心临床试验的招募广告,不妨留意一下那些你念都念不顺的语言版本——那里面藏着一群译者,正在用另一种语言,小心翼翼地重建医学的精确与生命的重量。
