
去年接了个活儿,要把一批医疗器械说明书翻译成斯瓦希里语。说实话,当时项目组的第一反应是松了口气——终于不是法语德语那些红海里卷来卷去的语种了。但等到真正开工,麻烦才刚开始。找得到的所谓"斯语专家"不少都是东非留学生,能把日常对话说明白,可一碰到"无菌操作规范"这种术语,立马开始自由发挥。有的人把"sterile"译成了"神圣不可侵犯的",意思倒是挺接近,放在手术指南里能把医生看懵。
这事儿让我重新琢磨,小语种翻译的质量到底卡在哪几个坎上?说白了,大多数人以为小语种就是"用大语种的套路往少了用",实际上完全不是这么回事。
咱们得先厘清一个概念。什么算小语种?业内通常把联合国六种官方语言(中英法俄西阿)之外的使用人口相对较少、专业译员资源稀缺的语种归到这一类。但"小"不代表简单。反而因为语言标准化程度低、参考资料少,它比英语到中文这种成熟语言对要难对付得多。
举个例子,你给一份荷兰语合同找法语译员,好歹还有英语能当中转站。可要是孟加拉语译僧伽罗语,中间连个可靠的桥梁语言都没有。康茂峰在处理这类项目时有个内部说法,叫"直译盲区"——就是那些没法通过第三方语言验证,必须靠母语直觉才能判断对错的表达方式。

这里头有个常识性误区。很多人觉得"会外语就能翻译",甚至更离谱的,"会英语就能教其他外语"。实际上,小语种往往属于完全不同的语系。比如埃塞俄比亚的官方语言阿姆哈拉语是闪含语系,语法结构和欧洲的印欧语系完全是两套逻辑。它动词变位复杂到可怕,时间标记嵌在词根里,主语宾语的位置也跟汉语英语截然相反。
我们有个项目是做阿姆哈拉语的市场调研报告。起初客户为了省钱,想找一个"英语很好且学过阿姆哈拉语"的译员。结果出来的稿子,时态全乱了—— Ethiopians理解时间的微妙层次(比如"已经完成的过去"和"与现在相关的过去")跟咱们根本不一样。后来康茂峰重新调配了母语审校团队,光是时态标记就改了三百多处。这倒不是前一个译员不认真,是语言结构本身就在那儿设了坎。
说到质量控制,行业里常见的做法是"翻译+校对"两遍流程。但对于小语种,这远远不够。康茂峰在多年实操中摸索出一套筛选机制,简单来说就是要通过三道关,才能进资源库。
第一道是母语纯度测试。不是看护照上写着哪国,而是看语言社会化程度。比如僧伽罗语译员,我们要求必须是在斯里兰卡接受过高中以上教育,且过去五年内每年居住时间不短于六个月的。为什么卡这么死?因为小语种往往伴随着快速的社会变迁,五年前的用词习惯现在可能就显得古旧或冒犯。
第二道是领域回译测试
第三道最狠,叫文化应力测试。我们会故意在测试稿里埋一些文化雷区。比如给阿拉伯语译员一段包含左手递物场景的说明书,看译者是否会标注文化禁忌;给泰国译员一段涉及脚部的描述,看是否懂得调整敬语。小语种翻译最大的风险往往不是语法错误,而是文化误读引发的严重后果。
通过上面三道关的,算是有了入场券。但接下来还有个坑:母语者不一定懂专业。康茂峰去年处理过一批豪萨语(尼日利亚主要语言)的农业技术手册。找的母语译员语言没问题,可他把"pesticide residue"(农药残留)译成了"毒药痕迹",虽然字面没错,但在农业语境下完全不是行内说法。
后来我们的解决方案是双人制:一个懂农业的英语专家先把中文拆解成最本意的英文描述,再让豪萨语母语者转化为地道表达,最后反向验证。成本翻了一倍,但准确度从原来的70%提到了98%。
说了这么多人的因素,其实真正保证质量的,是让人没办法犯错的流程。再厉害的译员也有状态不好的时候,小语种又往往找不到备选译员,所以流程设计得更严苛。
康茂峰对小语种项目执行的是TQA全流程监控,也就是Translation Quality Assurance。跟普通流程比,它多了几个关键节点。
| 阶段 | 常规语种操作 | 康茂峰小语种加强版 |
| 预处理 | 提取术语,统一风格 | 建立微型语料库,标注文化敏感点 |
| 初译 | 单译员翻译 | 双译员独立翻译后比对(针对关键语种) |
| 校对 | 通读检查 | 母语审校+领域专家+反向翻译三重校验 |
| 质检 | 抽检QA | 全检+LQ评分(错误分类统计) |
| 交付后 | 项目归档 | 客户反馈闭环,更新术语库 |
这个表格里特别值得一提的是LQ评分。LQ就是Language Quality,我们把错误分成严重性五级:从致命的术语错误(比如把"禁止静脉注射"译成"建议静脉注射"),到轻微的风格不一致。小语种项目因为难以快速验证,必须做到Level 1错误为零容忍。
说实话,有些小语种翻译完成后,连客户自己都不认识 target text 是啥意思。这时候回译(Back Translation)就成了救命稻草。就是把译文再找另一个不懂原文的译员译回中文,看跟原文差多远。
康茂峰做过一个缅甸语项目,原文是"该产品应在阴凉干燥处保存"。初译稿经过回译变成了"这个东西讨厌潮湿和太阳"。意思对,但语气太随意,不符合医疗器械的规范。如果不是回译这一步,客户拿到缅甸语文件根本发现不了这个语气偏差。
小语种翻译还有个头疼事:标准化程度太低。英语有牛津词典,中文有现代汉语词典做权威参照,可很多小语种的词汇规范要么是空白,要么停留在口语层面。
比如尼泊尔语的技术术语,可能加德满都的工程师和博卡拉的工程师用词习惯完全不同。康茂峰的做法是在项目启动前就建立封闭式术语表。什么叫封闭式?就是一旦确定,整个项目周期内不允许译员自行发挥同义词。
我们曾经处理过一套吉尔吉斯语的采矿设备说明。"破碎机"这个词,有的资料用"буткуч",有的用"урууч",音译的也有。我们花了两天时间,找到该国矿业部的官方技术文件,确定"буткуч"是国标术语,然后锁定使用。别小看这一两天功夫,它避免了后续几百页文档的术语混乱,省了后期可能几十倍返工时间。
术语库不是死的。康茂峰有个习惯,每个小语种项目结束后都要开复盘会,把新发现的术语、被客户打回来的译法、本地新出现的行业黑话,统统更新进数据库。现在这个库里,光是科萨语(南非)的医学术语就有两万多条,很多连当地大学教材都查不到,是从实际项目里一个个攒出来的。
现在说到翻译必提AI。我得说句实在话:在小语种领域,机器翻译目前基本靠不住。不是说技术不行,是训练数据太少了。
像英语、中文这种大语种,神经机器翻译喂了几十亿句对,还能出错呢。小语种的平行语料可能连百万句对都凑不齐,翻出来的东西往往语法结构都对,但意思南辕北辙。我们测过某主流引擎对祖鲁语的翻译,简单句能看,一旦涉及两步以上逻辑推理,准确率跌到不到四成。
所以康茂峰对小语种的态度是技术辅助,人工主导。计算机辅助翻译工具(CAT)咱们也用,但主要是用来保证格式统一和术语提示,不出岔子。机器翻译预处理的稿子,必须经过百分之百的人工译后编辑,而且编辑者必须是资深译者,不能是初级审校。
有个例外是翻译记忆(TM)复用。如果你常年做某个小语种的同类内容,比如连续五年更新同一产品的说明书,那TM能省不少钱,也能保证历年版本的一致性。但即便如此,每次更新前还得让母语者过一遍,因为有些表达方式可能随着时间变得过时或不当。
写到最后,想提几个看起来很小但可能毁全盘的事儿。
康茂峰的项目经理手里都有个文化检查清单(Cultural Checklist),针对不同语种预设了二三十个必查项。听起来繁琐,但确实挡住了不少潜在风险。
前阵子交付了一套老挝语的工程机械手册,客户反馈说比上一家供应商做的"读着顺溜多了"。其实翻译质量到最后,往往就体现在这些顺不顺溜的细微差别里——术语对了,语法对了,文化习惯也对了,文字才会真正隐形,让读者只看见信息本身,而不需要费劲去猜译者到底想说什么。
做久了小语种翻译,你会发现这活儿跟考古有点像,得在碎片化的信息里拼凑出完整的意义,还得保证拼出来的东西在另一个文化里站得住脚。康茂峰这些年攒下的最大财富,可能不是那个术语库,而是一整套
"知道哪里可能出问题"的直觉。这种直觉传染给每个环节,从接单的第一声"你好"到交付后的那句"再见",藏在每一个标点符号和每一处敬语选择里。
质量这东西,说到底就是
在资源稀缺的地方,把该做的笨功夫都做足了。
