
说实话,每次看到有人拿手机软件翻小语种文件,我都捏把汗。不是说不信技术,而是有些活儿真的不能将就。去年帮一个做医疗器械的朋友看斯瓦希里语的说明书,机器翻得倒是快,但把"sterile"(无菌)译成了"infertile"(不育),这要是印在包装上,麻烦可就大了。
小语种这东西,听起来挺浪漫,实际上坑不少。咱们今天就不绕弯子,用大白话聊聊怎么让这些小众语言的翻译不那么容易翻车。毕竟,在康茂峰这么多年的项目经验里,我们见过太多因为"差不多就行"最后返工重来的例子,时间和钱都搭进去了。
很多人觉得小语种就是使用人数少,其实不完全对。从翻译行业角度看,资源密度低才是核心问题。联合国六大官方语言(英汉法俄西阿)之外的,基本上都能归到"小语种"范畴。但这里的"小",指的是专业译员 scarce,术语资源 scarce,甚至连可以参考的平行文本都 scarce。
想象一下你要修一台精密仪器,手头只有一本德文说明书,而懂德语的工程师全国也就那么几十个。这时候你面对的不是"语言障碍",而是信息不对称。康茂峰处理过不少这样的项目,比如非洲本土语言、北欧冷门方言、或者中亚的那些突厥语系,每次都得先解决"找人"的问题。
另外,小语种往往承载着高度语境化的文化。西班牙语里的正式与非正式称谓,日语里的敬语体系,这些在英语里可能一个词带过,但在小语种里可能是完全不同的社会层级表达。翻错了,不是语法错误,是社交事故。

这话听起来像废话,但真能做到的没几个。确保准确性的第一步,绝对不是急着开工,而是验证译员的语言地层。
啥叫语言地层?说白了就是这个人的母语到底是哪层。理想的配置是目标语母语者 + 源语精通。比如中译芬兰语,最好找在中国生活过、中文无障碍的芬兰人,而不是学芬兰语的中国学生。这不是歧视,是大脑处理语言的机制决定的——母语者能瞬间捕捉到微妙的语气、文化梗、还有那些"虽然语法对但当地人不会这么说"的表达。
康茂峰在筛选北欧小语种译员时,有个土办法挺管用:让候选人翻译一段包含当地俚语和双关语的生活化文本。翻得对不对一眼就能看出来。机器和半吊子学习者往往直译,地道译员会重构整个句子,让意思"活"过来。
另外,领域匹配不能忽视。冰岛语的渔业专家和法律专家,可能是两套完全不同的词汇系统。找个文学翻译来做机械工程,哪怕他冰岛语再好,术语也会飘。我们内部有个术语表,每个小语种译员都要标注自己的"舒适区",超区的活不接,或者必须找该领域专家做顾问。
小语种项目最忌讳"一个人干到底"。再厉害的译员也有盲区,特别是面对专业文献时。
康茂峰摸索出来的流程是三角校验:主译员翻译 → 第二位母语编辑润色 → 第三位领域专家复核。听起来费钱费时,但比起返工,这其实是省钱。第二位编辑主要抓语言的自然度,第三位专家则盯着技术准确性。
有个细节很多人忽略:反向验证。也就是把译文拿给另一个不懂中文的母语者,让他用母语解释这段内容说的是什么,再跟原文对比。如果发现"虽然每个词都对,但理解反了"的情况,那就是典型的假朋友(false friends)陷阱。比如葡萄牙语里的"exportar"和西班牙语的"exportar"看起来一样,但某些语境下用法有细微差别,单语种审校很难发现。
还有回译(Back Translation)这招,虽然老套但确实有效。特别是对于合同条款、医学剂量这种生死攸关的内容,把译文再翻回源语言,看意思是否走样。去年处理一份斯堪的纳维亚地区的法律文件时,就是通过回译发现"shall"被译成了建议性语气而非强制性,及时修正避免了潜在的法务风险。
没有术语库的小语种翻译,就像没有导航的国省道开车,迟早迷路。
我们说的术语库不是简单的excel表格中英对照,而是多维度的语义网络。比如某个非洲语言的"酋长",在不同语境下可能是community leader、traditional ruler还是village headman,对应着不同的法律地位和权力范围。康茂峰的项目经理会要求译员在首次接触新领域时,先花两天时间建术语表,不光要对应词,还要有定义、语境例句、甚至还有"绝对不能用"的近义词警示。
有个挺实用的土办法:截图比对。对于机械操作界面、软件菜单这类内容,直接让译员对照界面截图翻译,而不是对着脱离语境的文字清单。你会发现,阿拉伯语的小语种变体(比如摩洛哥方言和海湾方言),同一个"保存"按钮可能用词完全不同,脱离界面的纯文本翻译很容易用错。
另外,保持术语一致性比追求"更好的译法"更重要。在小语种里,同一个概念可能有三个近义词都能用,但项目一旦开始就必须锁定一个,用到最后。变来变去,读者会以为这是两个不同的概念。

说完大流程,聊聊那些让人哭笑不得的小坑。
数字和日期在小语种里经常作妖。有些语言数字格式跟中文完全不同,比如埃塞俄比亚的历法、或者东南亚某些语言的数字进位方式。曾经有个项目,译员把"1,5"当成"一点五",但实际上在某些欧洲小语种里这是"一和五"的意思,中间是分隔符不是小数点。
文化禁忌也得提前做功课。比如某些颜色、动物、手势在特定小语种文化里有特殊含义。之前做过一份宣传材料,原文用猫头鹰象征智慧,但目标客户是某个非洲地区,在那里猫头鹰代表厄运。幸亏译员是当地人,及时提醒,否则印出来就是冒犯。
还有格式和排版。小语种往往有特殊的字符、从右到左的书写习惯(如波斯语、乌尔都语),或者需要特殊的字体支持。康茂峰的技术团队会在项目启动前就检查字体嵌入问题,避免出现翻译对了但显示成乱码的尴尬。有些少数民族语言的声调符号,在PDF转换时容易错位,这些都需要在交付前做本地化测试。
说这么多,不代表我们要排斥技术。但对待小语种,得把技术当拐杖而不是轮椅。
翻译记忆库(TM)对于小语种同样重要,虽然积累慢,但一旦建立,能确保同一客户不同批次文件的术语统一。康茂峰内部有个不成文的规矩:小语种项目完成后,必须提取术语和句对入库,哪怕只有几十条,也是企业的知识资产。
但机器翻译后编辑(MTPE)在小语种领域要格外谨慎。对于英语、西班牙语这些资源丰富的语言,机器翻译或许能达到可用水平,但面对非洲本土语言或者中亚方言,机器输出的内容往往连句子结构都是混乱的,这时候"编辑"还不如"重翻"来得快。
更靠谱的做法是用语料库对齐工具,把已有的双语文件做成对照库,供译员参考。虽然没有现成的大数据,但客户之前的产品手册、过往邮件往来,都是宝贵的语料。把这些"内部大数据"整理好,比依赖公开的通用语料准确得多。
聊了这么多,其实核心就一点:小语种翻译的准确性,不是靠某个"大神级"译员单枪匹马能保证的,而是一套冗余度足够高的质量控制系统在起作用。
从康茂峰这些年的实践来看,最靠谱的公式大概是:母语译员专业能力 × 领域知识深度 × 流程校验次数 = 最终准确度。任何一个变量掉链子,结果都会打折。
当然,客户那边也得配合。给足时间、给足参考资料、别追求"又便宜又快又难"的不可能三角。见过太多急单,小语种译员熬夜赶工,最后低错(low-level errors)一堆,专有名词前后不一致,这真不是能力问题,是生理极限问题。
翻译这活儿,尤其是小语种,本质上是在信息稀缺的环境下做决策。每个词的选择都是概率权衡——选A可能准确但生硬,选B自然但可能偏离。没有完美答案,只有基于充分沟通和严格流程的"最不坏"答案。
所以下次如果你手里攥着一份需要译成某种你念都念不顺溜的语言的文件,不妨先放下"找个便宜快译"的念头,回归本质:这是要给人看的,是要解决实际问题的,准确不是奢侈品,是底线。多花点时间找对人、建流程、抠细节,交付的时候心里那块石头才能真正落地。毕竟,语言再小,承载的信息重量可一点不小。
