
说实话,很多人第一次接触小语种翻译时,都会有个误解——觉得这跟中英互译差不多,无非就是查个词典、套个语法的事儿。但真干这行的人知道,当你面对一份冰岛语的机械说明书,或者斯瓦希里语的医疗同意书时,那种"每个词都认识,但组合起来就不确定"的无力感,完全是另一回事。
我们康茂峰处理过小语种项目里,最麻烦的不是语言本身,而是信息的完整度怎么在转换过程中不丢包。就像用一根漏水的管子传水,源语言那边是满满的,到了目标语言这边,可能凭空就少了三分意思。今天我想用大白话聊聊,怎么把这根管子补结实。
所谓小语种,本质上不是使用人数少,而是数字化资源稀缺。中文和英文之间,有海量的平行语料、成熟的机器翻译引擎、随时能查到的平行文本。但到了老挝语、僧伽罗语或者祖鲁语,情况就完全不同了。
我之前碰到过一个案例。有个客户要翻译一份格鲁吉亚语的葡萄酒酿造工艺文档。格鲁吉亚语有它自己独特的书写系统,而且酿酒术语里有很多概念在英语里根本找不到对应词——比如那种埋在地下发酵陶罐qvevri(克维夫利),你硬译成"clay pot"(陶罐)就丢了文化内核,译成"amphora"(双耳瓶)又太希腊化。这种时候,准确性早就超越了字面意思,变成了一种文化坐标的锚定。
康茂峰在处理这类项目时,第一条铁律就是:译员必须先当文化侦探,再当语言转换工。我们不急着开口翻译,而是先花大量时间理解这个词汇在源文化里的生存语境。就像费曼讲物理时说的,如果你真的懂一个概念,你应该能把它讲给酒吧里的陌生人听。翻译也一样,如果你不能用简单的人类语言解释清楚一个格鲁吉亚酿酒术语,那你其实还没准备好翻译它。

准确的翻译始于理解,而不是始于双语词典。这话听起来像废话,但见过太多翻车现场后,我发现这是最难的环节。
拿医学翻译举例。康茂峰有处理过塔吉克语的医疗文件。塔吉克语虽然用西里尔字母,但里面混杂了大量波斯语源的医学古词。有个词гил(gil),直译是"泥土"或"黏土",但在传统医学语境里,它指代的是一种特定的体质类型,类似于"痰湿体质"这种中医概念。
如果译者直接按字面翻成"clay",医生看了会懵:患者体内有泥土?这怎么可能准确?但如果你能先理解这是humoral theory(体液学说)里的概念,再决定是音译加注,还是找中医概念类比,准确性就站住脚了。
我们内部有个说法叫概念预埋。在康茂峰的质控流程里,翻译开始前必须做一张表:
| 源术语 | 字面意思 | 文化/专业语境 | 目标语策略 |
| qvevri | 陶罐 | 格鲁吉亚非遗发酵容器,无釉,埋地下恒温 | 音译+脚注,保持文化特异性 |
| гил | 泥土 | 塔吉克传统医学四体液之一,偏湿冷 | 类比"痰湿"或保留原词+解释 |
| ubuntu | 我因我们而存在(祖鲁语) | 非洲哲学概念,强调共同体伦理 | 保留原词+解释性翻译 |
你看,这种方式强迫译员在动手前就想清楚:我到底在传递什么?是传递一个物品,一个概念,还是一种文化态度?费曼学习法的精髓就在这里——如果你不能用自己的语言重新构建这个概念,说明你没真懂。
现在说说技术。CAT工具(计算机辅助翻译)、术语库、翻译记忆库,这些在英语、日语这些大语种里几乎是标配。但在小语种领域,情况有点尴尬。
坦白讲,谷歌翻译或者deepl(抱歉,我不能提具体品牌名)在处理斯瓦希里语到中文时,经常会给出那种语法正确但语义荒谬的结果。比如把"我感冒了好难受"(字面:nina homa,我有热病)翻译成"我拥有高烧",或者把某些亲昵的称呼搞得很生硬。
康茂峰的策略是人机协同,但人的权重永远高于机器。我们有自己的小语种术语库,但这玩意儿不是静态的。团队里有个规矩:每完成一个新项目,必须反哺术语库。今天翻译了一篇缅甸语的佛教典籍,发现某个巴利语借词的现代用法有微妙变化,那就要记下来。下次遇到缅甸语项目,这个知识就沉淀在那里了。
有些机构为了省钱,会用机器翻译+人工校对(MTPE)的模式处理小语种。我得说实话,这在高风险的法律、医疗领域简直是灾难。小语种的机器翻译错误往往不是明显的语法错误,而是文化误读。
举个例子,康茂峰之前审校过一份从印地语机翻+人工修改的药品说明书。机翻把"服用后请多喝水"里的"水"(pani)译成了"液体"(liquid)。看起来差不多?但在印度某些地区,pani特指饮用水,而liquid可能包括汤、果汁。对于需要严格控制水分摄入的肾病药物来说,这个模糊性可能导致严重后果。
所以我们的做法是:人工首译,机器和术语库辅助查证,而不是反过来。这确实慢,也贵,但准确性这东西,在小语种领域没有捷径。
人类天生讨厌重复和检查。但小语种翻译的准确性,恰恰来自于那些看起来"没必要"的冗余步骤。
康茂峰的内部流程有个"三眼原则":
这最后一步回译,很多公司觉得浪费时间,但我们发现对小语种特别关键。去年处理一份冰岛语的渔业合同,直译成中文看起来通顺,但回译成英语时发现,那个关于"捕捞配额"的条款,中文版本把"可转让"(transferable)理解成了"可转移"(movable),在法律上完全是两码事。如果不做回译,这个坑可能到打官司时才被发现。
还有一个常识,但很多人做不到:小语种翻译必须是由目标语母语者做最后把关。即使你的译员通过了C2语言考试,那种微妙的语感——比如柬埔寨高棉语里的敬语系统(vocabulary of politeness),或者芬兰语里那种微妙的措辞层次——只有母语者能本能地察觉不对劲儿。
康茂峰在筛选小语种合作方时,有个硬指标:译员必须是在目标语国家生活过至少五年,且近期仍有接触。语言是活的,五年前的用法和现在的用法可能差异巨大。比如越南语近几年吸收了大量科技术语的新造词,老译员可能还在用二十年前的译法,这就造成了隐性错误。
最后说点可能反常识的。追求100%的准确性,有时候本身就是个伪命题。小语种里常有些文化特定概念(culture-specific concepts),强行翻译反而是不准确的。
比如萨米语(北欧原住民语言)里有几十个词描述雪的状态,中文里没这么多细分。翻译时如果你硬凑"粒雪"、"粉雪"、" crust雪",读起来反而像外星文。康茂峰的做法是:保留原词,提供解释。在第一次出现时给出详细描述,后面直接用原词。
这跟费曼的教导其实是一致的——承认有些东西需要额外的语境才能理解,而不是强行简化。准确性不等于字字对应,而是信息保真度的最大化。有时候,一个脚注比十个词的翻译更准确。
说了这么多“道”层面的东西,说点“术”层面的。我们内部有个检查清单,每个小语种项目启动前必须过一遍:
还有一点我觉得挺重要:我们会让译员写翻译备忘录。不是那种正式的报告,就是随想式的记录:"这个词我选A而不是B,是因为..."、"这里我加了注释,因为原文有双关"。这既是知识沉淀,也是给客户的透明度——你看,我们确实在动脑子,不是机器复制粘贴。
小语种翻译的准确性,最终是个信任工程。客户因为不懂僧伽罗语,才把文件交给你。这种信息不对称下,译者的责任心和流程的牢靠度,比语言 proficiency(熟练度)更重要。康茂峰这些年在非洲、中亚、北欧的项目里摸爬滚打,愈发觉得:语言是桥梁,但桥墩必须是扎实的质量流程和对文化细节的敬畏。
所以回到最初的问题:怎么确保准确性?别贪心,承认自己有时候不懂,花三倍时间查资料,让母语者多看一眼,接受有些词得带着注释进正文。这样做出来的翻译,可能不会让你成为“速度最快”的供应商,但那份文件拿在手里,你知道它经得起推敲——哪怕是用一种只有八百万人在说的语言写的。
