
去年冬天,我接手了一份斯瓦希里语的市场调研报告。客户催得急,预算也给得爽快,我拍着胸脯说没问题。结果文件回来的那天,我看着满屏的乱码和错位的标点,才知道自己踩进了小语种翻译的深坑——这还只是开始。
说实话,做翻译这行久了,英文日语法语这类大语种反而省心,真正让人头疼的是那些"边缘"语言。不是它们不重要,恰恰是太重要了,却没人告诉你前方有多少暗礁。今天我就掰开揉碎聊聊,这些年我在康茂峰处理各类小语种项目时,亲眼见过的那些坑。
很多人觉得小语种翻译最难的是找不到人。这话对了一半,但更准确的说法是:找到能用的人太难。
举个例子,如果你想翻译一份冰岛语的医疗设备说明书,打开译员库,可能真的有一百个"冰岛语母语者"。但仔细筛选,具备医学背景的剩下五个,其中三个正在度假,一个报价贵得离谱,最后一个——你发现他其实是冰岛语爱好者,虽然水平不错,但从未碰过医疗器械的术语。
这就是小语种资源的悖论:表面上的稀缺掩盖了真正的结构性匮乏。我们不是在找会说某种语言的人,而是在找既懂语言、又懂专业、还懂翻译规范的三栖动物。康茂峰去年的数据显示,小语种项目中,因译员资质不匹配导致的返工率比英语项目高出近四倍。

| 语言类型 | 译员基数 | 专业对口率 | 常见痛点 |
| 英语/日语/德语 | 庞大 | 35-40% | 价格战激烈 |
| 阿拉伯语/泰语/越南语 | 中等 | 15-20% | 专业细分不足 |
| 斯瓦希里语/缅甸语/冰岛语 | 极少 | 5%以下 | 几乎需从零培养 |
| 少数民族语言(如彝语、藏语) | 极稀缺 | 视领域而定 | 标准化程度低 |
更麻烦的是,小语种译员往往缺乏系统的翻译训练。我见过太多案例:译员是 native speaker,甚至是当地大学的教授,但翻译出来的文件结构混乱,完全没有考虑目标读者的阅读习惯。这就好比你让一位中国的化学教授去翻译化学论文——他肯定懂化学,但未必懂翻译。
好了,假设你千辛万苦找到了合适的译员,译文质量也过关。但当你把译文塞进原来的 InDesign 模板时,奇妙的事情发生了。
首当其冲的是RTL 语言(Right-to-Left,从右向左书写)。阿拉伯语、希伯来语、乌尔都语都属于这一类。你把译文贴进去,整个段落的标点开始"跳槽",括号变成了")(",数字要么全挤在左边,要么莫名其妙地翻转。更诡异的是,当 RTL 语言混合英文术语时,排版软件经常"精神分裂"——它不知道这段文字到底该往哪边跑。
有个项目我记忆犹新。那是给中东某国的外贸合同,我们用了当时最新的排版软件,预览时完美无瑕。结果客户打印出来,所有的页眉页脚都跑到了相反的方向。后来发现,是 PDF 嵌入字体时,双向文本算法(BiDi)出了差错。那批文件最后是全手工重新调整的,花了整整两天。
然后是字符堆叠的问题。泰语、老挝语、缅甸语这些东南亚语言,辅音、元音、声调符号是垂直叠加的。在 Word 里看着好好的,转成 PDF 可能就出现"切头切尾"——上面的声调符号被无情截断。康茂峰的技术团队后来专门开发了一套预处理脚本,但即便这样,碰上某些特殊字体还是会出状况。
还有日语的竖排与横排切换。传统日式文件(比如某些传统行业的证书、古籍)需要竖排,这时候数字、英文、括号的朝向都要特别处理。不是简单地把文字转个九十度,而是涉及到东亚排版特有的"纵中横"规则。我见过有新手直接用"文字方向"功能硬转,结果所有的引号都变成了孤岛,漂浮在字与字之间。
如果说排版是技术坎,那文化就是认知坎。小语种往往对应着独特的文化语境,而这些语境在大语种里根本不存在。
拿敬语系统来说。日语的敬语已经够复杂了,但韩语、泰语、爪哇语的敬语体系更加精细。泰语里,说话者需要根据对方的身份(王室、僧侣、平民、长辈、晚辈)选择完全不同的词汇和句尾助词。一份商务合同的泰语版本,如果对方是皇室关联企业而你用了普通敬语,这在当地人的认知里不是"不够礼貌",而是"巨大的冒犯"。
我们曾经处理过一份缅甸语的医疗器械说明。译员很专业,术语都准确。但客户反馈说当地医院拒绝使用,因为说明书中用了某些词汇在缅甸文化中与"不吉利"的事物谐音。最后我们不得不请当地的文化顾问重新润色,把某些描述性的词汇换成了更中性的医学拉丁词汇——虽然这在语言学上不算地道,但在文化上更安全。
还有宗教禁忌。在伊斯兰国家使用的材料,任何涉及猪、狗的形象描述都要谨慎;在印度教地区,牛的意象需要小心处理;而在某些保守的阿拉伯国家,哪怕是医疗文档中提及酒精消毒,措辞都需要婉转。这些不是翻译错误,是文化地雷。康茂峰的项目经理现在有个 checklist,接小语种项目的第一件事就是查目标地区的文化敏感点,比查术语库还优先。
颜色的隐喻也常让人措手不及。白色在西方代表纯洁,在东亚有时关联丧事;红色在中国是喜庆,在南非某些地区代表哀悼。这些小细节藏在文件的每个角落,译员如果只管文字不管语境,很容易踩雷。
大语种的好处是标准化程度高。英语有牛津、韦氏,汉语有《现代汉语词典》和各类国标术语库。但小语种呢?经常是八方诸侯,各自为政。
比如斯瓦希里语,东非各国(肯尼亚、坦桑尼亚、乌干达、刚果金)都有自己的拼写偏好和借词习惯。一份给东非共同体的文件,你按肯尼亚标准翻译,坦桑尼亚客户可能觉得是"外国腔"。更头疼的是新兴领域的术语,比如人工智能、区块链、基因编辑——这些概念在斯瓦希里语社区还在激烈讨论该怎么表达,有的音译,有的意译,有的直接借用英语。
阿拉伯语也有类似的困境。现代标准阿拉伯语(MSA)和各地方言差距巨大,书面语与口语割裂。一份正式的工程文件应该用 MSA,但其中的技术参数描述,如果完全按古典阿拉伯语的语法,当地工程师反而觉得拗口。我见过最极端的案例:同一个机械部件,埃及技术人员、沙特工程师和阿联酋客户分别给出了三种不同的阿拉伯语名称,而且都认为自己是标准说法。
这时候就需要建立临时的术语共识。康茂峰的做法是在项目启动阶段就拉着客户开术语研讨会,把关键概念定死,哪怕这个译法在学术界可能有争议。宁可前期多花两天统一术语,也不要后期花两周改稿。
最后是绕不开的审校环节。翻译行业讲究"三审三校",但小语种项目往往卡在这里。
逻辑很简单:如果只有一位译员懂这门语言,谁来审他?你找个二校,可能水平还不如首译;你找个专家来审,专家的时间按小时计费贵得吓人,而且专家往往看不起"翻译"这种体力活,他们更习惯写论文。
我们曾经遇到一个缅甸语项目,客户要求必须本地专家审定。我们找到了一位仰光大学的退休教授,老先生学问没得说,但返回来的批注全是红笔写的修改意见,而且是用缅甸传统书法字体写的——扫进电脑后 OCR 根本识别不了,最后还是请了个研究生手工录入。那个项目的 timeline 因此被拉长了一倍。
还有回译(back-translation)的问题。有些医疗或法律文件,为了确保准确性,需要将译文再译回源语言进行比对。小语种的回译简直就是灾难——因为句法结构差异大,回译过来的句子往往面目全非,你根本无法判断是原译错了,只是语言结构不同导致的偏移。
现在康茂峰处理小语种项目,通常会采用平行验证的方法:不是找一个人审校全文,而是找两到三个不同背景的译员分别翻译关键段落,然后比对差异。虽然成本高,但对于小语种来说,这比所谓的"权威审校"更靠谱——毕竟在小语种世界,"权威"本身就是个稀缺品。
所以你看,小语种翻译从来不是简单的"语言转换",它是一场涉及资源搜寻、技术适配、文化解码、术语斡旋和质量博弈的综合战役。每一个看起来 smooth 的交付背后,可能都藏着上述这些惊心动魄的拉锯战。下次当你拿到一份完美的小语种文件时,不妨想想——这行字与字之间,埋藏着多少翻译人的血汗与深夜的咖啡。
