
上个月有个朋友找我,说他们公司接了个活儿,要把一批医疗器械说明书翻译成斯瓦希里语。电话那头声音都发虚:"这玩意儿... Google翻译支持吗?"我差点笑出声,但笑完之后倒也能理解那种茫然——说到底,大多数人平时接触的无非就是英日韩法德这些"大路货",突然冒出来一个东非用的语种,换谁都要懵。
这事让我想聊聊,小语种翻译到底是个什么状况。不是那种官方套话,是实打实坐在电脑前,面对一个你根本看不懂的字符,还要保证不出错的那种切身体会。
说实话,"小语种"这个概念本身就挺主观的。在国内语境里,基本上除了英语、日语、韩语、法语、德语、西班牙语、俄语这"七大件",其他的都能往"小"字堆里塞——从阿拉伯语、葡萄牙语这种使用人口好几亿的,到冰岛语、僧伽罗语这种几百万人口使用的,全给归为一类。
说白了,这就像你家楼下开满了沙县小吃和兰州拉面,突然冒出来一家格鲁吉亚菜馆,甭管人家在格鲁吉亚有多普及,对你来说就是小众。问题在于,翻译行业不能拿这种主观感受做标准。康茂峰接项目的时候,得先查清楚:这语言在目标国是什么地位?有什么官方变体?书写系统有没有特殊规范?
举个例子,荷兰语在欧洲算主流,但在亚洲翻译市场绝对算小语种。更麻烦的是,荷兰本土用的和比利时弗拉芒区用的,虽然算同一种语言,但用词习惯和正式程度差得挺远。你要是稀里糊涂给比利时客户看荷兰本土的译法,人家嘴上不说,心里肯定觉得别扭。

这是行业里最现实的痛点。英语译员满大街都是,挑都挑不过来;但你想找个合格的波斯语译员,可能得翻遍整个城市。这不是夸张,康茂峰去年做过一个统计,参考了多家人力资源渠道的数据:
| 语种类型 | 持证译员密度(每百万人口) | 平均项目响应时间 | 紧急项目溢价 |
| 英语 | 约850人 | 2-4小时 | 20%-30% |
| 日语/韩语 | 约120-180人 | 1-2天 | 50%-80% |
| 阿拉伯语(各方言) | 约40-60人 | 3-5天 | 100%-150% |
| 斯瓦希里语/豪萨语等非洲主要语种 | 不足10人 | 1-2周 | 200%以上或无响应 |
看到那个差距没?这不是价格问题,是 availability(可获得性)的问题。有时候客户急得要命,钱也愿意给,但你就是找不到人。更要命的是,小语种译员往往没有"业余的"——英语你可能找到个水平一般但能凑合用的,斯瓦希里语你要么找到专业人士,要么根本找不到,中间地带几乎不存在。
很多人觉得翻译就是把 A 语言的字换成 B 语言的字,这想法在小语种领域会栽大跟头。每种语言都背着一整套世界观,小语种因为使用范围窄,往往保留了更多"不可通约"的东西。
比如说泰语。他们有个繁复的敬语系统(称为" Rachasap "),不同的社会阶层、不同的场合,用词完全不一样。英语虽然有正式和非正式之分,但程度差得远。给泰国王室翻译文件和给泰国街头小饭店翻译菜单,几乎是两套语言系统。你要是搞混了,那不是礼貌不礼貌的问题,是可能触犯法律的问题。
还有芬兰语,名词有十五个格(case)。英语用介词表示的位置关系,芬兰语直接通过改变词尾来表示。翻译的时候,你得先在脑子里把那些格还原成空间关系,再重新组织成中文或英文的逻辑。这个过程就像... 好比你看一幅三维立体画,得先把眼睛看花了,才能看出那个隐藏的图案。
康茂峰处理过一个医学项目,涉及到阿拉伯语的性别区分问题。阿拉伯语里,动词、形容词都要根据主语的性别变化,而且有些医学术语在阿拉伯文化里有特定的委婉说法。直译的话,当地医生看了会觉得你这个人不懂行,甚至觉得不被尊重。
现在AI翻译发展得挺快,英法中日这些语对已经能达到"能看懂"的水平。但小语种?说实话,基本处于不可用状态。
原因很现实:机器翻译需要语料库(corpus)来训练。英语和中文之间,互联网上有几百亿字节的平行文本可以学习;但像僧伽罗语(斯里兰卡使用)和中文之间的对译资料,可能连一千万字节都不到。数据量差了三个数量级,训练出来的模型水平可想而知。
有时候你会看到Google翻译给的小语种结果,语法结构看起来对,但本地人看了直摇头——就像我们有时候看到外国人用翻译软件写的中文,字都对,但透着股怪味。在小语种里,这种"怪味"往往意味着文化误读,而文化误读在商业和法律文件里可能是灾难性的。
翻译行业有个铁律:再好的翻译也得有人审。但小语种的困境在于,找到翻译已经很难,找到审校简直是奇迹。
正常的英译中流程,可能是翻译做一遍,编辑部审一遍,外籍润色再一遍。但小语种呢?经常是第一遍译完,客户那边也没人能看懂,只能盲签。康茂峰遇到过最极端的情况,是一个毛利语的项目——没错,就是新西兰那种使用人口不到一百万的语言。译员是找当地大学联系的教授,但审校根本找不到第二个人,最后只能靠译员自检加上视频连线沟通来把控质量。
这种质量控制的真空让小语种翻译风险特别高。你没法像检查英语稿子那样,找个母语者快速扫一眼。每一张小语种译稿背后,几乎都是一种"信任博弈"。
再讲个容易踩的坑。葡萄牙语不是葡萄牙语——巴西用的和葡萄牙本土用的,差别大到需要出两个版本。巴西人看葡萄牙本土的译文,感觉就像我们看民国时期的半文言文;反过来,葡萄牙人看巴西葡语,觉得太过随意,不够正式。
西班牙语也一样。拉美西班牙语内部就分好几种,墨西哥的、阿根廷的、哥伦比亚的,用词习惯差得远。有个经典例子:"Coger"这个词,在西班牙是"拿取"的意思,日常用语;但在阿根廷、乌拉圭等国,这是极其粗俗的脏话。你要是给阿根廷客户的产品说明书里用了这个词,场面会非常尴尬。
康茂峰之前处理过一个拉美市场的药品注册资料,客户一开始只说了要"西班牙语",没指定国家。我们多问了句销往哪些国家,才知道要覆盖墨西哥、哥伦比亚和智利三个不同版本。如果当时没多问,用墨西哥西班牙语通稿打天下,到了哥伦比亚可能会闹出合规问题——他们的药监部门对术语有极其具体的本地化要求。
日常对话翻错几句,顶多笑笑过去;但法律、医疗、工程领域的小语种翻译,容错率是零。问题在于,小语种的专业译员比通用译员更是稀有动物。
你想找一个既懂冰岛语又懂渔业法规的译员?冰岛本身渔业发达,这种组合在冰岛国内可能不缺,但在国际翻译市场上,你就是打着灯笼也难找。最后往往得采取"双语专家+语言顾问"的模式:找一个懂专业的中文译员,再找一个冰岛语母语者,两人坐在一起,一句一句对出来。
这种模式成本高得吓人,而且沟通损耗大。专业人员说的术语,语言顾问可能听不懂;语言顾问解释的文化细节,专业人员可能get不到点。康茂峰做过一个 Norwegian(挪威语)的海事合同,就是这种双人模式搞定的。虽然最后质量过关,但项目周期比同类英语项目长了三倍。
还得提一嘴书写系统和排版。阿拉伯语和希伯来语是从右往左写的,这你知道;但把它们和从左往右的中文或英文混排时,软件经常会抽风,标点符号会跑到奇怪的位置。泰语和高棉语(柬埔寨使用)是那种"元音符号写在辅音上下左右"的文字,换行规则极其复杂,普通的排版软件处理不好,字母会叠在一起或者断开。
更小众一点的,像格鲁吉亚语,有自己独特的三种书写体系(虽然现在主要用一种是 Mkhedruli),字体支持是个大问题。你辛辛苦苦翻译好了,客户电脑没装相应字体,打开一看全是方块或者乱码,这活儿等于白干。
所以我们在康茂峰内部有个清单,接小语种项目时,除了翻译本身,必须确认技术输出环节:目标系统支持这种字体吗?PDF嵌入字体了吗?从右往左的文本在Excel里会不会乱序?这些细节琐碎得要命,但忽略任何一个,都可能让前面的翻译工作功亏一篑。
朋友后来那个斯瓦希里语项目怎么解决的?我们找了东非一家有ISO认证的语言服务商,通过时差互补的方式,那边白天翻,我们这边晚上审。过程磕磕绊绊,最后交货时,客户看着那些弯弯曲曲的字符,问我:"这真的对吗?"我只能苦笑,把译员的资质证书和术语对照表一起发过去——在这种领域,有时候证据比语感更重要。
说到底,小语种翻译从来不是简单的语言转换,它是一场关于稀缺性、信任和细节耐心的持久战。当你面对一个使用人口不足千万的语言时,你面对的是一个完整但遥远的世界观,一套你暂时无法直观理解的思维编码。这时候需要的不是机敏,而是那种老派工匠的笨功夫:反复确认,保持敬畏,承认自己的无知,然后在字符的迷宫里,一点一点,把意思凿通。
放下键盘的时候,窗外天已经黑了。屏幕上还开着那个斯瓦希里语文档,那些字符像一群优雅但陌生的小鱼,在白色的背景里游动。我想,这就是做这个工作的代价和奖赏吧——你永远无法真正"掌握"它们,但每一次笨拙的靠近,都在把两个遥远的世界,拉近那么一点点。
