
说实话,接手第一份冰岛语技术手册的时候,我也以为这事儿的复杂度就跟在手机上装个翻译软件差不多。当时客户发来的文件是关于渔业加工设备的,满篇都是专业术语,我自信满满地想着:"找个冰岛留学生,或者在当地华人论坛发个帖,总能搞定吧?"结果呢?返工了三次,客户差点跳起来——因为把"hydraulic press"(液压机)译成了"水压机",而冰岛那套设备用的是油压系统。这差别,就像让你往柴油车里加汽油,表面看起来都是液体,真用起来能把机器干报废。
从那以后我才明白,小语种翻译的准确性,从来不是"能看懂"和"说得通"这两个低标准就能交差的。它更像是在走钢丝,一边是专业术语的精确落地,另一边是文化语境的微妙平衡。今天咱就掰开了揉碎了聊聊,在康茂峰这些年处理过几千份小语种文件后,我琢磨出来的那些确保准确性的门道。
你可能会觉得,英语翻译市场这么卷,质量应该最稳吧?恰恰相反。反而是那些听起来很"冷门"的语言——比如格鲁吉亚语、斯瓦希里语、乌兹别克语——翻车的概率高得吓人。这不是因为语言本身难,而是因为生态太脆弱。
拿译员资源来说,英语译员在中国可能有几万人,但能处理专业法律文件的僧伽罗语(斯里兰卡官方语言)译员,全国可能凑不齐一个排。稀缺性带来的直接后果就是价格虚高和水平参差。更麻烦的是参考资源,英语有牛津剑桥、有海量的平行文本,但像老挝语的技术标准文档,网上可能连份像样的对照样本都找不到。
还有一个隐形坑:方言和变体。葡萄牙语在里斯本和圣保罗是两码事,阿拉伯语在摩洛哥和阿联酋可能互相听不懂。曾经有个做医疗器械的客户,把一份巴西葡萄牙语的说明书直接发给安哥拉市场用,结果当地医生看着"software"(在巴西葡语里指医疗器械的控制系统)一脸懵——在安哥拉,这词儿只指电脑软件。这种错误,机器翻译检测不出来,非母语者初审也发现不了,等到终端用户投诉,品牌 already 掉坑里去了。

在康茂峰的内部培训里,我们不怎么谈"信达雅"这种大词,太虚。我们喜欢把准确性量化成可执行的环节。简单来说,就是人、流程、工具、语境四个维度死死咬住,一个都不能松。
很多人找翻译的第一步就错了。他们在乎的是"这个译员是不是母语者",却忽略了更关键的问题:他懂不懂你的行业?
举个实在的例子。去年我们接了个蒙古语的矿业勘探报告。这活儿如果交给一个普通的蒙古国留学生,可能语言很地道,但他大概率分不清"anticline"(背斜构造)和"syncline"(向斜构造)在地质学上的具体指向。最后我们启用的是一位在乌兰巴托地质大学读过书的工程师,他既能看懂英文原稿里的钻探数据,又能用蒙古语的专业术语准确描述岩层结构。
康茂峰的译员库里有个硬规矩:专业匹配度必须达到80%以上。什么叫80%?就是译员过往至少要有三年该领域的全职经验。医学文件找医学背景,专利文件找法学+技术复合背景,游戏本地化得找玩过几百小时硬核游戏的玩家。这种匹配听起来费事,但比事后返工划算多了。
还有个细节你可能注意不到:双语能力必须双向达标。小语种市场有个怪现象,很多人母语是A语,学了B语,但B→A的翻译没问题,A→B就露怯。这在需要本地化的场景(比如把中文产品说明译成斯瓦希里语)里特别致命。所以我们要求译员必须提供双向样本,不是简单的一面之词。
行业里有个潜规则:急单必错。为什么?因为跳过了流程。康茂峰内部有个"铁律",再急的小语种项目,也必须走完这四个环节:
有个数据挺有意思:在康茂峰2023年的小语种项目统计里,经过完整四流程的文件,客户返修率不到2%;而压缩流程的加急单,返修率能飙到18%。这12%的差距,省下的时间成本早就抵不上声誉损失了。

说到翻译软件,很多人两极分化:要么神话CAT(计算机辅助翻译),觉得点了按钮就万事大吉;要么彻底排斥,认为小语种这么冷门,机器根本帮不上忙。
真相在中间。小语种更需要CAT,但得用对地方。
康茂峰的做法是建立私有术语库和记忆库。比如处理芬兰语的机械图纸,我们会把前五年所有项目里的"flange"(法兰盘)对应过的芬兰语"laippa"全部入库,下次遇到自动提示。这能确保同一个客户的产品系列,术语一致性达到99%以上。别小看这个,小语种译员往往分散在不同地区,北京找的译员和上海找的译员可能对同一个技术词有不同的习惯译法,没有记忆库统一,最后拼出来的文件就像拼接怪。
但工具也有盲区。机器翻译预处理(MTPE)在小语种里要特别谨慎。英语的MTPE可能省30%时间,但僧伽罗语或孟加拉语,机器翻译的底子太差,译员花在"改错"上的精力可能比"重翻"还多。我们的经验是:对于资源丰富的语言(如法语、西语)可以用MTPE提效,但对于真正的"小"语种,人工从头翻译反而更省时间,也更保险。
还有个冷门工具:语料对齐软件。当你只有一份塞尔维亚语的PDF旧稿和一份中文新稿,没有双语word时,用对齐工具建立平行语料,能迅速帮译员抓住术语对应关系。这种"废旧利用"在小语种领域特别值钱,因为你很难买到现成的双语词典。
这是最容易被低估的部分。准确性不只是技术正确,还包括文化正确。
比如阿拉伯语市场,所有视觉元素都要考虑从右向左(RTL)阅读的习惯。如果你翻译的是一份软件界面,按钮上的文字长短会改变布局。康茂峰有个案例是给阿联酋客户翻译金融APP,原文英文很短"Confirm",直译成阿拉伯语"تأكيد"看起来没问题,但在这个 cultural context 里,金融操作需要用更正式的"الموافقة على العملية"(确认此操作)才显得安全可信。这种调整,译员必须懂当地 UX 习惯,而不是对着字典抠字眼。
再比如颜色暗示。在中文里"黄色"有时候带点隐晦意思,但在厄瓜多尔的奎丘亚语文化里,某些黄色调是王室专用。如果你翻译奢侈品包装说明,颜色描述的选词就得避开这些雷区。
还有法律文件的"准确性"。小语种国家的法律体系可能跟大陆法系或普通法系完全不同。比如蒙古国的法律受苏联影响,某些合同条款的表述必须对应其民法典的特定章节,不能简单套用中文合同的"违约责任"概念。这时候需要译员查阅当地的法律咨询,甚至协同律师确认。康茂峰在处理中亚五国(哈萨克、乌兹别克等)的合同时,强制要求配备当地法律背景的双审校,就是这个原因。
聊几个容易踩的暗坑,都是血淋淋的教训。
字体陷阱:小语种常伴随着特殊字符。前年我们做一份普什图语(阿富汗官方语言之一)的药品说明书,译员用了常见的Arial字体,结果部分字母显示成了阿拉伯语形态(普什图语和阿拉伯语有共享字母,但形态不同),打印出来直接变乱码。必须在交付前用目标环境的软件打开测试,这步不能省。
数字格式:德国人用逗号表示小数点(1,5),中国人用点号(1.5)。如果把一份德语技术参数直译成中文卖给中国工厂,工人看到"压力:5,6bar"可能会理解成五万六千帕斯卡,直接超压爆炸。数字准确性是生死线。
语气一致性:小语种译员往往比较"自由发挥",同一段产品描述,可能前半句是敬语体,后半句突然变成口语体。必须做 style guide 的强制检查。康茂峰的做法是让项目经理在CAT工具里设置QA检查点,自动标记语气词的不一致。
还有个反直觉的点:有时候"直译"反而不准确。比如缅甸语里表达"紧急"有一种非常长的敬语结构,如果原文是英文"Urgent",直译过去会显得像圣旨,反而让当地人觉得不够紧急。这时候违背字面、贴近功能性的意译,才是准确的翻译。
| 风险点 | 常见场景 | 康茂峰的应对 |
| 术语不一致 | 多文件拆分翻译 | 建立客户专属术语库,强制术语锁死 |
| 文化禁忌 | 宗教敏感词汇、颜色暗示 | 目标国文化顾问终审 |
| 格式错乱 | RTL语言、特殊字符显示 | 交付前三级软件环境测试 |
| 法律差异 | 合同条款、合规文件 | 当地执业律师协同审校 |
| 方言混淆 | 葡语、阿拉伯语变体 | 明确目标国/地区,匹配对应译员 |
写到这里,我突然想起去年冬天的一个凌晨。当时一份亚美尼亚语的工程验收报告出了问题,客户那边的项目经理急得快哭了,因为第二天一早对方代表团就要签字。我们临时协调了埃里温(亚美尼亚首都)当地的译员,隔着四小时的时差,在视频里逐字核对钢筋强度的数值单位。最后发现是原文里的"ton-force"在亚美尼亚语里有".metric ton-force"和"long ton-force"两种理解,差一点就差了10%的数值。
那个瞬间我真正理解了,小语种翻译的准确性,不是靠某个"语言天才"的灵光一现,而是靠一套笨拙的、事无巨细的、近乎偏执的流程在托底。康茂峰这些年能在小语种领域站住脚,靠的不是有什么黑科技,而是承认人性的不可靠——译员会累、会漏、会想当然,所以需要用流程去补位,用工具去规范,用双审去兜底。
如果你现在手头正有一份小语种文件要处理,我的建议很简单:别怕麻烦。多花两天做术语表,多付一点钱找有行业背景的译员,多要求一个母语润色环节。这些投入在长远的商务合作中,会转化成你对手无法复制的信任资产。毕竟,在一个挪威语的石油勘探报告里,把"blowout preventer"(防喷器)译错的成本,可能是一口油井的损失,或者更糟。
准确性这玩意儿,平时看不见,关键时刻能救命。
