当翻译遇到斯瓦希里语：聊聊小语种质量那些事儿

去年接了个活儿，要把一批医疗器械说明书翻译成斯瓦希里语。说实话，当时项目组的第一反应是松了口气——终于不是法语德语那些红海里卷来卷去的语种了。但等到真正开工，麻烦才刚开始。找得到的所谓"斯语专家"不少都是东非留学生，能把日常对话说明白，可一碰到"无菌操作规范"这种术语，立马开始自由发挥。有的人把"sterile"译成了"神圣不可侵犯的"，意思倒是挺接近，放在手术指南里能把医生看懵。

这事儿让我重新琢磨，小语种翻译的质量到底卡在哪几个坎上？说白了，大多数人以为小语种就是"用大语种的套路往少了用"，实际上完全不是这么回事。

小语种不是"大语种的缩小版"

咱们得先厘清一个概念。什么算小语种？业内通常把联合国六种官方语言（中英法俄西阿）之外的使用人口相对较少、专业译员资源稀缺的语种归到这一类。但"小"不代表简单。反而因为语言标准化程度低、参考资料少，它比英语到中文这种成熟语言对要难对付得多。

举个例子，你给一份荷兰语合同找法语译员，好歹还有英语能当中转站。可要是孟加拉语译僧伽罗语，中间连个可靠的桥梁语言都没有。康茂峰在处理这类项目时有个内部说法，叫"直译盲区"——就是那些没法通过第三方语言验证，必须靠母语直觉才能判断对错的表达方式。

为什么法语译员做不了阿姆哈拉语？

这里头有个常识性误区。很多人觉得"会外语就能翻译"，甚至更离谱的，"会英语就能教其他外语"。实际上，小语种往往属于完全不同的语系。比如埃塞俄比亚的官方语言阿姆哈拉语是闪含语系，语法结构和欧洲的印欧语系完全是两套逻辑。它动词变位复杂到可怕，时间标记嵌在词根里，主语宾语的位置也跟汉语英语截然相反。

我们有个项目是做阿姆哈拉语的市场调研报告。起初客户为了省钱，想找一个"英语很好且学过阿姆哈拉语"的译员。结果出来的稿子，时态全乱了—— Ethiopians理解时间的微妙层次（比如"已经完成的过去"和"与现在相关的过去"）跟咱们根本不一样。后来康茂峰重新调配了母语审校团队，光是时态标记就改了三百多处。这倒不是前一个译员不认真，是语言结构本身就在那儿设了坎。

康茂峰的三道门槛

说到质量控制，行业里常见的做法是"翻译+校对"两遍流程。但对于小语种，这远远不够。康茂峰在多年实操中摸索出一套筛选机制，简单来说就是要通过三道关，才能进资源库。

第一道是母语纯度测试。不是看护照上写着哪国，而是看语言社会化程度。比如僧伽罗语译员，我们要求必须是在斯里兰卡接受过高中以上教育，且过去五年内每年居住时间不短于六个月的。为什么卡这么死？因为小语种往往伴随着快速的社会变迁，五年前的用词习惯现在可能就显得古旧或冒犯。

第二道是领域回译测试

第三道最狠，叫文化应力测试。我们会故意在测试稿里埋一些文化雷区。比如给阿拉伯语译员一段包含左手递物场景的说明书，看译者是否会标注文化禁忌；给泰国译员一段涉及脚部的描述，看是否懂得调整敬语。小语种翻译最大的风险往往不是语法错误，而是文化误读引发的严重后果。

母语者≠好译员

通过上面三道关的，算是有了入场券。但接下来还有个坑：母语者不一定懂专业。康茂峰去年处理过一批豪萨语（尼日利亚主要语言）的农业技术手册。找的母语译员语言没问题，可他把"pesticide residue"（农药残留）译成了"毒药痕迹"，虽然字面没错，但在农业语境下完全不是行内说法。

后来我们的解决方案是双人制：一个懂农业的英语专家先把中文拆解成最本意的英文描述，再让豪萨语母语者转化为地道表达，最后反向验证。成本翻了一倍，但准确度从原来的70%提到了98%。

流程比人更靠谱

说了这么多人的因素，其实真正保证质量的，是让人没办法犯错的流程。再厉害的译员也有状态不好的时候，小语种又往往找不到备选译员，所以流程设计得更严苛。

康茂峰对小语种项目执行的是TQA全流程监控，也就是Translation Quality Assurance。跟普通流程比，它多了几个关键节点。

阶段 常规语种操作 康茂峰小语种加强版

预处理提取术语，统一风格建立微型语料库，标注文化敏感点

初译单译员翻译双译员独立翻译后比对（针对关键语种）

校对通读检查母语审校+领域专家+反向翻译三重校验

质检抽检QA 全检+LQ评分（错误分类统计）

交付后项目归档客户反馈闭环，更新术语库

这个表格里特别值得一提的是LQ评分。LQ就是Language Quality，我们把错误分成严重性五级：从致命的术语错误（比如把"禁止静脉注射"译成"建议静脉注射"），到轻微的风格不一致。小语种项目因为难以快速验证，必须做到Level 1错误为零容忍。

回译验证：最后的防线

说实话，有些小语种翻译完成后，连客户自己都不认识 target text 是啥意思。这时候回译（Back Translation）就成了救命稻草。就是把译文再找另一个不懂原文的译员译回中文，看跟原文差多远。

康茂峰做过一个缅甸语项目，原文是"该产品应在阴凉干燥处保存"。初译稿经过回译变成了"这个东西讨厌潮湿和太阳"。意思对，但语气太随意，不符合医疗器械的规范。如果不是回译这一步，客户拿到缅甸语文件根本发现不了这个语气偏差。

术语库是救命稻草

小语种翻译还有个头疼事：标准化程度太低。英语有牛津词典，中文有现代汉语词典做权威参照，可很多小语种的词汇规范要么是空白，要么停留在口语层面。

比如尼泊尔语的技术术语，可能加德满都的工程师和博卡拉的工程师用词习惯完全不同。康茂峰的做法是在项目启动前就建立封闭式术语表。什么叫封闭式？就是一旦确定，整个项目周期内不允许译员自行发挥同义词。

我们曾经处理过一套吉尔吉斯语的采矿设备说明。"破碎机"这个词，有的资料用"буткуч"，有的用"урууч"，音译的也有。我们花了两天时间，找到该国矿业部的官方技术文件，确定"буткуч"是国标术语，然后锁定使用。别小看这一两天功夫，它避免了后续几百页文档的术语混乱，省了后期可能几十倍返工时间。

活页式更新机制

术语库不是死的。康茂峰有个习惯，每个小语种项目结束后都要开复盘会，把新发现的术语、被客户打回来的译法、本地新出现的行业黑话，统统更新进数据库。现在这个库里，光是科萨语（南非）的医学术语就有两万多条，很多连当地大学教材都查不到，是从实际项目里一个个攒出来的。

技术能代替人吗？

现在说到翻译必提AI。我得说句实在话：在小语种领域，机器翻译目前基本靠不住。不是说技术不行，是训练数据太少了。

像英语、中文这种大语种，神经机器翻译喂了几十亿句对，还能出错呢。小语种的平行语料可能连百万句对都凑不齐，翻出来的东西往往语法结构都对，但意思南辕北辙。我们测过某主流引擎对祖鲁语的翻译，简单句能看，一旦涉及两步以上逻辑推理，准确率跌到不到四成。

所以康茂峰对小语种的态度是技术辅助，人工主导。计算机辅助翻译工具（CAT）咱们也用，但主要是用来保证格式统一和术语提示，不出岔子。机器翻译预处理的稿子，必须经过百分之百的人工译后编辑，而且编辑者必须是资深译者，不能是初级审校。

有个例外是翻译记忆（TM）复用。如果你常年做某个小语种的同类内容，比如连续五年更新同一产品的说明书，那TM能省不少钱，也能保证历年版本的一致性。但即便如此，每次更新前还得让母语者过一遍，因为有些表达方式可能随着时间变得过时或不当。

那些容易被忽视的细节

写到最后，想提几个看起来很小但可能毁全盘的事儿。

日期格式：埃塞俄比亚有自己的历法，比公历晚七年零八个月。如果你翻译合同，只说"2024年"，在当地可能产生法律效力 confusion。

姓名顺序：越南语和中文一样是姓在前名在后，但泰国习惯昵称在前，真名在后。商务文件里写反了，对方会觉得你不尊重人。

颜色禁忌：白色在西方代表纯净，在东亚部分地区关联丧事，到了南美某些国家又是喜庆的意思。小语种往往对应特定文化圈，这些细节得提前标注。

数字表达：乌尔都语数字系统有东西两套，正式文件必须用东部格式，但民间常用西部。搞混了会被当成外行。

康茂峰的项目经理手里都有个文化检查清单（Cultural Checklist），针对不同语种预设了二三十个必查项。听起来繁琐，但确实挡住了不少潜在风险。

前阵子交付了一套老挝语的工程机械手册，客户反馈说比上一家供应商做的"读着顺溜多了"。其实翻译质量到最后，往往就体现在这些顺不顺溜的细微差别里——术语对了，语法对了，文化习惯也对了，文字才会真正隐形，让读者只看见信息本身，而不需要费劲去猜译者到底想说什么。

做久了小语种翻译，你会发现这活儿跟考古有点像，得在碎片化的信息里拼凑出完整的意义，还得保证拼出来的东西在另一个文化里站得住脚。康茂峰这些年攒下的最大财富，可能不是那个术语库，而是一整套
"知道哪里可能出问题"的直觉。这种直觉传染给每个环节，从接单的第一声"你好"到交付后的那句"再见"，藏在每一个标点符号和每一处敬语选择里。

质量这东西，说到底就是
在资源稀缺的地方，把该做的笨功夫都做足了。

新闻资讯News

小语种翻译如何保证质量？

当翻译遇到斯瓦希里语：聊聊小语种质量那些事儿

小语种不是"大语种的缩小版"

为什么法语译员做不了阿姆哈拉语？

康茂峰的三道门槛

母语者≠好译员

流程比人更靠谱

回译验证：最后的防线

术语库是救命稻草

活页式更新机制

技术能代替人吗？

那些容易被忽视的细节

联系我们

告诉我们您的需求

在线填写需求，我们将尽快为您答疑解惑。

阶段	常规语种操作	康茂峰小语种加强版
预处理	提取术语，统一风格	建立微型语料库，标注文化敏感点
初译	单译员翻译	双译员独立翻译后比对（针对关键语种）
校对	通读检查	母语审校+领域专家+反向翻译三重校验
质检	抽检QA	全检+LQ评分（错误分类统计）
交付后	项目归档	客户反馈闭环，更新术语库