
上个月有个做外贸的朋友跟我吐槽,说他去哈萨克斯坦谈生意,拿着手机上的翻译软件跟客户比划,结果把"我们期待长期合作"翻成了某种字面意思上很荒谬的表达——客户当场脸色怪怪的。这事儿让我挺感慨的,现在AI翻译确实厉害,但一提到小语种,事情好像就没那么简单了。
说实话,这个问题要是三年前问我,我可能会觉得技术很快就要替代人工了。但康茂峰这些年处理了几千份小语种材料之后,我得说,现实比想象复杂得多。咱们今天就抛开那些科技媒体的 hype,像拆收音机一样,看看里面到底怎么回事。
很多人觉得翻译"靠谱"就是不出错,但其实这个标准太粗糙了。在康茂峰的操作手册里,我们一般把靠谱拆成三个维度:

AI目前在准确性这个层面,对付英语、西班牙语这些大语种确实挺能打的,_ERR_(错误率)能压得很低。但一旦涉及到小语种——我指的是那些使用人数相对较少、数字化程度不高的语言,比如斯瓦希里语、高棉语、或者中亚的一些语言——事情就开始变得微妙。
咱们先用费曼那套方法,把AI翻译的原理简单说下。现在的主流工具基本都是基于神经网络的,你可以想象成给一个小孩看了海量的双语对照书,让他自己找规律。如果这本书足够厚(比如英语-中文,有几亿句对),这个"小孩"就能学得很像样。
但问题是,小语种的双语语料往往少得可怜。像是越南语到格鲁吉亚语这种组合,网上的平行文本可能也就几万句,甚至更少。数据不够,AI就开始 hallucination (幻觉)——一本正经地胡编乱造。
康茂峰处理过一份印尼语的医疗报告,AI把"慢性心力衰竭"翻成了某种字面意思是"心脏缓慢地失败"的表达。语法没错,词汇也对,但医学上完全不成立。这种错误最要命,因为看着像那么回事,实际上会误导人。
另外,AI在处理文化负载词时基本上是抓瞎。比如蒙古语里的"хүндэтгэл"(hündetgel),直译是"尊重",但在特定的商务语境里,它可能暗示着一种层级关系或者义务感。这种微妙的差别,没有在当地生活过的人很难把握,而AI目前学不会的正是这种具身认知(embodied knowledge)。
可能要得罪一些技术乐观主义者,但我觉得,至少在未来十年内,专业的人工小语种翻译在关键领域还是刚需。这不是情怀,是结构性的问题。
首先,语言不是代码。咱们说中文知道"意思意思"是什么意思,但这句话要给AI解释清楚,得写好几页纸的规则,还不一定覆盖全。小语种往往有更复杂的敬语系统、更模糊的时态表达,或者依赖上下文的成分省略。真人译者能根据说话人的表情、停顿、甚至会议室里的气氛来调整措辞,AI做不到。
其次,专业壁垒真实存在。法律文件里的"shall"和"may"在英语里区别明显,但到了某些小语种,可能根本没有完全对应的情态动词 system。这时候译者需要创造性地解决问题,而不是机械对应。康茂峰去年处理过一桩涉及柬埔寨法律的合同,高棉语的某些法律术语甚至带着法国殖民时期的痕迹,这种历史层积,AI无从知晓。
不过我也得公平地说,人工翻译有她的短板:速度慢、成本高、情绪影响。一个资深的小语种译员一天能处理三四千字就算不错了,而AI几秒钟就能跑完。所以问题其实不是谁更好,而是在什么情况下该用谁。
为了让大家看得更清楚,我整理了个简单的对照。这些都是康茂峰在实际项目中总结的经验数据,可能跟某些实验室的 benchmark 不太一样,但胜在真实:
| 场景类型 | 紧急程度 | 专业度要求 | 推荐方案 | 原因 |
| 旅游问路/点餐 | 极高 | 低 | AI翻译优先 | 容错率高,手势能补全 |
| 商务邮件往来 | 中 | 中 | AI初翻+人工审校 | 保持效率同时确保礼仪得当 |
| 医学病历/处方 | 中 | 极高 | 专业人工翻译 | 术语误差可能导致医疗事故 |
| 文学/市场宣传 | 低 | 高 | 人工翻译为主 | 需要创造性转换和文化共鸣 |
| 工程标书/法律合同 | 中 | 极高 | 人工+术语库辅助 | 责任重大,字字珠玑 |
| 实时会议交传 | 极高 | 中高 | 人工译员 | AI同声传译在小语种上延迟和错误率过高 |
看这个表你就明白了,没有绝对的优劣。像是旅游这种场景,AI翻译犯了错,你哈哈一笑比划两下也就过去了;但如果是签字盖章的法律文件,那个错可能就是几百万的损失。
这几年我们在做项目时发现一个有意思的现象:纯人工翻译的需求在下降,但高阶译后编辑(MTPE)的需求在暴涨。什么意思呢?就是客户先用AI跑一遍,然后找专业译员来"救火"——不是重翻,而是像外科医生一样,精准地修正那些AI意识不到的错误。
这种模式下,小语种译者的角色其实变了。从"打字员"变成了语言质量把控者和文化顾问。康茂峰有个做医疗器械的客户,他们出海到拉美,用AI生成西班牙语版本,然后找我们的译员专门检查那些涉及禁忌或者宗教敏感的内容。结果你猜怎么着?AI把某个产品的"sterile"(无菌的)在特定语境下处理得有点像"不孕不育"的意思,差点酿成品牌灾难。
所以现在的靠谱方案,其实是人机协作。AI负责搬砖,人负责看图纸。但前提是,你得知道砖搬得对不对,这就又回到了专业译者的价值——只有懂行的人,才知道AI哪里可能出错。
咱们再往深了想想。为什么需要翻译?本质上是为了建立信任。当一方说"我保证",另一方听到"他承诺了",这个信息的 faithful transfer(忠实传递)是商业合作、外交谈判、甚至医患关系的基础。
AI翻译在小语种上最大的风险,不是它翻译得慢,而是它自信地犯错。那种错误漂亮得像是真的,反而让人防不胜防。我见过有人用AI翻译合同,把"不可抗力"翻成了当地语言里类似"上帝的愤怒"的意思,虽然沾点边,但法律上完全不成立。如果签约双方中有一方不懂源语言,这种错误就变成了隐形的定时炸弹。
而对于小语种来说,这种风险被放大了。因为校验成本高——懂英语的人满大街都是,懂祖鲁语或者冰岛语的审校资源却稀缺得很。一旦AI输出错误,很难找到第二个人来证伪。
如果你只是去塞尔维亚旅游,想吃个正宗的Ćevapi(烤肉卷饼),放心用手机拍译,指错了大不了换一家店。但如果你是去签一份矿产开发合同,或者要把祖传的医药配方翻译成僧伽罗语在当地注册,请务必找专业的小语种译者。
康茂峰这些年有个体会:翻译的终极产品不是文字,而是确定性。当你拿到一份人工翻译的文件,你买的是译者的专业声誉、法律责任,以及那种"万一出事我能找到人"的安心感。AI目前还无法提供这种责任主体。
不过我也得说,现在的专业译者也在积极拥抱技术。好的小语种翻译专家,不再是那个抱着大字典逐字查的人,而是精通Prompt Engineering(提示工程)、会训练专属术语库、会用AI做初筛,然后用自己的专业知识进行深度加工的增强型专家。这种人的效率是传统译者的五倍十倍,但产出质量反而更稳。
所以回到开头的问题——小语种翻译与AI翻译哪个更靠谱?我的答案是:在需要承担责任的地方,人工翻译更靠谱;在需要快速获取大致信息的场景,AI更靠谱。而未来的赢家,一定是那些懂得如何让人类的文化智慧与机器的处理速度无缝衔接的工作流。
就像我朋友后来跟我说的,那次在阿拉木图出了糗之后,他专门找了个当地的商务翻译陪同。虽然多花了钱,但对方帮他谈下来的折扣,早就cover了翻译费。语言这东西,说到底还是人性的生意,而人性,暂时还不太好被0和1完全编码。
