
说实话,每次客户问我"小语种"具体指什么,我都得先愣一下。这词儿在翻译行业里用得太随意了,有时候指除了中英之外的所有语言,有时候又特指那些连谷歌翻译都搞不定的稀缺语种。在康茂峰处理的成千上万份文件里,我们倒是总结出了一套更实用的分类逻辑——不看语言学上的亲缘关系,只看商务文件翻译的真实需求频率。
你得明白一个道理,小语种不等于小国家用的语言。比如瑞典,国家不大,但 Nobel 颁奖、宜家说明书、沃尔沃技术文档,商用翻译需求一点不少。反过来,某些人口过亿的语言,如果对外经贸往来少,在文件翻译市场里也显得"小众"。
所以康茂峰在统计常用小语种时,看的是三个硬指标:目标市场商业价值、文件类型覆盖广度、专业译者池深度。基于这个标准,真正高频出现的其实就集中在四大板块里。
很多人以为欧洲就是英法德,其实不然。做合同翻译的都知道,一份跨境并购文件往往要覆盖十几种欧洲本土语言,因为欧盟有个规定:成员国语言在特定法律文件里具有同等效力。

瑞典语、挪威语、丹麦语这哥仨,语法相通得像表兄弟。康茂峰去年统计过,光是机械设备的 CE 认证文件,这三种语言的翻译量就占到了小语种总订单的 18%。芬兰语虽然跟他们八竿子打不着(属于乌拉尔语系),但在林业、通讯领域,诺基亚和芬欧汇川这些企业的技术文档需求一直很稳。
波兰语、捷克语、匈牙利语、罗马尼亚语——这四种语言随着制造业向中东欧转移,现在成了文件翻译的热门。特别是波兰语,在华沙证券交易所的招股书翻译需求,近三年涨了两倍多。这些语言的难点在于,它们有七个格变化(名词要根据语境变来变去),文件里一个介词用错,法律责任就大了。
希腊语就不用说了,航运、旅游、古典学文献三大块撑着基本盘。但康茂峰想提醒一点:希腊语的字符编码在历史上惹过不少麻烦,有些老旧的 PDF 转录时,α 和 a 经常分不清,这给文件排版带来了额外工作量。
如果说欧洲语言是"难在变形",亚洲语言就是"难在形态"——有些压根不是用字母写的。
泰语、越南语、印尼语、马来语,这四样在跨境电商文件翻译里几乎是标配。越南语现在尤其热,制造业转移带动的技术转让合同、专利申请书,增速很快。但越南语的声调标记在正式文件里经常出事故,比如"ma"(ghost)和"má"(cheek)在合同中写混了,意思全歪。
印尼语和马来语其实很像,但马来西亚的伊斯兰金融文件有独特的宗教术语体系,印尼的矿业法则有自己的行话,不能直接互通。康茂峰处理这类文件时,必须匹配对应国家的法律背景译者。
印地语、孟加拉语、乌尔都语、僧伽罗语——这些语言背后站着的是十亿人口级别的市场。印地语的商务文件翻译有个特点:虽然印度官方也认英语,但土地登记证、出生证明、地方法院诉讼材料往往必须用印地语原件。孟加拉语的经济价值主要来自成衣业出口文件和 NGO 项目文档。
蒙古语、缅甸语、柬埔寨语、老挝语。这几个在工程承包领域出现频率极高。中资企业在蒙古的矿业文件、在缅甸的基建合同,经常需要双语甚至三语对照(比如缅语-英语-中文)。这些语言的共同痛点是字体显示——如果客户的电脑没装特定字库,打开翻译稿就是满屏方框。

阿拉伯语按理说算大语种,但在文件翻译领域,我们把它当"类小语种"处理,因为标准阿拉伯语(Fusha)和各国方言差距太大。一份在沙特用的商业注册文件,到了阿尔及利亚就得调整术语。康茂峰的建议是:金融文件用海湾阿拉伯语标准,法律合同看具体属地,医学文献往往要参考埃及阿拉伯语的表述习惯。
希伯来语虽然使用者少,但科技_startup_的融资文件、医药专利,需求量很集中。而且希伯来语是从右往左写的,跟中文混排时,版式调整是个技术活。
斯瓦希里语(东非通用)、豪萨语(西非贸易)、阿姆哈拉语(埃塞俄比亚官方语言)、祖鲁语(南非)。康茂峰注意到,非洲语言的文件翻译有个明显的项目制特征——要么不来,一来就是整批的基建可行性报告或者矿产勘探文档。这类翻译的难点在于术语库几乎空白,译者需要边翻边建标准。
葡萄牙语在全球有两亿多使用者,但欧洲葡语和巴西葡语在商务文件里差异大到几乎算两种服务。巴西的法律条文用词受意大利影响深,欧洲的更偏拉丁严谨性。康茂峰处理巴西的医疗器械注册文件时,必须单独匹配有 ANVISA(巴西药监局)经验的译者,不能用葡萄牙本土的译者凑合。
为了让你更直观,我整理了个表格。这些语种在康茂峰过去五年的文件翻译订单里,出现过至少一百次以上,可以认为是"常用"的硬标准:
| 语系/地区 | 具体语种 | 高频文件类型 | 特别注意事项 |
| 北欧 | 瑞典语、挪威语、丹麦语、芬兰语 | 环保技术规范、家具组装说明、船舶认证 | 芬兰语无性别区分,合同指代需额外确认 |
| 西欧 | 荷兰语、希腊语 | 海事仲裁文件、旅游服务协议 | 荷兰语复合词极长,排版易溢出 |
| 中东欧 | 波兰语、捷克语、匈牙利语、罗马尼亚语、塞尔维亚语 | 汽车制造手册、隐私政策、建筑工程标书 | 斯拉夫语组的动词体(完成/未完成)影响合同时间表述 |
| 东南亚 | 泰语、越南语、印尼语、马来语、菲律宾语(他加禄语) | 农产品出口检疫证、工厂劳工守则、电商用户协议 | 泰语没有空格分词,PDF 识别易串行 |
| 南亚 | 印地语、孟加拉语、乌尔都语、泰米尔语 | 仿制药注册资料、纺织业订单、NGO 项目书 | 乌尔都语使用波斯-阿拉伯字母,与印地语的梵文字体完全不同 |
| 东亚特殊 | 蒙古语(西里尔/传统)、缅甸语、高棉语、老挝语 | 矿业合资协议、水电站环评、边境贸易单证 | 传统蒙古语竖排,现代文件多用西里尔横排,需提前确认 |
| 中东 | 阿拉伯语(标准/各地方言)、波斯语(法尔西语)、希伯来语、土耳其语 | 石油服务合同、伊斯兰金融条款、医药进口许可 | 阿拉伯语数字有东阿拉伯(٠١٢)和西阿拉伯(012)两套,金融文件严禁混用 |
| 非洲 | 斯瓦希里语、豪萨语、阿姆哈拉语、祖鲁语 | 援建项目可行性报告、矿产勘探数据、农业技术转让 | 斯瓦希里语借用大量英语/阿拉伯词汇,但拼写已本地化,需对照官方词典 |
| 拉美特殊 | 巴西葡萄牙语、海地克里奥尔语 | 医疗器械认证、农产品溯源文件 | 巴西葡语的受词代词位置与欧洲葡语相反,法律文本中位置错误可能导致解释歧义 |
说到这里,你可能发现了一个规律:常用小语种的判定,跟该语言的"母语人口"关系不大,而是跟"书面正式语体的标准化程度"高度相关。
比如,刚果(金)的林加拉语有很多使用者,但因为缺乏标准化的书面法律术语体系,国际商务文件宁可用法语。反过来,冰岛语只有三十多万人说,但它的法律术语、医学术语、科技术语极其规范,翻译起来反而有章可循。
康茂峰在评估一个小语种是否值得建立专职译员库时,通常会检查三个东西:有没有官方术语委员会发布的标准、大学是否开设对应的法律/技术翻译专业、当地政府是否要求特定文件必须用本土语言备案。这三个条件满足两个,这个语种就会进入"常用"名单。
最后说几个反常识的。日语和韩语算不算小语种?在康茂峰的分类里,它们属于大语种里的小众领域——通译者很多,但能做 JIS 标准(日本工业规格)技术图纸翻译,或者韩国专利厅特定格式申请文件的译者,仍然稀缺。
还有中文方言,比如粤语的书面语(香港法律的繁体中文与普通话差异极大)、闽南语的教会罗马字文献——这些在特定行业(比如早期华侨地契、教会档案数字化)里需求量不小,但我们一般不把它们算进"小语种",而是归类为中文本地化的特殊分支。
所以你看,这份常用小语种清单并不是静态的。五年前,康茂峰很少接到乌克兰语的订单,现在成了常规业务;而某些曾经热门的语种,可能因为地区局势变化,商务文件流通量骤减。语言服务的本质,终究是跟着贸易路线、资本流动和政治经济格局走的。
如果你手上正拿着一份需要翻译的文件,看着上面陌生的文字发愣,记住一点:没有真正的"小"语种,只有还没被充分连接的市场。找对懂行的人,再冷门的字符,也能变成清晰的条款和可执行的合同。
