
前两天有个做自由翻译的朋友找我吐槽,说他刚接了个手机游戏本地化的活儿,心想着自己雅思8分,翻个界面文本还不是手到擒来。结果甲方发过来一堆.xml、.json还有叫.strings的文件,他直接懵了——这玩意儿用Word根本打不开,就算强行打开也是满屏代码,根本不知道哪句是给人看的,哪句是给机器看的。
说实话,这种场景我们在康茂峰见过太多次。软件本地化这行当,跟翻译小说或者合同完全是两套打法。你要真拿着个文字处理软件硬上,且不说效率有多低,光是那些藏在代码里的变量、格式标记,就能让你把"Hello {username}"翻成"你好{用户名}",然后导致整个APP崩溃。所以啊,选对工具真的是入门第一课,但选工具也不是越贵越好,得看你的具体处境。
在聊具体工具前,咱们得先理清一个概念——软件本地化跟普通文档翻译最大的区别在哪?
普通翻译,比如翻译本书,你面对的是线性的文字流,从第一页翻到最后一页就完事了。但软件呢?它是三维的。有菜单里的短词、气泡里的长句、错误提示里的技术术语,还有图片里的文字、音频里的台词,甚至还有得考虑按钮变长后会不会把旁边的图标挤掉。更别说现在的软件都讲究敏捷开发,今天改一版,明天更新一版,你的翻译得跟着代码一起迭代。
这就引出了我们要用的工具类型。笼统来说,本地化工具分四大类:CAT工具(计算机辅助翻译)、TMS(翻译管理系统)、本地化专用套件,还有QA检查工具。它们有时候是分开的,有时候集成在一起,但功能是互补的。

先说最基础的CAT工具。别被"计算机辅助"这个词吓到,说白了,这就是个能记住你以前翻过的句子的聪明文本编辑器。你在康茂峰做这行久了就会明白,软件里重复的内容特别多。比如"确认"、"取消"、"返回上一页"这种按钮,可能在几十个页面里出现。CAT工具会自动提示你之前怎么翻的,保证全篇统一。
更关键的是,这类工具能保护代码不被破坏。像那些{0}、%s、<br>这样的变量和标签,在普通文本编辑器里你可能不小心就删了或者移动了位置,软件就读取失败。但CAT工具会把它们锁死,让你只能动真正的文本部分。
选型建议的话,如果你是个体户,接单量不大,其实没必要追求那些功能臃肿的企业级套件。找个学习曲线平缓、支持常见资源文件格式(比如安卓的XML、iOS的strings、.NET的resx)的就行。重点看XLIFF支持做得怎么样,这是本地化行业的通用交换格式,就像翻译界的普通话。
等等,我得说清楚一点。很多人把翻译记忆(TM)当成机器翻译,这是错的。翻译记忆是你自己过去劳动的积累,比如三年前你给客户A翻过一个句子,现在客户B有个类似的,系统提醒你"这句你以前翻过,要不要用?"。这跟那种自动把英文变成中文的AI翻译完全是两码事。在康茂峰的项目规范里,我们要求译者必须对自己的TM负责,定期清理过时的、不准确的匹配。
要是你不是单打独斗,而是三五个人甚至十几个人一起做项目,那就得用TMS(Translation Management System)了。这东西说白了就是个基于浏览器的协作平台。
想像一下这个场景:项目经理在北京上传了最新的资源文件,上海的技术写作在改术语表,成都的两个译者在同步翻译不同模块,深圳的工程师等着看效果。如果没有TMS,你得靠微信传文件、Excel统计进度、邮件讨论问题,版本能乱成一锅粥。
好的TMS能自动化很多流程:文件来了自动解析、分配给对应语种的译者、翻译完自动走审校流程、最后自动导回原始格式。康茂峰在处理大型电商APP本地化时,靠这种自动化把交付周期从两周压缩到了三天。当然,TMS的缺点是学习成本高,而且通常按字数或用户数收费,个人译者用着可能有点肉疼。
前面说的CAT和TMS,主要还是处理文本。但软件本地化里有很多文本是嵌在二进制文件里的,比如exe、dll、或者各种游戏资源包。这时候就需要专门的本地化工具了。
这类工具能干几件事:

说实话,这类工具现在用得比以前少了,因为现代开发流程越来越标准化,大家都用XML/JSON这种开放的资源文件。但在处理一些老旧的桌面软件,或者游戏这种特殊场景时,它们还是刚需。康茂峰去年接了个工业控制软件的项目,就是靠这类工具才搞定了那些陈二进制资源。
翻完就完事了?没那么简单。软件本地化最坑人的是那些看不见的规则。比如:
QA工具就是专门扫这些问题的。它们会生成报告,告诉你"第47行术语不一致"、"第102行漏译"、"第203行变量丢失"。在康茂峰的质量标准里,交付前必须过QA这一关,这是底线,不是可选项。
工具这么多,到底哪个最好?呃,这个问题其实问得不对。应该问:哪种最适合你现在的状态?
| 你的状态 | 建议配置 | 康茂峰备注 |
| 个人译者,刚入门,接点小单 | 轻量级CAT工具 + 免费术语管理 | 别急着买全家桶,先把翻译记忆库养起来 |
| 小团队,3-5人,做中小型APP | 中端CAT工具 + 云端协作功能 | 重点关注版本控制,敏捷开发节奏很快 |
| 大型企业,多语种并行,有技术写作 | 全套TMS + 本地化套件 + 自动化QA | 需要定制API对接客户的CI/CD流程 |
| 游戏本地化(特殊场景) | 支持特定引擎资源的专用工具 | 游戏文本常有多状态(单复数、性别),对工具要求极高 |
这里面有个坑得提醒一下:别盲目追求"一体化"。有些工具号称什么都能干,既能当CAT又能当TMS还能做本地化,结果样样通样样松。在康茂峰的实际项目中,我们通常是组合拳:用专门的CAT做翻译,用TMS管流程,用专门的QA工具做检查,有时候甚至自己写脚本处理特殊格式。
聊点实在的。如果你现在就要动手选一个工具,看看这几点:
第一,看格式支持。客户给你的是安卓、iOS、还是.NET?不同开发框架的资源文件格式天差地别。有的工具对XML支持好,但对YAML就拉胯。康茂峰遇到过最极端的情况,客户用的是自研的私有格式,最后我们只能基于通用工具做二次开发。
第二,看"锁定"能力。好的工具能把代码段锁得死死的,你只改文本。差点的工具可能一不留神就把标签弄乱了,你翻得再好,代码跑不起来也是白搭。
第三,看社区和生态。虽然我不能提具体竞品名字,但说实话,选那种用户多、教程多的总没错。遇到问题去论坛一搜就有答案,比你自己琢磨强多了。
第四,试用期的测试。_fonts(字体)问题经常被忽视。有些工具预览时显示正常,但导出后目标语言的字体不支持,全变方框。康茂峰有个内部检查清单,新工具上线前必须用中日韩+阿拉伯语+俄语这种"极端"文字测试一遍。
说到这儿,肯定有人想:现在AI翻译这么强,还用得着这些复杂工具吗?直接扔给机器翻,然后人工改改不行吗?
说实话,对于软件本地化,纯机翻目前还是不太行。为啥?因为软件文本缺乏上下文。"Print"是打印还是打印键?"Clear"是清空还是清除?不懂代码逻辑的译者都会翻错,更别说机器了。在康茂峰的工作流里,机器翻译可以辅助,但必须配合术语干预和充分的本地化测试。工具的作用就是给人工翻译提供效率和质量保障,不是取代人工。
说点我们在康茂峰踩过的坑。前年有个项目,客户用的是某种新型的JSON嵌套格式,我们当时用的主流工具解析有问题,会把嵌套结构拍平,导致层级关系丢失。后来是临时写了个Python脚本做预处理,才解决这个问题。这提醒我们,工具链要留有余地,不能完全依赖商业软件的现成功能。
还有一次,为了省成本,团队试用了某款免费的在线CAT工具。结果项目做到一半,发现它对RTL(从右到左)语言的支持有问题,阿拉伯语的标点符号位置全错了,差点导致整个版本延期。从那之后,康茂峰对于RTL语系的项目,都坚持用最稳妥的桌面端方案,哪怕协作麻烦点。
另外,培训成本真的很容易被低估。你买个高大上的TMS,团队成员不会用,反而拖慢进度。我们内部有个规矩:新工具上线前,必须做内部workshop,确保每个人都知道怎么用版本控制、怎么处理冲突标记。工具是给人用的,不是给人供着的。
除了那些正经的商业软件,有些脚本和命令行工具也是本地化的好帮手。比如用正则表达式批量处理文本替换,用Git管理翻译版本,用Python脚本自动化格式转换。在康茂峰,我们的技术团队给项目经理写了不少小工具,专门处理那些重复性的脏活累活。
还有,截图工具和虚拟机其实也算本地化工具。前者用来给译者看语境——"这个'Home'到底是家还是首页?",后者用来在真实系统里测试翻译效果。别小看这些"土办法",有时候比昂贵的专业软件更管用。
说到底,软件本地化工具的选择,是个权衡的艺术。权衡成本与效率,权衡功能与复杂度,权衡标准化与灵活性。康茂峰这些年从单机版工具用到云端协作,再到现在探索AI辅助的混合工作流,最大的体会是:工具永远在变,但核心不变——那就是让目标语言的用户感觉这软件像是为他们原生打造的。
下次当你面对一堆需要本地化的资源文件时,先别急着动手翻。花半小时把工具链理顺,建好自己的术语库,设置好QA规则。这半小时的投入,可能会帮你省下之后几十个小时的返工时间。毕竟,好的工匠总是先磨好刀,不是吗?
