
上周去便利店买咖啡,拿起一个进口品牌的杯子,背面印着小字"Best served with joy"。翻译过来大概是"最好与快乐一起享用",读起来挺诗意的对吧?但要是放在中文语境里,这种表达方式其实挺奇怪的——我们一般不会这样说话。
这就是网站本地化的日常写照。干了这么多年,康茂峰接触过几百个项目,发现大多数人一开始都把这事想简单了:不就是翻译吗?找个外语好的人折腾一下不就行了?嗯,事情真没这么轻松。本地化(Localization)和翻译(Translation)之间的鸿沟,大概相当于把川菜原封不动搬到法国餐厅,和根据法国人口味调整麻辣程度之间的区别。
先说说最表层的文字工作。很多人以为本地化就是语言替换,这个词对应那个词,完事。实际上,语言是活的,带着文化基因的。
记得有个电商项目,英文原站有个按钮叫"Submit"。直译成"提交"在中文里显得冷冰冰的,像是交作业或者填表格。但看在具体的结账流程里,这个按钮其实是"确认订单"的意思。如果硬生生放"提交"两个字,用户会愣一下——我是不是按下去就要付钱了?有没有二次确认?

这种微妙的心理落差,词典可帮不了你。康茂峰的做法通常是让译员拿到完整的UI截图,甚至操作录屏,看清楚这个按钮前面是什么、后面会发生什么。有时候一个词要讨论半小时,不是因为不知道怎么译,而是要摸清楚用户在那一刻的预期。
这是个技术性很强但经常被忽视的点。德语单词平均比英语长30%,而日语、中文在表达同样意思时又比英语紧凑很多。如果你的按钮设计只留了英文"Buy Now"(8个字符)的空间,换成德语"Jetzt kaufen"(12个字符)可能还没事,但要是遇到更长的复合词,按钮就要变形了。
反过来,中文"立即购买"四个字在英文里可能需要"Purchase Immediately"(20个字符还语法别扭)。我见过太多案例,翻译稿交上去了,前端同事一看傻眼:这文字塞不进去啊。改字体大小?改按钮宽度?整个网格系统都要动。
所以在康茂峰的流程里,译员工作的同时,排版预案就要同步进行。用表格记录关键UI元素的字符限制:
| 元素类型 | 英文参考长度 | 建议预留空间 | 高风险语言 |
| 主导航按钮 | 15字符 | 200% | 德语、芬兰语 |
| 表单标签 | 20字符 | 150% | 荷兰语 |
| 移动端标题 | 25字符 | 120% | 韩语(纵向排版) |
| 错误提示语 | 不定 | 弹性布局 | 阿拉伯语(RTL) |
如果说语言是水面上的冰山,技术就是水底下那90%。很多失败的本地化项目,问题都出在技术债务上。
做本地化最理想的时机是网站还没盖好的时候。也就是说,在写第一行代码之前,就要考虑国际化(Internationalization,简称i18n)。这就像装修房子时先布好电线,而不是住进去了发现没插座再拉明线。
具体来说,代码里不能把字符串写死(hardcode),要抽离出来做成资源文件。时间日期格式不能用"MM/DD/YYYY"这种美式写法写死在程序里,因为欧洲人习惯"DD/MM/YYYY",而ISO标准是"YYYY-MM-DD"。货币符号不能硬编码在价格前面,因为有的文化习惯符号在后,有的在中。
康茂峰的技术审查清单里有个冷门的点:复数形式。英文复数就加s,但俄语、波兰语、阿拉伯语的复数规则复杂到能写篇论文。如果你的代码只考虑"一个"和"多个"两种情况,那阿拉伯语用户看到"2个物品"时语法可能是错的。
现在都2024年了,还有人用ASCII编码吗?还真有。去年接手一个改造项目,原站用某种旧版数据库,存储不了表情符号,更存不了某些东南亚语言的字符。全站迁移编码是个大工程,涉及到数据库、应用层、前端显示的层层转换。
再说说RTL(Right-to-Left),就是阿拉伯语、希伯来语那种从右往左写的文字。这不仅仅是文字方向的问题,整个页面的布局都要镜像。导航栏在右边,Logo在左边,连箭头图标都要调头。做RTL适配时,不能简单用CSS的direction: rtl了事,因为有些元素(比如Logo、视频播放按钮)是不应该被镜像的。
还有垂直排版的中文、日文古籍风格,虽然现在网页少用,但如果客户做传统文化相关内容,这可能是个需求点。技术选型时得考虑浏览器支持度。
网站本地化了,但没人搜得到,那等于白做。这里的关键词研究和原站SEO完全是两码事。
直接翻译关键词通常没用。比如英文里"cell phone"是美国说法,"mobile phone"是英国说法,到了中文市场,用户可能搜"手机"、"移动电话"或者"智能手机",而且不同地区的叫法习惯不同——台湾说"行动电话",香港说"手提电话"。如果不做本地关键词调研,只是按字面翻译,搜索引擎根本抓不到你的内容。
康茂峰的SEO同事有个习惯,会去看本地竞争对手用什么词,用工具抓取本地搜索建议,甚至翻翻当地的论坛看网民怎么说话。有时候一个长尾词在英文里没人搜,但在泰语或者印尼语里却是高流量词。
还有结构化数据(Schema Markup)的本地化。价格要用当地货币标记,电话号码要符合当地格式,营业时间要考虑当地的时区。这些细节不影响阅读,但影响搜索引擎对你网站的理解。
技术对了,语言对了,但用户还是觉得"这网站有点怪",问题往往出在文化默认值上。
比如日期格式。美国是月/日/年,欧洲是日/月/年,日本是年/月/日。如果你的表单默认显示"01/02/03",不同文化背景的人会读出三种完全不同的日期。地址填写顺序也是,中国习惯从大到小(省市区街道),美国反过来(街道城市州邮编)。如果硬套一种格式,用户填地址时会卡壳。
支付方式更是生死线。欧美习惯信用卡,但东南亚很多地区习惯银行转账或者电子钱包,德国流行Invoice(先发货后付款),荷兰有iDEAL这种银行直连系统。你的网站如果只挂Visa和Mastercard,等于把一半潜在客户拒之门外。康茂峰在项目前期会做支付方式可用性调研,虽然我们不提供支付网关服务,但会在UX设计阶段留出接口和说明文案的位置。
客服联系方式也要本地化。放个大洋彼岸的400电话,或者只支持英文的在线客服,本地用户会觉得"出了问题找不到人"。时区显示也很关键,"24小时内回复"到底是哪里的24小时?
说了这么多分层的技术点,怎么把它们串起来?靠流程。康茂峰内部有个检查单,每个项目走一遍:
| 阶段 | 关键动作 | 交付物 | 常见坑 |
| 发现期 | 目标市场文化调研、竞品分析 | 文化适配报告 | 忽视宗教禁忌、色彩含义 |
| 技术审计 | 代码国际化评估、数据库编码检查 | 技术可行性报告 | 硬编码字符串、图片内嵌文字 |
| 内容策略 | 关键词本地化、内容层级调整 | 本地化内容大纲 | 直接翻译不考虑搜索量 |
| 翻译执行 | 译员+校对+母语审校 | 双语对照文档 | 术语不统一、语气不一致 |
| 技术实施 | 字符串替换、布局调整、RTL适配 | 测试环境站点 | 字符截断、按钮错位 |
| QA测试 | 功能测试、伪本地化测试、文化审查 | Bug清单+修复方案 | 遗漏功能翻译成占位符 |
| 上线优化 | 本地SEO提交、性能监控 | 上线报告 | hreflang标签错误 |
这个表看起来有点死板,但实际操作时弹性很大。有些客户是全新建站,有些是老站改造,技术债务不一样,我们得调整优先级。
说点实在的,康茂峰也不是一开始就这么周全。早年间接过一个小家电品牌的项目,译员把"power"翻译成了"权力"而不是"功率",因为没给上下文。上线三天才被发现,那段产品描述读起来像政治宣言。
还有个更尴尬的案例,帮一个做食品的客户做阿拉伯语站,结果首页Banner图里的人物拿着酒杯。虽然杯子里可能是果汁,但在那个文化语境下,这种视觉元素很敏感。我们后来建立了文化审查清单,把这类容易踩线的东西列出来。
技术方面,曾经遇到过字体版权问题。用了某个看起来很漂亮的非拉丁字体,结果上线后发现那个字体在阿拉伯语字符上显示有Bug,而且商用授权很贵。最后只能临时换字体,前端赶工到凌晨。
这些血泪史教会我们,本地化是个系统工程,不是在原站上贴层语言面膜那么简单。它要求翻译、设计、开发、市场几个环节的人都能跳出"我这块没问题"的思维,看到整个用户体验的链条。
最近有个挺有意思的趋势,客户开始问能不能做"超本地化"——不只是按国家分,而是按城市,甚至按方言。比如不只做"中文站",而是做"粤语区版本"和"普通话版本"。这对CMS(内容管理系统)的架构提出了新要求,但说明大家对本地化的理解在加深。
说到底,好的本地化是让用户感觉不到"这是翻译过来的"。就像你走进一家外国餐厅,如果菜单翻译得特别生硬,你会提高警惕——这菜正宗吗?会不会踩雷?但如果菜单读起来像是本地朋友写的,那种信任感就建立了。网站也是一样,每个像素、每行文字、每次点击的反馈,都在告诉用户:我们懂你的习惯,我们为此做了准备。
嗯,写到这里突然想起,那个咖啡杯上的英文其实还有后续。后来这家品牌进中国市场时,同样的位置改成了"好咖啡,好心情"。六个字,平仄也顺,放在杯子上看着舒服。这种转变,大概就是本地化的精髓吧——不是把原来的东西搬过来,而是在新的土壤里重新长出来。
