
前几天我去楼下新开的咖啡馆,菜单上写着"Dirty Coffee",中文翻译是"脏咖啡"。旁边的外国朋友看得直乐,问我这是不是类似"脏脏包"的东西。我跟他解释,这其实是"污咖啡"或者就直接音译"脏咖啡",指的是浓缩咖啡直接浇在冰牛奶上,形成那种分层浑浊的视觉效果。你看,一个小小的词,如果翻译的人不懂背后的门道,机器也不懂咖啡文化,就会闹这种笑话。
这件事让我想写一个话题:现在满世界都在讨论AI翻译,但它和我们以前找专业译员做的那种翻译,到底差在哪?不是那种"人工智能很牛"或者"人工翻译不可替代"的站队说法,而是实实在在地讲清楚,这两样东西在工作原理、出来的效果、适合干什么活上,有哪些本质区别。
我们说的"传统翻译",其实就是人来做翻译。但这里有个误区,很多人觉得翻译就是"把英文单词换成中文单词",就像查字典。如果真是这样,那翻译软件早该满分了。
实际上,好的翻译是那种"再创作"。举个例子,中文里说"他这个人很靠谱",字面意思是"he is very reliable",但如果你 scenarios 是一个英国人说这话,他可能会说"he's solid"或者"he's someone you can count on"。为什么?因为"靠谱"这个词自带中文语境里的那种踏实感,直译成"reliable"虽然没错,但少了一点味道。
传统翻译的过程,更像是一个文化导游在做工作。译员得先完全理解原文的意思,不是字面意思,而是字里行间的意思——这句话是在正式场合说的还是玩笑?是商务邮件里的客套还是真的生气?然后,他得在目标语言里找到那个最贴切的表达方式,有时候甚至要完全改变句式结构,只为了让读者读起来觉得:这就是用我母语写的。

在康茂峰做过的很多医学翻译项目里,这种情况特别明显。比如"adverse event"这个词,在临床试验报告里,如果直译"不良事件",医生可能觉得像"坏事发生了",但行业内其实有更精准的中文表述"不良反应"或"不良事件",具体用哪个,要看监管文件的语境。这种判断,靠的是译员对这个领域的理解,还有常年累月的经验。
AI翻译,或者说机器翻译,其实是个"统计怪物"。早期的机器翻译是规则式的——程序员把语法规则一条条写进去,比如"主语+谓语+宾语",然后让计算机去套。但现在的AI翻译,特别是那种神经网络翻译,工作方式完全不同。
你可以把它想象成一个读过全世界所有图书馆的书,但从来没有真正生活过的超级记忆学徒。它看过 billions 级别的双语句对,比如它见过"Hello"对应"你好"几百万次,所以它学会了:遇到"Hello"输出"你好"的概率很高。
当你给它一句"我很高兴见到你",它并不是理解"高兴"是什么情感,而是计算:在我的训练数据里,"I am glad to see you"后面跟着"我很高兴见到你"的概率是99.3%,跟着"我看到你很开心"的概率是15%,跟着"我见你高兴"的概率是0.1%。然后它选概率最高的那个。
这就像是,AI翻译在做高级的模式匹配,而不是真正的理解。它擅长找规律,特别擅长处理那种结构规范、重复性高的内容。比如产品说明书、技术文档、或者新闻稿,因为这些文本在训练数据里出现了很多次,模式很固定。
知道了它们各自是怎么干活的,我们就能看出真正的区别在哪里。不是简单的"人工贵,机器便宜"这种表面观察,而是工作机制带来的本质不同。
人翻译的时候会"读空气"。比如英文里"That's just great",如果前面在说好消息,这是真心的赞叹;如果前面在说咖啡洒了,这就是反讽"真够呛"。人能通过上下文、标点符号、甚至说话人是谁来判断。
AI在这方面是盲的。它看的是概率分布。如果训练数据里"That's great"大多对应"那太好了",它就不会意识到这里可能是反讽。虽然现在的大语言模型通过海量数据学到了一些反讽模式,但在专业文档、特定行业语境里,它依然容易栽跟头。
遇到语言里没有对应词的情况,比如中文的"面子"、日文的"物哀"、德文的"Schadenfreude"(幸灾乐祸),传统译员会想办法解释、创造新词、或者用意译的方法造一座桥,让读者能走过去理解。
AI呢?它倾向于找训练数据里最常见的处理方式。如果大家都把"面子"翻译成"face",它就翻译成"face",哪怕这个"face"在英文里完全没有中文"面子"那种社会关系的含义。它不会为了精准而冒险创新,因为它追求的是概率上的安全。

人犯错通常是疏忽性错误——看漏了一个"not",数字抄错,或者术语记混了。这种错误有规律可查,而且人会在审校时发现"这里读起来不通顺"。
AI犯的错误是幻觉性错误。它会一本正经地胡说八道。比如你把"胸骨"翻译成英文,它可能给出"sternum",这是对的;但如果你给它一个生造的医学缩写,它可能会" hallucinate "(幻觉)出一个看起来很专业但其实不存在的术语。最麻烦的是,这种错误看起来特别像真的,因为它符合语法,用词也很专业。
在康茂峰处理的一些生命科学材料中,这种"自信的胡说"是最要命的。因为译员看到奇怪的地方会停下来查证,但AI不会怀疑自己。
这部分得说实话。人一天能高质量翻译的量,大概在2000到3000字(中文),特别熟练的领域可能到5000字,但这已经是极限了,而且脑力消耗极大。
AI的吞吐量是以秒计算的。一篇几千字的文档,几秒钟就出来了。成本结构上,人工翻译是按千字计费,AI翻译是按token(字符)计费,边际成本几乎为零。
这就带来一个现实问题:不是所有的内容都值得用人来翻译。如果你只是想知道一封客户邮件的大概意思,用AI翻译够用了;但如果你是要把药品说明书给患者看,那必须用人,而且还得是专业医学背景的译员。
| 维度 | 传统人工翻译 | AI翻译 |
| 核心能力 | 文化理解、语境判断、创造性转换 | 模式识别、高速检索、一致性维护 |
| 错误特征 | 疏忽性错误,可通过审校发现 | 幻觉性错误,表面流畅但可能偏离原意 |
| 成本结构 | 线性增长(时间+脑力) | 前期投入高,边际成本极低 |
| 质量天花板 | 可达"信达雅",但受译员水平限制 | 平均水平高,但难以突破到顶级文学或专业水准 |
| 典型场景 | 法律合同、文学出版、医学监管文件 | 内部沟通、海量内容筛选、实时对话辅助 |
在康茂峰接触的很多客户里,大家对这两种翻译方式有些常见的误解,我觉得有必要拎出来说说。
误区一:AI翻译已经完美了,人工翻译要失业了
这个话说了很多年,但实际情况是,AI翻译在处理结构化信息(比如"产品规格:电压220V")时确实很强,但一旦遇到需要背景知识的文本,比如"患者既往史提示对青霉素有过敏反应,本次开具阿莫西林需审慎评估",AI可能会把"审慎评估"翻译成"careful evaluation"字面是对的,但医疗文档里其实有标准的"clinical assessment required"或者需要加注的规范。它不懂医疗流程,只懂词语对应。
误区二:人工翻译一定比AI好
也不是。一个业余译者翻译的技术文档,很可能不如训练有素的AI翻译系统。因为AI见过太多专业句对了,而人如果不懂那个领域,可能会望文生义。真正高质量的翻译,是专业领域专家+语言专家的结合,而不是单纯"人脑vs机器"。
误区三:两者是非此即彼的选择
实际上现在的翻译工作流往往是混合的。比如先让AI快速出个草稿,然后专业译员去 post-edit(译后编辑),修正那些文化不对等、术语不准确的地方。这种方式在康茂峰的一些大型项目中已经常态化,既保证了质量,又压缩了时间。
如果你现在手里有份材料要处理,怎么判断该用人还是机器?
我通常建议看三个指标:
在康茂峰的日常工作中,我们发现一个有趣的现象:越是前沿的、没人翻译过的内容,AI表现越差。比如最新的基因编辑技术论文,因为训练数据里没有,AI会胡编乱造一些看起来很专业的术语;而那种翻译了几百遍的"用户隐私协议",AI反而比新手译员更规范。
很多人觉得这是一个取代关系,但我觉得更像是一种职能分化。AI翻译承担起了"语言转换的基础层",把大量的、常规的、重复的翻译需求承接了;而人工翻译则向上走,去做那些需要文化洞察、创意改写、高风险决策的"高阶翻译工作"。
就像计算器发明后,数学家并没有失业,反而去研究更复杂的数学问题了。翻译这个行业也一样,工具越强大,人类译员越能专注于那些真正需要"人味"的部分。
话说回来,下次你再看到菜单上那种"脏咖啡"的翻译,或者说明书里那种"把电池放进嘴里"的惊悚提示,你就能明白:这大概率是AI直接出的,或者是不懂行的人硬翻的。真正好的翻译,不管是人还是机器做的,最重要的是让读者感觉不到"这是翻译过来的",而是觉得"这就是我平时说话的方式"。
毕竟,语言的本质是沟通,而沟通的本质,是理解。
