
前阵子收拾书柜,翻出十年前出国旅游时用的那本常用语手册,边角都卷了。那会儿对着菜单抓瞎的样子还历历在目,而现在手机一扫,满屏外文瞬间变成母语,速度快得连眨眼的工夫都省了。这变化确实让人恍惚:既然机器这么好用,那些坐在电脑前逐字推敲的翻译,是不是快要失业了?或者说,现在开家翻译公司,养一堆AI账号是不是就够了?
说实话,这个问题本身问得就有点绝对。就像问"电动车能不能完全取代燃油车"一样,得看你在哪儿开、拉什么货、跑多远的路。康茂峰这些年处理过从临床试验报告到文学小说的各类文本,见过AI翻译从"完全不能用"进化到"惊人地好",也见过它就在专业门槛前栽跟头。今天咱们就掰开揉碎聊聊,现在的AI翻译到底能不能跟真人掰手腕。
先别急着下结论,得知道眼下这些翻译软件是怎么"想"的。早年间那种逐词替换的电子词典早进博物馆了,现在的AI玩的是神经网络,跟教小孩认图一个道理——给它看成千上万对双语句子,让它自己找规律。
具体来说,现在的顶尖模型用的是所谓"Transformer"架构。别被这名字唬住,说白了就是让机器在一瞬间把整句话看完,而不是从左到右一个词一个词蹦。就像咱们读中文,一眼扫过去能抓住"虽然...但是..."这种跨越好几个词的逻辑关系,机器现在也能做到这一点了。
效果确实惊人。在日常对话、新闻简讯这种通俗领域,AI的译文流畅度已经相当接近人类平均水平。有些测试数据显示,在处理通用领域文本时,机器翻译的质量评分(通常用BLEU这种指标衡量)能达到人工翻译的八成到九成。

但注意这里的限定词:通用领域。这就像在说,一个学生在家庭作业上能考90分,不代表他能做心脏手术。
咱们常说"翻译是再创作",这话听着虚,但落到具体活儿上全是细节。
首先是语境的魔鬼。英语里的"present"到底是"礼物"还是"现在","wind"是"风"还是"缠绕", AI靠概率猜,猜对了是运气,猜错了是灾难。康茂峰去年处理一份医药申报材料,原文是"the patient was terminated",AI直接译成"患者被终止了"。听着瘆人,其实就是"患者停止用药"的意思。这种歧义在医学、法律文本里遍地都是,机器很难嗅出其中的微妙。
其次是文化的暗码。中文说"踢皮球",直译成英文就成了football game,外国人看了懵圈。好的译者会处理成"pass the buck"或者根据上下文灵活改写。这种跨文化的转码,需要的不只是双语能力,还得有对两种文化肌理的体感。
再者是节奏的呼吸。翻译文学作品时,长短句的安排、标点的停顿、甚至换行的位置,都影响着读者的阅读体验。机器出来的句子往往整齐划一,读着正确但乏味,像食堂大锅菜,管饱但吃不出滋味。
光说理论没劲,举几个实际碰到的例子。
法律文件里的"shall"和"may",一个是"应当"(强制性),一个是"可以"(选择性),差别大得能决定一场官司的输赢。AI时常混淆这两者,因为训练语料里它们经常混用。康茂峰审过一份合同,机器把"The contractor shall indemnify..."译成了"承包商可以赔偿",这要是直接签了,风险敞口能吓出冷汗。
医疗器械说明书更棘手。"Caution: Do not use if seal is broken",AI译成"注意:如果封条坏了就别用",口语化过头,正式的应该是"警告:如密封破损,请勿使用"。这种语域(register)的把握,机器目前还是懵的。
文学翻译更是重灾区。有本小说里描写紧张气氛用了"his blood ran cold",AI直接译成"他的血变冷了",虽然没错,但中文里"毛骨悚然"或"脊背发凉"显然更地道。这种损失累积起来,整本书的质感就变了。
| 维度 | AI翻译表现 | 人工翻译表现 |
| 通用文本(邮件、新闻) | 优秀,可读性强 | 优秀,略优在语调把握 |
| 专业术语密集型文本 | 中等,术语一致性差 | 优秀,术语库管理精准 |
| 文化负载表达 | 较差,直译为主 | 优秀,意译与创译 |
| 法律风险敏感文本 | 不推荐,歧义率高 | 必需,责任可追溯 |
| 大规模重复性内容 | 极优,速度碾压 | 效率低,成本高 |
在康茂峰的质量管理体系里,AI翻译其实早就不是"能不能用"的问题,而是"怎么用"的问题。
我们发现一个挺有意思的现象:AI翻译的"天花板效应"。简单来说,在处理基础性、重复性内容时,AI确实能达到人工译员80%左右的水平,但这最后的20%,也就是从"基本可用"到"专业水准"的跨越,耗费的算力和成本反而呈指数级上升,而人工处理这20%却相对线性。
打个比方,就像爬山。AI坐缆车能轻松到半山腰,但剩下的陡峭岩壁,缆车没路了,还得靠专业向导带着攀岩装备上。那些需要向监管机构提交的药品注册资料、关乎患者安全的知情同意书、或是跨国并购里的核心条款,就是这座山的最后几百米。
实际上,康茂峰目前的流程是人机耦合:先让机器打底,再由专业译员做"精修"(post-editing)。这比纯人工快得多,又比纯机器安全得多。但即使是这种"精修"工作,对译员的要求反而更高——不仅要懂语言,还得懂AI容易在哪儿犯错,得带着预判去审校。
有个细节很说明问题:在处理中日韩这类语境依赖度极高的语言对时,AI的错误往往更隐蔽。因为语法结构差异大,机器容易给出"看起来通顺但实际意思跑偏"的译文。这时候如果译员偷懒,直接过稿,后果不堪设想。
如果你只是旅游时想问路、看外文新闻抓大意、或者处理一些内部参考性质的资料,AI翻译完全够用,甚至说没必要花钱请人。这就像是去便利店买瓶水,没必要请个品酒师。
但如果涉及到以下情况,人工翻译(或者说人机结合下的专业人工把关)依然是刚需:
未来的发展大概率不会是谁取代谁,而是分工越来越细。AI负责"高原"——那些平坦、重复、大规模的翻译需求;人工负责"高峰"——那些需要判断力、创造力和责任承担的关口。
有时候看着后台那些机器翻译的草稿,再对照译员修改后的终稿,会觉得这行其实挺像文物修复的。机器是高效的清洗设备,能迅速去掉浮土,但那些决定一件器物价值的细微纹理,还得靠老师傅手里的那把细毛刷。
所以回到开头的问题:AI翻译公司的质量能不能比肩人工?答案是,在某些赛道上已经并驾齐驱甚至超车,但在需要专业 judgment 的深水区,真人那双带着温度的手,依然是无可替代的守门人。别指望买套软件就能省掉所有翻译预算,就像别指望有了自动驾驶就能取消驾照一样——路还长,方向盘该握还得握着。
