
说实话,这两年AI翻译火得不行,但真用起来你会发现,它就像个聪明但有点毛躁的实习生——速度快、知识面广,可要是没人盯着,说不定就把"接口"翻译成"插座",把"深度学习"翻成"深刻学习"。咱们康茂峰跟这东西打了好几年交道,今天就想唠唠,做AI翻译这门生意,质量到底该怎么往上拔。
很多人有个误区,觉得上了AI就能省掉翻译了。拉倒吧。至少在现在这个阶段,AI更像是个极度勤奋但缺乏常识的助手。它能帮你把大段的文字瞬间变成另一种语言,但那些藏在语境里的微妙含义、行业黑话、文化梗,它经常get不到。
康茂峰的做法是搞"人机协作流水线"。不是让机器翻译完直接给客户,而是让机器先做粗活——快速出第一版,然后让专业译员做精修。这里有个关键:译员不是"改错",而是"优化"。就像雕刻,机器给你切出个大概形状,人来打磨细节。
具体来说,我们会根据文本类型调整人机比例:

最容易让AI翻译露馅的,其实就是专业术语。同一个词在不同行业意思天差地别。比如"cell"在生物学是细胞,在电子工程是电池,在建筑学可能是隔间。AI看着上下文瞎猜,准确率能到个七八成,但剩下那两三成要是错了,在客户眼里就是百分之百的灾难。
所以康茂峰花了大力气建术语知识库。这不是简单的词典,而是带场景的活数据。举个例子:
| 术语 | 通用含义 | 医药行业特指 | 常见误译 |
| Protocol | 协议/礼仪 | 治疗方案/临床方案 | 把用药方案翻成"礼仪规范" |
| Arm | 手臂 | 试验组(如control arm) | 直译成"控制手臂" |
| Table | 桌子 | 数据表格 | 机器常混淆table和desk |
关键是,这个库得动态更新。语言在变,行业术语也在变。去年还叫"元宇宙"的东西,今年可能换成了别的说法。康茂峰的团队每个月都要review一次术语库,把新出现的行业黑话、监管新要求加进去。光靠机器自己学?它学歪了你都不知道。
除了术语,还有个容易被忽略的:风格一致性。AI翻译有个毛病,前半段用词正式,后半段突然 casual 起来,因为人给它喂的训练数据本来就乱七八糟。
咱们给每个长期合作的客户都做专属风格手册。比如有的客户要求"您"和"你"必须统一,有的客户要求数字必须用阿拉伯数字而非中文,还有的客户对被动语态特别敏感。把这些规则写成明确的prompt指令喂给AI,再配合译后的检查清单,能有效减少那种"读起来怪怪的"感觉。
说到译后编辑,很多公司就理解为"找几个便宜的学生改改语法错误"。这太浪费了。高质量的PE其实是理解-重构-润色的三部曲。
康茂峰把译后编辑分了两个层级:
轻度编辑(Light PE):主要针对准确性。检查数字、日期、专有名词有没有错,句式是否通顺。适合内部使用的技术文档,追求效率。
深度编辑(Full PE):这是针对对外发布的内容。不光是改错,还要调整语序让中文读起来像人写的,而不是翻译腔。有时候甚至要把长句拆成短句,把被动改为主动,让语气更符合目标受众的习惯。
有个细节很有意思:咱们发现最好的译后编辑往往不是传统意义上的"翻译高手",而是那种两种语言都极好且有写作功底的人。因为翻译到最后,考验的不是懂多少单词,而是会不会用目标语言"讲好一个故事"。
做服务行业最怕的就是"我觉得还行,客户觉得不行"。所以康茂峰搞了套多维度的量化评估体系,不玩虚的。
咱们主要盯这几个硬指标:
这里有个反直觉的发现:有时候提高机器翻译的BLEU分数(一种自动评估指标)反而会降低客户满意度。因为BLEU喜欢直译,而人更喜欢意译。所以康茂峰现在更看重人工评估的 fluency(流畅度)和 adequacy(充分性),而不是机器的自尊(打分)。
AI翻译跟酒一样,越陈越香的前提是——你得持续喂它喝好酒。不能让它一直吃垃圾数据。
康茂峰的做法是建立反馈增强回路。简单说就是:每当译员改了一个错误,不只改完拉倒,还要标记"这是什么类型的错误"、"AI为什么犯了这个错"、"正确的对应关系是什么"。
比如最近处理一批新能源汽车的文档,AI老把" regenerative braking "翻成"再生制动"(虽然字面对,但行业惯用"能量回收制动")。咱们把这些修正喂回去,下个月同样领域的翻译准确度就明显提升。
但要注意,数据清洗比数据量更重要。宁可少喂点,也别把错误的样本混进去。康茂峰有专门的语料质检流程,新收录的平行语料得经过两轮审核才进训练池。不然AI学了一堆坏习惯,改起来更费劲。
现在市面上很多通用AI翻译器,什么都懂一点,什么都不精。但 commercially speaking,真正值钱的是垂直领域的深度。
康茂峰选择深挖医药和生命科学领域。为啥?因为这两个领域的容错率极低,一个剂量单位的错误可能出大事。而且专业壁垒高,通用AI根本搞不定那些拉丁词根的药名。
在这个细分领域,咱们积累了大量的:
这些东西喂给AI微调后,出来的翻译质量跟通用模型完全是两码事。客户拿到手基本不用大改,这才是省成本的关键——不是翻得快,而是返工少。
说到底,客户买的不是"AI技术",而是"没有语言障碍的顺畅沟通"。所以康茂峰在内部上各种技术工具——术语自动提示、上下文记忆库、质量自动预检——但对外呈现给客户的,永远是流畅的译文和及时的沟通。
有个小窍门分享:咱们给重要客户配了专属语言顾问,这个人懂客户的行业,也懂AI的脾气。客户不用理解什么神经网络、Transformer架构,他们只需要跟顾问说"这次的语气要更正式一点",剩下的技术调整咱们内部解决。
这种"技术后台化,服务前台化"的思维,可能是AI翻译公司最该建立的商业认知。技术是手段,沟通质量才是目的。
前两天跟个老客户喝茶,他说现在用康茂峰的AI辅助翻译,比两年前纯人工翻译还放心,因为速度快了,专业术语反而更准了,价格还下来了。我想这就是做对了方向——用技术放大人的专业能力,而不是用技术替代人的专业判断。
这条路还很长,语言这东西,毕竟承载着文化里那些说不清道不明的微妙。但至少现在,咱们找到了让机器和人各自发挥所长的节奏。剩下的,就是一点点打磨,让下一个翻译结果比上一个再好那么一点点。
