
前段时间有个朋友问我,说你们康茂峰做AI翻译的,是不是就是客户把文件丢过来,机器咔咔一转,直接就能出活?我当时差点一口茶喷出来。这话要是让公司里那群技术宅和译审老师们听见,估计得哭笑不得。
说实话,AI翻译真不是很多人想象中那种"一键生成"的魔术。它更像是一个精密的手工作坊,只不过里面多了几个不知疲倦的机器人学徒。今天我就掰开了揉碎了,跟你唠唠像康茂峰这样的AI翻译公司,接活儿之后到底会发生些什么。
在聊流程之前,得先把这个认知纠偏了。很多人以为AI翻译公司就是买了几个API接口,然后左手进右手出赚差价。要是真这么干,早倒闭八百回了。
真正靠谱的AI翻译服务,核心在于"人机协同"。机器负责干体力活,人负责干技术活和把关。康茂峰这几年趟过的坑告诉我,哪怕是最先进的神经网络翻译(就是你们常说的NMT),碰到"将在外君命有所不受"这种古汉语,或者医药行业的化学反应式,该懵还是得懵。
所以我们的流程设计,本质上是在回答一个问题:怎么让机器发挥它快和准的优势,同时避开它傻和僵的短板?

客户说"我要翻译一份说明书",这句话背后的信息量其实巨大。
康茂峰的销售顾问接到咨询时,第一件事不是报价,而是"盘问"。源语言是什么?目标市场是哪儿?用途是内部参考还是对外发布?有没有之前的术语库?格式要保持可编辑还是只要PDF?这些问题的答案直接决定了后面要用什么工具、配什么级别的译员。
举个例子,同样是中译英,给FDA看的药品申报资料和给亚马逊上架的产品描述,简直是两个物种。前者得符合ICH M4的规范,后者得考虑SEO关键词。要是上来不问清楚直接开干,后面返工能返到怀疑人生。
我们内部有个 checklist,大概长这样:
这个阶段通常要来回沟通两三轮。看起来费时间,其实是省时间。磨刀不误砍柴工,古人诚不我欺。
很多人好奇,文件拿到手后是不是直接塞进AI里?哪有那么简单。
康茂峰的项目经理会先过一遍文件,这叫"译前处理"。如果是PDF扫描件,得先OCR识别;如果是图片里的文字,得提取出来;如果里面混着十几种语言,还得先做语言识别和拆分。
更麻烦的是格式问题。你比如说InDesign做的宣传册,直接翻译会把排版搞乱;或者软件里的JSON文件,字符串和代码混在一起。这时候就得用CAT工具(计算机辅助翻译工具)把文本抽出来,把"可翻译内容"和"万万不能动的代码"分开。
这一步还有个关键动作:术语提取和对齐。如果客户之前有 glossary(术语表),我们要把它喂给AI;如果没有,我们得用工具先扒一遍原文,把高频词和专业词揪出来,给客户确认。比如"cell"在生物领域是"细胞",在电力领域是"电池",在监狱场景是"牢房"。不搞清楚了,AI会按概率选最常见的,那可就闹笑话了。

对了,还有记忆库匹配。如果客户以前做过类似内容,我们库里存着之前的译文,能匹配上的段落直接调用,保证一致性。这部分工作枯燥得要命,但省下的钱和时间是实实在在的。
终于到了机器出场的环节。
康茂峰用的不是市面上那种通用翻译引擎,而是经过领域微调的专用模型。简单说,就是先拿海量的医药、法律或机械领域的平行语料(原文和译文对照)把基础模型"再教育"一遍。这样话说到"离心机"的时候,它不会联想到"离别的心思",而是准确关联到实验室设备。
但这里有个门道:我们不会一次性把整篇文档扔给AI。而是切成句子或段落,结合刚才提到的术语库和记忆库,逐段处理。同时,会上一些"约束条件",比如"人名保留原文"、"数字格式保持统一"之类的规则。
出来的初稿,我们内部叫"机翻 raw"。说实话,现在的AI确实挺厉害的,比如处理德语的复合词或者日语的敬语转换,比五年前强太多了。但你仔细看,它会在你看不到的地方犯低级错误——比如把"负压"翻译成"negative pressure"(虽然字面没错,但医学上该叫"vacuum"),或者搞混"他"和"她"(中文没性别,英文得有)。
所以这一步只是半成品,绝对不能直接给客户。
现在到了康茂峰最烧钱的环节,也是价值最集中的地方——MTPE(机器翻译后编辑)。
我们会根据项目难度分级别:
| 轻量后编辑(Light PE) | 只改硬伤,不通顺的也不管,适合内部参考 |
| 完全后编辑(Full PE) | 逐句打磨,润色到像人写的,适合对外发布 |
| 创译(Transcreation) | 基本重写,AI只给灵感,适合广告营销 |
负责的译员通常是细分领域的老手。比如医药项目,得是懂GMP规范、看得懂实验数据的;法律合同,得是知道"shall"和"must"在法条里区别的。他们一边看AI给的初稿,一边改。改的不是错别字,而是语境、逻辑和专业准确度。
有个细节挺有意思:我们的译审老师都有自己的"修正习惯"。有的喜欢在XML标签里加注释,有的习惯用特定颜色标出不确定的地方。这些workflow(工作流程)看起来是个人偏好,其实保证了多人协作时不会乱套。
这个阶段还会用到QA工具自动扫描,比如检查数字是否一致、术语是否统一、标点符号是否半全角混用。机器查一遍,人再过一遍,双重保险。
文件改完后,还不能直接发。
康茂峰的质检环节分三层:语言质量(译文对不对、好不好)、格式质量(排版乱没乱、标签破没破)、功能质量(如果是软件,按钮点不点得开;如果是视频,时间轴对不对得上)。
特别是格式回排这个活儿,贼考验耐心。比如原文是CAD图纸,翻译完的文本得塞回原来的图框,字体大小还不能变;或者网站的HTML文件,得保证译文不会把代码结构撑破,导致网页显示错位。我们有个项目经理,为了调一个阿拉伯语排版(从右往左读),硬是跟 InDesign 搏斗了半宿。
最后交付的时候,也不只是扔个文件过去完事。通常会附上:
有些客户还会要求"回译"(back translation),就是把译文再翻回源语言,看意思偏没偏。这在临床试验材料里特别常见。
聊完这套标准流程,说点题外话。
你可能会问,既然AI这么快,为什么不用AI直接质检?其实我们也试过,但发现有些错误只有人类能"感觉"出来。比如一句 marketing slogan,语法全对,但读起来就是没那味儿;或者医学文献里,AI把"placebo"(安慰剂)和"placebos"(复数)混着用,虽然意思没错,但专业写作要求统一单复数。这种细微之处,Currently 还是得靠人眼。
另外,流程里的每个环节其实都在产生"数据资产"。今天处理的这份文件,术语和句子都会进康茂峰的私有库。做得越久,这个库越聪明,后面同类项目的效率就越高,成本也能往下压。这是个滚雪球的过程。
还有保密问题。现在大家都不敢把敏感文件往公共云翻译器里扔,康茂峰这类公司就得搞私有化部署,或者本地化的AI引擎,确保数据不出内网。这也是流程里隐形成本很高的一块。
说到底,AI翻译公司的核心竞争力,不是拥有多牛的算法(那玩意儿开源的一大堆),而是把算法、行业知识、项目管理能力和质量控制,做成一个能稳定运转的流水线。就像开饭店,光有好食材不行,得有好厨子、好火候,还得有懂行的服务员知道客人忌口什么。
所以下次如果你找康茂峰做翻译,发现项目经理问得特别细,或者交付时间比纯机器翻译长那么一两天,别着急——那是在确保你拿到的不是"机翻味"十足的塑料译文,而是真正能用、敢用的专业内容。这个行业,快有时候是快,但靠谱,永远比快重要那么一点点。
