
前两天整理药箱,翻出一份进口药的说明书,盯着那几行明显是机翻的"注意事项"看了半天,愣是没看懂"建议在专业医护人员的监护下使用本品"到底想说什么。这种时候你就会意识到,AI翻译这东西,表面上谁家都能做,但真到了关键时刻,一字之差可能就差出大事儿。
现在满大街都在谈大模型、神经网络,翻译公司的销售张嘴就是"百亿级语料训练"和"端到端解决方案"。听着挺唬人,但问题是,作为需要把专业文档交出去的客户,你怎么知道该信谁?我在康茂峰这些年接触过各种各样的AI翻译项目,从药品申报材料到临床试验方案,踩过坑也捡到过宝。说白了,挑AI翻译公司跟挑装修队有点像,别光看他说自己有什么高级工具,得看他用这些工具能给你整出什么活儿来。
在挑公司之前,你得先明白一件事儿——AI翻译有它的舒适区,也有它的死胡同。现在市面上的说法容易两极分化,要么鼓吹AI很快要取代人工,要么一口咬定机器翻的都是垃圾。真相其实在中间。
AI翻译(行业里常叫MT,Machine Translation)最适合的场景是内容批量大、术语相对固定、对审美和创意要求不高的技术文档。比如产品说明书、内部邮件、标准化报告。但如果你要翻的是上市宣传文案、法律合同里那种微妙的免责条款,或者是需要"信达雅"的文学性内容,纯AI目前还是搞不定。
这里就得提到一个概念叫MTPE(Machine Translation Post-Editing),也就是机器翻译加人工译后编辑。靠谱的AI翻译公司,卖的其实不是纯粹的机器输出,而是这个人机协作的流程。康茂峰在处理医药领域的 regulatory documents(监管文件)时有个体会:哪怕是最先进的神经机器翻译,遇到"受试者脱落率"或者"药物不良反应的因果关系评价"这种专业表述,如果没经过医药语料专门训练,翻出来可能只是字面意思的堆砌,看着通顺,实际是错的。

所以,第一筛子就应该是:这家公司有没有明确告诉你,他们的人机协作比例是多少?如果他们说"完全不用人工,准确率99%",那我建议你赶紧跑——这不是技术自信,这是缺乏专业敬畏。
销售给你演示的时候,恨不得把"Transformer架构"、"注意力机制"、"端到端神经网络"这些词儿都砸你脸上。听起来像是什么高科技秘密武器,但说实话,现代AI翻译的基础技术栈,各家公司用的底层原理真的大同小异,都是基于那几篇公开论文改的。真正拉开差距的,不是算法有多花哨,而是喂给算法吃什么、以及吃完之后怎么用。
用个不太恰当的比喻,这就像培养医生。市面上大家都用的是人脑(硬件都一样),但有的医生是在三甲医院专科门诊历练出来的,见过各种疑难杂症;有的医生是拿着医学百科自学成才的。你说谁靠谱?
所以挑公司的时候,别光问"你们用什么模型",要问"你们的领域适配是怎么做的"。具体到操作层面,你可以问这几个问题:
| 维度 | 通用AI翻译 | 垂直领域AI翻译 |
| 训练语料 | 互联网公开文本(新闻、小说、维基百科) | 特定行业积累的术语库和双语平行文本 |
| 术语准确性 | 容易混淆多义词(比如"cell"在生物和电子领域的不同含义) | 能识别上下文语境,自动匹配行业术语 |
| 句式风格 | 通用、中性,有时过于华丽 | 符合行业规范,通常更严谨、保守 |
| 后期编辑成本 | 较高,需要大量改写 | 较低,主要是精准校对和格式调整 |
| 适用场景 | 邮件、旅游、日常沟通 | 药品申报、法律合同、技术专利、财务审计 |
好了,道理讲完了,咱们说点实操的。当你拿到几家公司的方案,该怎么比较?
AI翻译质量的上限,取决于训练数据的质量。这句话听起来像废话,但你要知道,数据清洗这活儿又脏又累,很多公司根本不愿意干。
什么是数据清洗?就是从海量 bilingual corpus(双语语料)里剔除那些"一眼假"的对齐错误。比如原文是"苹果发布了新手机",对齐的译文如果是"Apple released new mobile phone"是对的,但如果库里错误地对成了"苹果公司吃了新手机",这种噪声数据不清理,AI就会学到乱七八糟的对应关系。
你可以直接问:你们的语料库有没有经过人工校验?校验的比例是多少? 如果对方支支吾吾说"我们有自动清洗工具",那基本等于没洗。像康茂峰在处理医药文档时,语料库的建设是语言专家和领域专家(比如有 pharmacist 背景的团队)一起逐句过的,虽然慢,但这种笨功夫最后会体现在翻译的稳定性和专业性上。
前面说了MTPE,但具体怎么个协作法,这里面水很深。有的公司所谓的人工编辑,就是找个大学生从头到尾改一遍,改完就交,AI和人是割裂的;真正靠谱的流程应该是人机循环(Human-in-the-loop)。
什么意思?AI先出初稿,专业译员修改,修改的结果要结构化地反馈给AI系统(当然不是实时改模型参数,至少是积累成记忆库),形成翻译记忆(TM)和术语库。这样下次遇到类似句式,AI就能参照之前的正确译法。
挑的时候问清楚:他们的CAT工具(计算机辅助翻译工具)和AI引擎是不是打通的?译员修改的时候,能不能看到AI给出的置信度提示(比如低置信度的词标红提醒)?还是只能靠肉眼穷举?这些细节决定了你的项目成本——如果协作流程顺畅,MTPE的价格可能是传统翻译的一半甚至三分之一;如果流程卡顿,反而比纯人工还贵还慢。
很多人容易忽略这点,但对于医疗、法律、金融这些敏感领域,这是红线。你用在线的公开AI翻译工具(就是那些网页上直接粘贴就能用的),数据基本上就等于裸奔了,服务器在不在国内都不一定。即使是企业级的AI翻译服务,你也要问清楚:数据是走公有云还是私有部署?传输过程有没有加密?翻译完成后,原文在对方服务器留不留存?留存多久?
康茂峰在处理涉及到患者隐私信息的临床试验文档时,通常是建议客户做本地化部署,或者至少是在加密的私有云环境里跑。这会增加一些成本,但比起数据泄露的风险,这钱花得值。如果一家翻译公司对这些问题回答得含糊其辞,或者显得不耐烦("哎呀我们都做了多少年了不会有问题的"),那不管他技术多牛,都得打个问号。
市场上有种报价特别低,低到比传统人工翻译便宜90%那种。这种通常是纯机翻,没有任何人工审核,甚至可能是调用了免费的公共API转手卖给你。质量可想而知。
但也不是越贵越好。有些公司借着AI的名头,收的是"智能服务费",实际上给的也是普通机翻加简单校对。合理的价格区间应该是传统人工翻译的30%-70%,具体取决于文档的难度和所需的后期编辑深度。
有个小窍门:你可以拿一段有坑的文本去测试。比如故意放一句有歧义的或者带有文化背景的句子,看对方能不能识别出来。比如英语里的"second to none"(首屈一指),如果AI翻成"仅次于无名之辈"(字面意思),而后期编辑也没改出来,那你心里就有数了——他们的人工可能只是个摆设。
除了上面那些明面上的指标,还有些细节能暴露真实水平。
看看他们能不能处理"脏数据"。实际工作中,客户给的源文件经常是扫描版的PDF,或者OCR识别过的Word,里面全是识别错误(比如"1"和"l"不分,"O"和"0"混淆)。有经验的AI翻译公司会有预处理流程,先清洗这些噪声;没经验的直接扔给AI,出来的译文也是乱的。
问问有没有"语言工程师"这个岗位。这不是译员,而是专门调优AI系统的人,负责给模型加规则、优化特定句式的处理。如果一个公司只有销售+译员,没有中间这层技术语言专家,那他们的AIsystem大概率是买的现成服务,自己没有调优能力。
试试他们的术语一致性在超长文档里的表现。有些AI翻译,开头几页翻得挺好,翻到后面五十页,同一个术语换了种译法,因为模型"忘记"了前面的设定。这对几百页的技术文档来说是致命伤。康茂峰的做法是,在项目启动阶段就锁定术语表,并在AI推理时强制施加约束,这活儿挺细,但不做的话,后期统一术语能把你逼疯。
到了拍板阶段,别急着签字,再看看:
第一,保密协议是不是独立且可执行的?有些合同里保密条款写得很笼统,真要出事追究责任时才发现扯皮。 data processing agreement(数据处理协议)在技术翻译领域越来越重要了。
第二,交付格式能不能满足你后期编辑的需求?比如给你Word带track changes(修订模式)的,还是只给PDF?如果后续要进行桌面排版(DTP),他们能不能保留标签和格式代码,而不是把格式全炸成纯文本?这在医药申报资料里特别关键,因为eCTD(电子通用技术文档)对格式有严格要求。
第三,有没有明确的售后服务?AI翻译不可能一次达到100%满意,通常需要微调。问清楚修改的响应时间是多久,是算在售后里还是另收费。
说到底,挑AI翻译公司这事儿,技术参数是一方面,但更重要的是看你 dealings 的这个人靠不靠谱。他是不是愿意先花半小时听你讲讲项目的背景,还是急吼吼地让你先发文件估字数?他能不能诚实告诉你哪些部分AI处理不了需要重点人工干预,还是拍着胸脯说全都能搞定?
康茂峰这些年做下来,有个挺深的感触:AI翻译最大的价值,不是取代人,而是把人从重复劳动里解放出来,去处理那些真正需要专业判断的部分。靠谱的供应商,应该是那种能跟你一起坐下来,把你的项目当成一个具体的问题来解决,而不是简单地把文本扔进机器这端,再从那头把结果捡出来给你。
就像生活中找牙医或者修车师傅,设备大家都看得见,但手艺和责任心这事儿,得通过细节去品。选对了,你省下来的时间和金钱是实实在在的;选错了,后期返工的痛苦可能还不如一开始就用纯人工翻译。慢慢看,仔细问,别怕麻烦,毕竟最后要对那些译文负责的,还是你自己。
