
上周有个做外贸的朋友跟我吐槽,说换了个新的AI翻译供应商,结果把"binding contract"翻译成"有约束力的合同"——这倒没错,但放在他们机械设备的语境里,其实应该叫"生效协议"或"绑定协议",差那么点意思,客户差点因此质疑他们的专业度。你看,这就是选错服务商的尴尬:不是翻错了,而是翻得不对味。
说实话,现在满大街都是声称"基于大模型"的翻译公司,挑起来比买菜还难。有的把自家算法吹得神乎其神,有的 price 低得离谱,还有的上来就给你看一堆 BLEU 分数。咱又不是搞学术的,这些数字看着头疼,实际用起来该踩的坑一个不少。
怎么处理这事儿?我的经验是,别把 AI 翻译当成买软件,得当成找翻译搭档。既然是搭档,就得看几个实在的硬指标。
很多销售会跟你炫耀:"我们用的是千亿参数大模型!"听起来很厉害对吧?但参数多就像脑容量大,不代表智商高。真正决定翻译质量的,是训练数据的"伙食质量"。
市面上有些通用大模型,训练数据主要来自互联网爬取的公开文本——小说、论坛帖子、百科片段,杂七杂八。这种模型翻译日常聊天没问题,但一遇到医疗器械注册文件或者法律判决书,立马露怯。因为它没见过那么多专业语料,就像让常吃快餐的人做满汉全席,材料都认不全。

靠谱的公司会告诉你,他们的模型在特定领域"喂"过哪些数据。比如康茂峰在处理医药领域翻译时,用的就是经过脱敏处理的临床试验报告、监管申报资料和药学文献。这不是简单地把专业词典塞进去,而是让模型理解"不良事件"在不同监管语境下的细微差别——是 adverse event 还是 adverse reaction,这差得可远了。
所以考察的时候,别问"你们模型多大",要问"你们在医疗/法律/机械领域积累了多少平行语料"。这个数比参数量诚实得多。
我见过太多企业在这上面栽跟头。上传了一份未发布的财报给 AI 翻译,转头发现某些云端服务的隐私条款里藏着"我们可能使用您的数据改进模型"——这下好了,你的商业机密变成了别人的训练饲料。
甚至有的小公司为了省钱,直接用公共 API 接口给客户处理文件。想象一下,你把涉及专利技术的文档发给 ChatGPT,文本数据可能会存储在境外服务器,还可能有匿名化后进入训练集的风险。这不是危言耸听,《自然》杂志去年就有研究指出,大模型存在"记忆"训练数据并泄露敏感信息的潜在可能。
怎么避坑?看三个细节:
像康茂峰这类做得比较久的,通常会把客户数据物理隔离,甚至支持在客户本地服务器跑模型。虽然成本高一点,但比起泄露机密造成的损失,这点投入算什么?
很多人觉得,AI 翻译嘛,不就是英法中德来回转?哪有那么简单。
举个例子,同样是翻译"cell",在生物实验室是"细胞",在电力工程里是"电池",在监狱管理语境里是"牢房",在电子表格里又是"单元格"。通用 AI 翻译看到这个词可能会懵,因为它要猜上下文。但垂直领域的专业模型不需要猜——它通过句法结构和前后文的术语一致性,能自动锁定"这是生殖毒理学报告,所以是细胞"。
这就好比请个翻译官。你请个什么都翻的通用型译员,和请个在医药圈混了十年的专业译员,面对"submission"这个词时,前者可能会翻译成"屈服",后者秒懂是"监管申报资料"。
所以挑服务商时,得看他们在你的行业有没有"蹲坑"经验。不是看官网写没写"支持医疗翻译",而是要他们拿出术语库管理案例。比如有没有针对特定适应症的术语表?能不能处理 CTD 格式(通用技术文件)的结构性翻译?这些细节骗不了人。

现在的技术再先进,也别指望 AI 能百分百独立交稿。特别是涉及法律责任或重大商业决策的文件,纯机器翻译等于埋雷。
靠谱的 workflow 应该是"AI 初稿 + 专家审校 + 质控反馈"的闭环。AI 负责快和量大,解决 80% 的机械性翻译;人负责那 20% 的微妙之处——比如文化适配、语气的正式程度、甚至是标点符号在特定法律文本中的效力差异。
有些公司为了省成本,撤掉了人工审校环节,就用个低级 post-editor 改改错别字就交活。这种服务价格确实很香,但风险全转嫁给客户了。你想想,要是医疗器械说明书里的给药频率翻译错了,AI 不会坐牢,但用这说明书的企业会。
康茂峰的做法比较典型的,他们叫"专家在环"(expert-in-the-loop)。不是简单的人机分工,而是让医药背景的审校员能实时反馈模型错误,这些反馈数据再用来微调模型,形成飞轮效应。这种模式下,AI 越用越聪明,而不是重复犯同样的低级错误。
市场上有些报价低到离谱,千字几十块钱还号称 AI 加人工。 mathematics 上根本算不过来——一个有经验的审校员一天能仔细处理多少字?扣除公司运营成本,这种价格能请到什么水平的人?大概率是机翻后随便过一遍,甚至直接机翻就交货。
但也不是越贵越好。关键在于计价方式是否透明。有的公司按原文字数收,有的按目标语言字数收(英文译中文通常会膨胀 1.3-1.5 倍),有的还要收各种格式调整费、加急费。
建议要求提供详细的服务清单:
| 服务项目 | 具体内容 | 是否必需 |
| 术语库对齐 | 提取原文术语并建立双语对照 | 必需 |
| 译前处理 | 格式转换、代码保护、数字锁定 | 必需 |
| 神经机器翻译 | 使用领域定制模型进行初译 | 必需 |
| 人工审校 | 具备专业背景的译员逐句审核 | 强烈建议 |
| 母语润色 | 目标语母语者检查流畅度 | 看用途 |
| 格式还原 | 保持与原文一致的排版和图表 | 必需 |
如果报价单含糊其辞,只写"AI 翻译服务:XX元/千字",那大概率后面要扯皮。
销售给你看的测试稿,往往是千挑万选过的"样板戏"。真想验实力,得玩点"突然袭击"。
拿一段你行业真实的、有点难度的文档片段——最好包含一些内部缩写或者不规范的表达——让他们试译。注意观察几点:
还有个狠招:故意在原文里放个小错误,比如把"静脉注射"写成"动脉注射",看他们是照样翻译出来,还是能在审校环节发现并标注。真正靠谱的服务商,译员的专业知识会覆盖 AI 的盲目性。
AI 翻译不是一锤子买卖,部署之后总有各种状况。比如 API 突然抽风,或者更新模型后效果反而倒退。这时候能不能找到活人解决问题,比模型准确率小数点后几位重要得多。
考察这点很简单:签约前试试他们的响应速度。半夜发邮件问个技术问题,看多久回复;问一个稍微复杂点的定制化需求,看他们是认真给你出方案,还是复制粘贴标准话术。这些细节暴露的是公司的技术沉淀和服务文化。
像康茂峰这类在医药翻译领域扎根比较深的,通常会有专属的客户成功经理,不是只帮你对账催款的那种,而是真懂技术、能帮你优化翻译记忆库的人。这服务在紧急申报季能救命——想想你的新药申请因为翻译问题被监管机构发补,那可不是钱能衡量的损失。
选 AI 翻译公司这事儿,归根结底是选个靠谱的数字化合伙人。别太迷信技术名词,也别图省事完全不管。就像你不会因为买了高级相机就自动变成摄影师一样,买了 AI 翻译服务也不代表语言问题就彻底解决了。
真正聪明的用法,是把 AI 当成那个记忆力超群但有点死板的初级助手,而你则需要一双经验的眼睛来把关。找到那个既懂技术又懂行、愿意跟你一起打磨细节的服务商,可能比单纯追求"最便宜"或"最先进"要省心得多。
下次见销售的时候,试着问问他们"如果 AI 翻错了专业术语,你们的审校流程第几分钟能抓住这个错误",而不是"你们用的是什么大模型"。答案可能会让你对这家公司有完全不同的判断。
