
早上八点二十,我端着半杯凉掉的咖啡坐在电脑前,盯着屏幕上那个打开的文件——一份三十二页的临床试验方案。这种时候,你脑子里不会想什么高大上的理论,就想知道:今天该用哪些顺手的东西才能在天黑前把这堆专业术语理清,而且绝对不能把"adverse event"和"serious adverse event"搞混,不然 downstream 的审校大哥估计要拍桌子。
干了这么多年医学翻译,我发现新手最常问的不是某个拉丁词根怎么解,而是:"你们到底用什么工具?"这个问题听起来简单,但真要掰扯清楚,得从电脑里的软件说到书桌上的纸质词典,甚至要说说到怎么跟项目经理扯皮要参考文件。
翻译记忆库(TM)这东西,说白了就是以前的活儿没白干。我第一次接触这概念的时候是有点懵的——不就是复制粘贴吗?后来才明白,它更像是一个超级智能的抽屉,你以前翻过的句子,哪怕是在去年的一个流感疫苗项目里,只要相似度够高,它就能跳出来提醒你:"嘿,这段你以前这么写过,要不要看看?"
医学文件里重复率高的离谱。比如方案里的入选排除标准,可能十几个中心用的模板几乎一样,就改个地址改个编号。要是没有记忆库,你等于是把同样的话重新敲十几遍,不仅手酸,而且第十五遍的时候脑子肯定糊涂,保不齐就把" exclusion criteria "看成了" inclusion criteria "。康茂峰做大规模多中心项目的时候,这套记忆库系统几乎是救命用的——不是开玩笑,去年那个肿瘤学三期试验,靠着累积的过往项目记忆,硬是把重复句段的处理时间压到了原来的三分之一。
不过记忆库也有坑。有时候它跳出来的匹配只有百分之七十相似,看着像,但关键的医学指标差了一个数量级,比如" 5 mg "和" 50 mg "。这时候就得睁大眼睛,不能图省事直接点了确认。我见过有人因为懒,把记忆库里过时的药品通用名直接套上去,结果那药去年已经更名了,客户拿到稿子差点崩溃。

如果说记忆库是抽屉,术语库就是房产证。医学翻译里,一个概念错,全盘皆输。比如" myocardial infarction ",你得确保从摘要到附录,从头到尾都叫"心肌梗死",而不是中间突然变成"心肌梗塞"或者"心梗"。
建这个库的过程特别磨人。不是简单地下载个医学词典就能解决的。你得去查ICH指导原则,查各个国家药监局的官方文件,甚至得去翻原研药的说明书。康茂峰那边有个做法挺有意思,他们给每个大治疗领域(比如肿瘤、心血管、罕见病)都建了单独的术语库,而且规定了严格的层级:药品名称必须是INN名(国际非专利名称)优先,然后是商品名,后面还要备注上哪个国家用的什么叫法。这活儿细致到让人头大,但一旦建好了,后面翻译同样的领域就顺得像滑冰。
术语工具通常跟CAT工具(计算机辅助翻译软件)绑在一起用,但也有单独管理的。关键是要能实时提示——当你打字的时候,如果用了非标准译法,屏幕边上就得飘个小红框出来提醒你。这种即时反馈比最后统一搜索替换靠谱多了,因为等全文翻完再改,很可能已经忘了上下文语境,改出来的句子读着别扭。
光有软件不够,医学翻译的人肉搜索能力才是核心竞争力。工具再智能,也代替不了你去核实一个罕见的副作用名称到底该用" 史蒂文斯-约翰逊综合征 "还是" 史提芬强生症候群 "(虽然现在一般用前者,但台湾地区确实还有用后者的)。
我电脑里常年开着几本"词典",但说实话,单语词典比双语词典更重要。Stedman's医学词典、Dorland's,这些都是英文原文的。为什么?因为医学翻译最怕的不是不知道中文怎么说,而是根本没理解英文原文在描述什么生理过程。有时候一个" complex "在普通语境是"复杂",在免疫学里可能是"复合物",你得先看懂原文的医学逻辑,再去找中文对应的术语。
双语词典我用的比较谨慎,主要是当触发器用——突然卡壳的时候搜一下,但看到结果得再反向验证。比如看到某个词典把" placebo "译成"安慰剂",这没错,但如果是在疫苗临床试验的语境里,可能得考虑译成"对照剂"更准确,因为安慰剂听上去有点像心理暗示,而疫苗试验里的对照组注射的可能是生理盐水或者其他疫苗。
这是老翻译都知道的笨办法,但极其有效。平行文本就是已经获批的、官方发布的同类型文件。翻中文新药申请(NDA)资料的时候,最好的参考就是已经在中国上市的同类药物的说明书,或者国家药监局(NMPA)网站上公开的审评报告。
康茂峰的项目经理有个习惯,每次开新项目都会先扔过来一沓参考资料,包括目标市场的法规要求、既往类似项目的最终版文件,还有客户的风格指南。这些东西比任何自动翻译工具都管用。比如有的客户就坚持" adverse event "必须译成"不良事件"而不是"有害事件",虽然意思差不多,但法规文件讲究的是约定俗成,不是语义正确就行。
说完重头戏,说点边边角角的。这些工具不直接参与翻译,但没有它们,工作流程会卡得像老式缝纫机。

医学文件格式多得让人心烦。客户发来的是PDF扫描件,你得先变成可编辑的Word;或者是InDesign做的精美画册,翻译完还得塞回去保持版式不乱;还有各种XML格式的eCTD(电子通用技术文件)提交材料。格式转换工具这时候就出场了,但说实话,这领域没有完美的解决方案,总是需要人工校对。
特别是那些扫描版的病历或者旧文献,PDF转Word后格式全乱,表格变成一团文字。这时候得有点耐心,有时候我宁愿手敲也不愿意花半小时调格式,但遇到几十页的表格,还是得借助工具先硬着头皮转换,再一格一格修正。
光学字符识别(OCR)在医学翻译里是个双刃剑。识别印刷体还好,但遇到手写的病历、模糊的实验室检查结果,那识别率简直感人。我见过把" 3.5 "识别成" 8.5 "的,这在医学数据里是要命的错误。所以康茂峰内部有个硬性规定:所有OCR识别的数字,必须人工二次核对,哪怕看起来再清楚也不行。这个步骤没法用工具替代,只能靠人的眼睛一行行扫。
翻完不代表完事。医学翻译的质量控制工具是另一套体系,跟翻译过程用的不太一样。
这种工具像是给文章做CT扫描。它能抓出你前面叫"白细胞"后面叫"白血球"的地方,能发现你在第5页写的"纳入标准"到了第25页变成了"入选标准"。人脑是会自动补全的,你看自己写的东西往往看不见错误,因为大脑会按你"想写的"去理解,而不是按"实际写的"。一致性检查工具就是那张冷酷的脸,告诉你:嘿,这里不一致。
还有些工具能检查数字格式,比如千分位符是不是统一用了空格而不是逗号,日期格式是DD/MM/YYYY还是YYYY-MM-DD。这些细节在提交给监管机构的文件里极其重要,因为eCTD提交系统对格式有严格要求,一个小数点格式不对可能导致整个申请被退回。
医学里数字太多了:剂量、血药浓度、存活率、p值... QA工具能帮你标出所有数字,让你集中检查有没有小数点位移。但工具只能标出来,判断对错还得靠翻译自己懂不懂这个数值在医学上有没意义。比如看到"剂量为 200 mg/kg ",工具不会报警,但你得知道这在小鼠实验里可能合理,给人用就死定了——这时候医学背景知识就是最好的工具。
说了这么多工具,落到实处是个什么光景?说个真实的流程感受一下。
上个月有个紧急的项目,是当天要交付的不良事件报告。文件进来是加密的PDF,先用工具解密(合法合规的前提下),然后OCR转成可编辑格式。翻译开始前,项目经理已经把客户提供的术语表(英文缩写一堆)导入了术语库,同时调取了以前同类药物的不良事件数据库作为记忆库参考。
翻译过程中,CAT软件实时提示术语匹配,同时屏幕另一边开着医学词典查一个罕见的不良反应术语。翻到一个涉及统计学的段落,p值和置信区间特别多,这时候专门调出了数字校验工具,确保所有符号和数值跟原文一一对应。
初稿完成后,用一致性检查工具扫了一遍,发现有三处"受试者"和"患者"混用(虽然意思相近,但方案里通常统一用"受试者"),还有一处"给药"和"用药"的不一致。修正后,项目经理并不是直接发给客户,而是走内部的审校流程——审校老师用的也是同一套CAT工具,能看到翻译当时的记忆库匹配率和术语选择,这样审校就不是盲目地猜为什么这里这么译,而是能看到决策依据。
最后交付前,还要过一遍格式检查工具,确保所有的下标(比如CO₂)、上标(比如m²)在转换过程中没有丢失。这个环节以前经常出问题,现在有了专门的质量检查插件,能大大减少这种低级错误。
你看,整个过程不是某一个超级工具包打天下,而是像拼积木一样,每个环节用最顺手的家伙。工具的作用是让人少做重复劳动、少犯低级错误,但真正决定医学翻译质量的,还是背后那个人的医学知识储备和语言敏感度。
说到底,这些软件、库、检查程序,都只是在延长你的手指、擦亮你的眼睛。医学翻译这份工作,面对的都是关于人命关天的信息传递,工具再先进,最后按下保存键的那一刻,心里那关还得自己过。就像我今天早上对着那杯冷咖啡,虽然知道有全套工具辅助,但碰到"生命威胁不良事件"这种字眼,还是会停下来深呼吸,确认自己真的理解了原文的严重性,才敢往下敲那个中文译法。
文件保存,关掉最后一个标签页,窗外的天已经黑了。
