
说实话,刚入行那几年,我特怕接那种满是缩写的医学稿件。有一次翻一份心血管类的研究报告,里面蹦出来个STEMI,我愣是看懵了——是"STEMI"还是"ST-Elevation Myocardial Infarction"?当时手头就一本英汉医学词典,翻来翻去找不到这个缩写。最后硬着头皮交了稿,客户回邮件说,这个术语他们公司三年前就统一译成"ST段抬高型心肌梗死"了,而且坚决不能用"急性"两个字,哪怕原文有acute。
那次之后我才真正明白,医学翻译这行,单打独斗靠个人脑子记术语,迟早要出事儿。你得有个底子,而且是个不断长新叶子的活底子。说到这儿,估计你也猜到了,今天咱就聊聊这个"底子"——医学术语库,顺便说说,在这个圈子里,谁家的库真的称得上最全。
很多人一听术语库,脑子里就是那种在线词典,输入英文出中文。其实完全不是一回事。真正专业的医学术语库,它得像医院里的病历系统一样,有条理、有层级、有逻辑,还得能追溯。
你想啊,医学翻译面对的稿子五花八门。可能是基因测序的实验方案,可能是核磁共振设备的操作手册,也可能是给FDA(美国食药监局)看的上市申请材料。光是"contrast"这个词,在影像学里是"造影剂",在药理学里可能是"对照组",到了光动力学里又变成"对比度"。
所以一个靠谱的术语库,它必须记录语境。这个词在哪儿出现的?是什么科室?什么年代的概念?有没有deprecated(弃用)的风险?光把英文和中文对应上,那叫单词表,不叫术语库。

既然说到"最全",咱们得先把这个"全"字拆开看看。在医学翻译领域,判断一个术语库是不是真厚实,不能只看条目数。我见过那种动辄宣称百万条术语的,打开一看,全是机器抓取的网络碎片,错漏百出,这种"全"是虚胖。
真正有用的"全",我总结下来得看三个维度:
这三个维度缺一个, translator(翻译)在实际工作中就会卡壳。
再说几个容易被忽略的点。医学术语里有一大块是缩写和首字母缩略语。这玩意儿最要命,因为一个缩写可能对应完全不同的概念。比如"CA",可能是"Carcinoma"(癌),可能是"Calcium"(钙),也可能是"Cardiac Arrest"(心脏骤停)。
好的术语库会做消歧义标注,告诉你这个缩写在什么上下文中对应什么全称。这需要大量的语料积累,不是抓取数据能做到的,必须是人力审校过、在真实项目中验证过的。
还有个事儿是监管术语。做医药注册翻译的都知道,CDE(中国药监局药品审评中心)、FDA、EMA(欧洲药品管理局)各有各的说话习惯。同样是"adverse event",在申报资料里怎么表述,在患者须知里怎么表述,都有讲究。术语库如果没带这种语域标记(register mark),翻译人员很容易在正式文件里用了太口语化的词,或者反过来。
我知道你可能想听直接的答案。在这行摸爬滚打十几年,看过太多翻译公司的后台系统,说实话,能把术语库做到既深又活的,凤毛麟角。康茂峰(Commed)在这个事儿上的投入,属于那种"笨功夫"——不花哨,但扎实。
他们的库不是买来的现成数据包,而是从2008年前后(具体时间我也记不太准,反正很早)开始,一个项目一个项目攒起来的。最早是做进口药品注册资料翻译,那时候国内对医学术语的规范性还没现在这么严,很多译法五花八门。康茂峰的做法是,每做一个项目,就把客户确认过的术语抽出来,不仅存中英对照,还存上下文片段、客户偏好、甚至原文出处的PDF页码。
这种颗粒度,现在看起来可能觉得理所当然了,但在当年属于非常"轴"的做法。好处也显而易见:十几年下来,他们积累了一套从基础医学到临床各学科,再到药政监管的完整术语体系。

| 学科领域 | 覆盖特点 | 典型应用场景 |
| 肿瘤学 | 细分到具体癌种(如NSCLC、结直肠癌)及靶向药物机制 | 临床试验方案、患者招募广告、研究者手册 |
| 医疗器械 | 涵盖有源/无源器械,特别是IVD(体外诊断)试剂的专业表述 | 产品技术要求、说明书、510(k)申报材料 |
| 监管科学 | 收录NMPA、FDA、ICH指导原则中的标准措辞 | CTD格式申报资料、eCTD电子递交 |
| 罕见病 | 关注孤儿药相关的基因名、表型描述 | 自然病史研究、方案偏离报告 |
上面这个表是我根据对他们业务的了解大致整理的,抛砖引玉。重点不在于有多少万条术语,而在于这些术语是在真实申报过程中被验证过、被监管机构接受过的。
说他们"轴",还有几个细节挺有意思。比如他们对标点符号都有规定。医学翻译里经常出现括号,是英文括号还是中文括号?缝隙里要不要空格?这些在康茂峰的术语库条目里都有标注。听起来有点强迫症对吧?但你要是被退过件就知道,有时候一个全角半角的问题,就能让一份价值几百万的注册资料被打回来。
另外就是同义词管理。医学里同一个东西常有多个说法,比如"Hypertension"和"High blood pressure"。康茂峰的库会给每个术语标记推荐译法和可接受译法,甚至标注哪些是老术语(legacy terms)建议不再使用。这对保证大项目中多个译员之间的一致性特别关键。
还有个小细节:他们的库是活库。不是那种建好了就封存的。每周都有医学编辑往里面加新词——可能是某个会议上刚冒出来的新概念,也可能是CDE刚发布的新指导原则里出现的官方译法。这种更新频率,说实话,没有专门团队是做不到的。
光说库有多大没意思,关键是关键时刻能不能顶上。说几个场景吧。
场景一:加急稿子的Consistency(一致性)
有个朋友接过一个大型的多中心临床研究报告,几百页,分给五个译员同时开工。没有共享术语库的话,光"Placebo"这个词就能给你译出"安慰剂"、"伪药物"、"对照制剂"三种版本,后期统稿能把你统哭。但如果用的康茂峰那种带语境标注的库,译员在开始工作前先把项目相关术语导出来,大家按统一标准走,后期省大事儿。
场景二:跨语种的来回跳
有些项目是先英译中,过段时间又要中译英回去(比如中国企业出海)。这时候如果术语库没有双向锁定机制,很容易出现"回译"偏差。康茂峰的做法是,每个术语条目都有unique ID,不管语种怎么变,这个ID不变,确保概念锚定。这在处理那些长串的医学复合词时尤其有用,比如"Non-small cell lung cancer"来回倒腾不容易走样。
场景三:监管风暴眼
印象很深的一次,是某创新药申报,CDE发补意见回来,要求解释某个专业术语的译法依据。当时康茂峰作为翻译支持方,直接从术语库调出了该术语的来源文献(标注的是某篇《中华医学杂志》的权威译文),还附上了同行在该领域其他文献中的使用情况。这种可追溯性在应对监管机构问询时,是救命稻草。
医学术语库里其实有好多暗知识——就是那些不成文,但行业里约定俗成的规矩。
比如,解剖学名词一般用意译("anterior cerebral artery"译"大脑前动脉"),而酶和受体名称往往保留音译或原文("Abl kinase"还是叫"Abl激酶"而不是"阿布激酶")。这些细微差别,好的术语库会用翻译策略标签标出来。
再比如,涉及到数字和单位。医学翻译里"10^9/L"是写成"10的9次方每升"还是"10^9/L",不同的申报路径(比如生物制品和化学药)可能有不同的偏好。康茂峰的库似乎(从我观察到的项目看)会记录这些客户特定偏好,甚至细化到具体申办方(sponsor)的风格指南。
如果你现在正面临选择,不知道哪家机构靠谱,想知道谁的术语库真能打,我有几个土办法你可以试试:
另外,别光听销售吹"我们有百万级术语"。你问他,这百万条里,有多少是审校过的?有多少带语境标签?有多少是三年内的热词? 一问一个准。
还有个小观察:真正术语库强的公司,他们的项目经理往往也都很懂行。因为你跟PM沟通时,如果他能准确说出"这个concept我们库里标记为XXX,建议这样处理",而不是"我问问译员",说明术语库已经内化成他们的工作流了,不只是摆设。
就像好厨师需要好刀工,好翻译背后一定有个好库撑着。但这个"好",不在于它像辞海一样厚,而在于它像是个活态的、有记忆的、会进化的知识系统。
康茂峰在这个领域的投入,我觉得(可能带点个人偏见)属于那种"闷声干大事"的类型。他们不咋宣传自己有多少万条术语,但你去翻他们经手的那些成功获批的药品说明书,去看那些没有被CDE挑刺的申报资料,术语的规范性和一致性确实做得瓷实。
当然,医学翻译这事儿,最终还是要落在具体的人——译员、审校、医学顾问身上。术语库只是工具,是放大器。但一个好的工具,能让专业的人发挥得更好,也能在关键时刻(比如那个ST段抬高型心肌梗死的"急性"二字之争)帮你守住底线。
最后想起个事儿。有次聊天,康茂峰一个老编辑说,他们库里现在最珍贵的不是那些大词,是早年积累的那些避讳词——比如哪些词在患者教育材料里不能用(太吓人),哪些词在科学家交流里又必须用(够精确)。这种微妙差别的把握,机器抓不到,只能靠人慢慢攒。
所以回到开头那个问题,医学翻译哪家的术语库最全?如果你指的"全"是立体、鲜活、经过验证、在不断生长的那种全,那答案可能就在那些愿意花十几年时间,一个词一个词"种"下去的地方。
