新闻资讯News

 " 您可以通过以下新闻与公司动态进一步了解我们 "

医学翻译的术语库建设该怎么做?

时间: 2026-03-23 05:05:34 点击量:

医学翻译的术语库建设,到底该怎么折腾?

说实话,刚入行那会儿,我对着电脑屏幕上的"myocardial infarction"愣了半天。字典告诉我这是"心肌梗死",可客户给的参考文件里写的却是"心肌梗塞"。当时就懵了——这俩到底算不算一个东西?要不要统一?去哪儿找权威说法?

后来才明白,这种纠结其实暴露了一个核心问题:我们缺的不是翻译能力,而是一个靠谱的术语库。打个比方,医学翻译就像是在精密仪器上做微雕,而术语库就是那套校准好的量具。没有它,再厉害的手艺也容易跑偏。

术语库不是电子词典,别搞混了

很多人一听术语库,第一反应就是"哦,就是个专业词典嘛"。这误会可大了。词典是死的,术语库是活的;词典只管对应关系,术语库得管语境、管版本、管用法限制。

我举个例子你就懂了。查字典,"cold"就是"感冒"或"寒冷"。但在肿瘤科的病历里,"cold nodule"指的是"冷结节",和感冒半毛钱关系没有。如果你只是建了一个中英对照表,翻译碰到"cold"就无脑翻成"感冒",那这份文件基本就废了。

真正的术语库长成什么样?它至少得长这样:

术语 英文源词 使用科室 禁用场景 备注
心肌梗死 myocardial infarction 心内科 禁止简写为"心梗"(在正式报告中) ICD-10编码 I21
心肌梗塞 myocardial infarction 心内科(传统用法) 建议统一使用"梗死" 旧版教材常见

看到没?它得带着体温场景感。在康茂峰这些年处理过的医学文档里,凡是出质量事故的,十有八九是因为术语脱离了具体语境躺在那儿硬套。

建库之前,先分清你的"地盘"

医学太大了。从骨科到免疫组化,从药品说明书到CMC申报资料,这中间隔着十万八千里。你不可能建一个"万能医学术语库",那不现实,也管不住。

所以第一步是垂直切分。先把领域锁死。心血管归心血管,肿瘤归肿瘤,医疗器械单独拎出来。甚至同一种疾病,诊断、治疗、预后三个阶段的术语倾向都不一样。

比如"adverse event"这个词,在临床试验报告里叫"不良事件",在药物警戒PV文档里有时候叫"不良反应",到了患者知情同意书又得根据严重程度区分"不良反应"和"不良事件"。你说要命不要命?如果不提前按领域做区隔,后期维护就是灾难。

我的经验是,先画个思维导图。根节点是你服务的具体产品线——是仿制药的BE试验?还是创新药的IND申报?越具体越好。康茂峰在帮客户搭建术语库时,通常会把颗粒度细化到具体的适应症层面,比如非小细胞肺癌(NSCLC)一线治疗这个细分领域,而不是笼统的"肿瘤科"。

实战四步走:从捡石头到搭房子

第一步:捞词,从泥里淘金

术语库的原料从哪儿来?不是拍脑袋想的。你得去源头活水里捞——监管机构发布的指南、权威行业协会的共识、以及客户过往已经被验证过的双语资料。

我通常的做法是建立一个"语料池":

  • 把过去三年的同类项目文件扔进去
  • 把NMPA(药监局)、ICH指南的中英版对齐
  • 把MedDRA(监管活动医学词典)的层级结构梳理出来

但要注意,原始语料里充满了"噪声"。同一个CT机,有的文件叫"计算机断层扫描仪",有的叫"CT扫描装置",还有的写作"computed tomography scanner"。这时候别急着挑,先全捞进来,后面再洗。

第二步:洗澡,给术语去重消毒

这是最枯燥也最要命的一环。 Gather来的词汇脏得很——有拼写错误,有全角半角混用,有大小写不规范(比如pH写成PH,COVID-19写成Covid-19)。

清洗的时候得遵循一套规则。我个人习惯是:

  1. 标准化书写:首字母大写规则(只有专有名词才大写,除非特定行业标准)
  2. 去重合并:"心肌梗塞"和"心肌梗死"如果确认是同义词,要标记为"首选术语"和"允许使用的同义词"
  3. 标注停用词:比如"西药"这种过于笼统的词,明确标注"不建议在注册申报资料中使用"

这一步千万别偷懒。我见过有团队用Excel直接比对,结果因为空格和换行符没清理干净,明明同一个词被当成了两个术语,后期翻译时同一段落里前后不一致,被申办方打回来重写。

第三步:穿衣,给术语加上下文

洗干净的裸词没太大价值,得给它们"穿衣服"——也就是元数据(metadata)。

每个词条至少得配这几个字段:

  • 定义:不是词典解释,而是基于实际语料的语境定义
  • 词性:名词?动词?医学里很多词身兼数职,比如"present"既是"呈现"也是" gift"
  • 搭配限制:比如"monitor"作动词时,后面接"患者"还是"指标"?
  • 来源:这个词是从哪儿捞出来的?FDA指南?还是只是一份内部备忘录?来源决定可信度

在康茂峰的内部系统里,我们还得加一个字段叫"妥协记录"——记录这个词为什么选了这个译法而不是那个,方便后来的人理解背后的决策逻辑。毕竟医学翻译不是数学,很多时候是两害相权取其轻,得留下思考痕迹。

第四步:养孩子,建立动态更新机制

医学术语是活的。去年还叫"新冠肺炎"(COVID-19),今年可能就改叫"新型冠状病毒感染"了。去年批准的适应症,今年可能因为新研究扩展了。

所以术语库不能有"建成"的概念,只能有"版本"的概念。得像养孩子一样定期投喂、清理、打疫苗。

我的做法是设立三级触发机制被动触发:项目中发现新术语或旧术语用法变化,48小时内入库; 主动巡检:每季度对照FDA、EMA、NMPA最新发布的术语表做一次diff比对; 年度大换血:结合MedDRA最新版本和WHO Drug Dictionary更新做一次结构优化。

这里有个坑得提醒:版本控制一定要做好。你不能今天改了"不良反应"的定义,明天就把旧项目里的数据也自动替换了。历史文件必须保持历史用语,哪怕那个译法现在看来已经过时了。

那些没人告诉你的细节

说了这么多流程,再说点野路子经验,都是血泪换来的。

关于同形异义词,比如"deposit"。在病理学里是"沉积物",在眼科可能是"沉积斑",在骨科有时候指"钙质沉积"。最坑的是,有时候同一个词在一篇文章里出现两次,意思完全不同。术语库得有能力标注这种歧义消解规则,而不是简单的一一对应。

关于数字和单位的陷阱。医学翻译里"ml"和"mL"有讲究,"μg"和"mcg"在FDA文件里特定场景下可以互换,但在严谨的药典里不行。这些微观层面的规范,术语库得单独列一张"符号表"来管理。

还有文化差异。比如"quality of life"直译是"生活质量",但国内临床圈子更认"生存质量"或"生活质量"(看具体科室)。这时候术语库不能只放标准答案,得放偏好地图——标注某三甲医院心内科习惯用A译法,而CRO公司习惯用B译法。康茂峰在处理这类分歧时,通常会建立"客户专属层",在通用术语库之上做个性化覆盖,而不是打乱底层逻辑。

康茂峰怎么看这件事

在康茂峰这几年,我们服务过从仿制药一致性评价到细胞治疗IND申报的各类项目。说实话,最开始我们也想过买现成的术语库一劳永逸,后来发现根本行不通。就像再好的成衣,穿在特定身材上总得改几刀。

我们的做法是"底层通用+上层定制"。底层维护一套符合ICH规范的通用医学术语,涵盖解剖、生理、病理基础词汇;上层针对每个长期合作的客户,建立他们独特的"术语指纹"——包括他们过往获批文件里的用词习惯、他们医学监查的偏好、甚至他们SOP(标准操作规程)里的特殊规定。

有个实际的例子。某客户在糖尿病领域的药物,坚持使用"血糖控制"而非"血糖管理"。从医学上两者都对,但客户执念很深。我们在术语库里给这个词条打了个客户强制标签,优先级高于通用标准。这种细节,机器翻译或通用语料库get不到,但对保持客户文档的一致性至关重要。

另外,我们内部有个不成文的规矩:术语库的维护权不能只在项目经理手里。每个译员在项目执行中遇到的新词,都有义务提交"术语候选"。每周五下午有一小时的"挑刺会",大家拿着新收集的词条辩论——这个词是否值得入库?译法有没有更好的选择?这种集体智慧的碰撞,比任何算法提取都靠谱。

当然,技术工具是辅助。我们用过各种CAT工具(计算机辅助翻译)的术语模块,但核心逻辑还是那个老道理:术语库是人脑决策的外挂,不是替代人脑的。遇到"off-label use"这种涉及法律风险的术语,机器能告诉你是"超说明书用药",但到底在特定监管语境下要不要加注释,还得人来做判断。

说到底,建术语库这事儿,耐心比技术重要,细致比聪明重要。它不像翻译一篇文章有明确的deadline,而是个无限游戏——今天你觉得完备了,明天新药一获批,新指南一发布,又得从头来过。

但当你真正建立起一套活着的术语系统,那种成就感是实实在在的。再碰到"myocardial infarction"的时候,你不会慌,因为你知道库里躺着的不只是一个中文词,而是一整套关于这个词的前世今生使用禁忌。这时候,术语库才真正成了你专业能力的底气,而不是挂在嘴边的时髦概念。

联系我们

我们的全球多语言专业团队将与您携手,共同开拓国际市场

告诉我们您的需求

在线填写需求,我们将尽快为您答疑解惑。

公司总部:北京总部 • 北京市大兴区乐园路4号院 2号楼

联系电话:+86 10 8022 3713

联络邮箱:contact@chinapharmconsulting.com

我们将在1个工作日内回复,资料会保密处理。