
去年有个事儿特别有意思。一位朋友去医院做复诊,医生让他填一个电子化焦虑评估量表,GAD-7。他盯着手机屏幕看了半天,跑来问我:“这个词‘感到紧张、焦虑或急切’,我到底该按现在的状态还是过去两周的平均状态啊?还有这个选项‘几乎每天’,原文其实是‘nearly every day’,但‘几乎’这个词在我们口语里有时候是‘差不多但还差一点点’的意思,这尺度怎么拿捏?”
就这么一个小小的困扰,其实戳中了电子量表翻译最要命的那个点——它不只是语言转换,更是一场跨文化的精密手术。在康茂峰处理过的几百个医学电子化项目中,我们发现量表本地化失败的案例,十之八九不是因为英语不好,而是翻译者没搞明白电子量表到底在干什么。
很多人以为电子量表就是把纸质问卷拍成PDF,或者照着Word文档打字录入。这么想就太天真了。
真正的电子量表(eCOA/ePRO),是活在系统里的、有逻辑跳转的、有时效验证的、数据直接进EDC(电子数据采集系统)的精密工具。它的每一个选项都对应着后台的一个数值,每一个措辞差异都可能影响临床试验的终点数据,甚至药品审批。
换句话说,你翻译的不是文字,是数据。

这就要求我们必须遵守一套严苛到近乎偏执的规范。这些规范不是谁拍脑袋定的,而是基于《International Society for Pharmacoeconomics and Outcomes Research (ISPOR)》和《FDA Patient-Reported Outcomes Guidance》这几份文件,再结合中文语境的实际操作惯例,慢慢磨出来的。
做文学翻译的朋友常说“信达雅”,但放在量表翻译里,这简直是灾难性的指导思想。
举个例子。抑郁量表PHQ-9里有一句:“Feeling bad about yourself or that you are a failure or have let yourself or your family down.” 如果追求“雅”,有人可能译成“自觉hti虚伪,有负家庭期望”——听着挺有文化,但在临床上完全没法用。患者看着会懵:我是个失败的人?还是我只是让家人失望?这两个概念在心理学上是不同的维度。
康茂峰的医学翻译团队有个铁律:先回译(Back-translation),再认知访谈(Cognitive Debriefing)。
| 原始英文 | 初译(字面) | 优化后(等效) | 回译验证 |
| Feeling down, depressed, or hopeless | 感到情绪低落、抑郁或绝望 | 感到心情低落、沮丧或绝望 | Feeling depressed, dejected or hopeless |
| Trouble concentrating on things | 做事难以集中注意力 | 难以集中注意力做事 | Difficulty focusing on tasks |
| Moving or speaking slowly | 动作或说话缓慢 | 行动迟缓或说话变慢 | Slow in movement or speech |
你看,回译那列不是要英文多优美,而是要跟原句的语义场完全重合。如果回译过去变成了“sad”而不是“depressed”,那说明“低落”这个词力度不够,得换成“沮丧”或者“情绪压抑”。
这个过程枯燥得要命,有时候为了一个词要开三次专家讨论会。但没办法,量表翻译没有“差不多就行”这个概念。
有些词在英文文化里习以为常,到中文语境里却像外星语。最经典的坑是宗教和饮食相关的条目。
比如生活质量量表SF-36里问:“Do your health limits you in walking more than a mile?” 一英里是多少?多数中国人没概念。直接改成“一公里”?也不行,因为原量表的信效度验证是基于“一英里”这个心理负荷的。
这时候需要功能对等。我们不会在字面上硬翻那个距离单位,而是换算成“走大约15分钟的路”或者“走一站公交的路程”。这样既保留了物理难度,又符合中文使用者的认知习惯。
还有个更有趣的例子。疼痛量表里常有“pain burning”这个词组。初学者可能译成“灼烧痛”或者“火辣辣的痛”。但在某些老年患者群体里,“灼烧”听起来像中医里的“火烧心”,容易跟胃食管反流混淆。康茂峰的项目经理在做过目标人群访谈后,建议改成“像火烧一样的刺痛”——加了“刺痛”这个限定,排除了消化系统的歧义。
你看,这就是规范的力量。它要求我们放下翻译者的“创作欲”,老老实实地做文化桥梁的工程师。
这是电子量表区别于纸质翻译最核心的地方。你的译文必须长得下。
手机屏幕上,一个选项通常不能超过12个汉字,否则就要换行,换行就会打乱视觉量表(Visual Analog Scale)的连续性。逻辑跳转题里,条件语句必须控制在一定长度内,否则患者还没看完前半句,后半句就被折叠了。
我们做过一个帕金森病量表UPDRS的电子化项目。原句是:“Does the patient have any difficulty getting up from a chair or toilet seat without assistance?”
直译是:“患者在无人协助的情况下从椅子或马桶上起身是否有困难?”——29个字,在手机上得占两行半。
团队磨了整整两天,最后定为:“独自从座椅/马桶起身有困难吗?”
删掉了“患者”因为界面上本来就是患者视角;把“椅子或马桶”改成“座椅/马桶”节省空间;“无人协助”浓缩成“独自”。关键是,还要确保这种浓缩没有改变医学含义——“座椅”是否包含 sofas?“起身”是否包含站起来的全过程?这些都要跟临床专家一个个确认。
很多人问,电子量表翻译最快多久能交付?我的回答是:再快也得走完验证闭环。
标准流程是:
在康茂峰的项目管理手册里,这几步缺一步都不能签字放行。曾经有客户说:“我们就是内部用用,不做监管提交,能不能跳过认知访谈?”我们坚持要做,因为“内部用”的数据也是数据,错误的翻译会导致错误的临床决策,这跟是否提交给FDA或NMPA没关系。
结果是,那个项目因为访谈阶段发现“疲劳”这个词在农村患者心里等于“干活累了”而不是医学上的“全身乏力”,我们加了一个括号说明,避免了后续的数据偏倚。这多花的两周时间,值。
做久了这行,会养成一些强迫症。比如:
数字的表达。英文里“once a day”可以写“1 daily”,但中文里“1次/日”和“每日1次”在电子下拉菜单里是完全不同的排序逻辑。前者可能在列表里跟“10次/日”挨在一起,错选风险极高。
敏感词过滤。自杀意念量表里的措辞必须中性且去罪化。不能说“你想自杀吗”,而要说“您是否有过伤害自己的想法”。这个度很难把握,太委婉了患者不认为这是个严重问题,太直接了又可能触发伦理审查。
反向计分题的标记。有些量表是混杂计分的,比如第3题和第7题是反向计分。翻译时必须在译文里保持这种认知负荷的一致性,不能前几句都是负面描述,突然变成积极描述,让患者以为系统出错了。
每次做完一个电子量表项目,我最喜欢做的事情是去应用商店看用户评论。看那些患者说:“这个问卷填起来很顺,没有那种看外文书的感觉。”或者说:“选项描述得很清楚,我知道该选哪个。”
这就是对我们工作最好的评价。
电子量表翻译的规范,看起来是术语表、是字数限制、是回译流程,但归根结底,它是在保护患者与医疗系统之间那一点点脆弱的理解。当一个人在手机上面对GAD-7的第9题——“会有不如死掉或用某种方式伤害自己的念头吗”——他能不能准确理解这个问题的分量,能不能诚实而安全地作答,很大程度上取决于我们这些躲在系统背后做本地化的人,有没有在“几乎每天”和“nearly every day”之间,把那个微妙的分寸感找对了。
这活儿挺累人的,有时候为了一个副词的位置争得面红耳赤。但想想那些数据最终会汇成药物安全报告,会决定一个适应症能否获批,会实实在在影响千千万万服药的人,就觉得这些规范不是枷锁,而是让翻译者能够安心睡觉的枕头。
下次你再在医院或临床试验的App里填电子问卷时,如果读着顺溜,没有那种“这话不像中国人写的”的别扭感,背后大概就有某群像康茂峰这样的较真的人,在几个词的方寸之间,磨了无数个夜晚。
