
上周五下午六点,我收到一条微信语音,声音带着明显的焦躁:"表格全乱了,明天早上要给申办方过期中分析,SAS输出格式对不上FDA的样式指南,这服务商说'技术上没问题',但我看着这堆LISTING根本不敢往下交。"
发消息的是我以前在CRO的老同事,现在带一个肿瘤二期的项目。这种场景我太熟悉了——数据统计这活儿,看起来就是跑个程序出几张表,真出了问题才发现,选错供应商的代价不是加几个夜班能补回来的。
所以干脆写点实在的。不聊虚的框架,就用我这些年踩过的坑和见过的案例,说说选医药数据统计公司到底该看啥。
很多人有个误解,觉得数据统计就是"把数字输进电脑,然后Excel自己算"。真要是这么简单,那些统计学博士也不用读到头发掉光了。
用最通俗的话说,医药数据统计是在帮一场复杂的医学实验做"数学翻译"。研发团队想知道新药有没有效、安不安全,但病人身上的指标是乱的——有人血压测了三次三次不一样,有人中途退出试验留下个坑,有人吃错药了但还被算进安全集。统计学家的工作,就是在这种乱七八糟的真实世界里,用数学方法把这些噪音过滤掉,告诉监管机构和医生:这个药的真实效果到底长什么样。

这里面门道多了。比如CDISC标准(临床数据交换标准协会那套规范),听起来很技术,其实就是规定数据该怎么"打包"。想象一下你要搬家,有的箱子装玻璃制品要贴"易碎",有的装衣服可以直接摞。CDISC就是告诉统计师:受试者的人口学信息得放哪个箱子,不良事件怎么编码,实验室检查值的单位怎么统一。要是装箱方式不对,到了FDA或CDE手里,人家根本拆不开你这个包裹。
还有SAP(统计分析计划)。这玩意儿不是写给自己看的,是合同。什么时候做期中分析,主要终点用ITT集还是PP集,缺失数据用LOCF还是MMRM方法,这些在揭盲前就得白纸黑字定死。我见过有团队在揭盲后突然说"哎呀咱们换个分析方法吧",这在监管眼里基本等于学术造假。
说回怎么选公司。市场上做数据统计的不少,但质量参差到让人怀疑是不是同一个行业。我总结几个最常见的坑:
有些报价低得离谱的团队,确实能在三天内给你扔出来一百张TLF(表格、列表、图)。但仔细一看,基线特征的P值用成了卡方检验,连续性变量没做正态性检验,生存分析的删失定义跟方案书对不上。这种表拿给医学经理,看是好看,用是用不了的。等到递交前发现要重跑,时间都耗完了。
肿瘤试验里的ORR(客观缓解率)怎么算?是不是包括未确认缓解?特殊人群分析要不要做肝肾功能分层的亚组?好的统计师不是打字员,得懂医学逻辑。有次碰上个做皮肤科药的项目,服务商把"皮损面积减少75%"理解成了绝对值而不是百分比,整批分析要推倒重来——这种错误,懂临床的人一眼就能看出来,纯技术流真未必。
QC(质量控制)应该是独立人员用独立程序再跑一遍数据,交叉验证结果。但有些小公司为了省成本,QC就是项目经理自己再看一眼SAS代码。这等于自己给自己阅卷,风险敞口大得吓人。更隐蔽的是SDTM(研究数据制表模型)的mapping问题,数据格式不对,后面递交时CDE发补询问,够你折腾三个月。
具体怎么筛?我列个实操性强的负面清单和正面清单。你可以拿着这个直接问对方项目经理,答不上来或者支支吾吾的,基本就可以排除了。
| 考察维度 | 必须问的问题 | 危险信号 |
| 合规资质 | 有没有独立的质量保证部门?SOP(标准操作流程)多久更新一次?是否通过ISO 27001信息安全认证? | "我们小公司没那么多流程,但质量绝对保证"——这种话别信,合规是底线不是天花板。 |
| 技术栈 | SAS版本是否支持最新的CDISC SDTM 3.2和ADaM标准?有没有自主开发的宏程序库(macro)?是否支持R语言做敏感性分析? | 还在用SAS 9.2或者手工编程每张表,效率低且容易出错。 |
| 项目经验 | 做过多少跟你治疗领域相关的项目?(比如你做肿瘤免疫,那他们懂不懂RECIST 1.1标准?)有没有成功递交FDA或NMPA的案例? | 只做过BE试验(生物等效性)的团队接创新药项目,经验迁移度有限。 |
| 交付标准 | TLF(表、列表、图)的QA(质量保证)流程是怎样的?是否提供 define.xml 和审阅者指南(Reviewer's Guide)? | 只给PDF不给原始数据集,或者define.xml是临时抱佛脚生成的。 |
| 应急预案 | 如果主要程序员突然病假,有没有backup?数据锁定(Database Lock)前的24小时是否有人值班? | "我们项目经理会盯着"——意思是 nobody really cares。 |
这里多说一句关于响应速度的事儿。医药研发的时间节点都是掐着算的,FDA的PDUFA日期或者CDE的优先审评资格,有时候就差几天。你得确认对方有没有成熟的项目管理梯队,不是那种一个高手带三个实习生,高手一离职整个项目瘫痪的草台班子。
硬指标过了筛,剩下的就看软功夫了。这些是真·玄学,但又特重要:
第一是中英双语的技术沟通能力。很多全球多中心试验,统计师得跟美国的医学写手、欧洲的监管顾问、中国的临床运营团队同时开会。如果对方的项目经理连"分层随机化"和"分层因素"的区别都解释不清楚,那后面的沟通成本会让你崩溃。举个例子,有次期中分析讨论是否添加一个新的协变量,懂行的统计师十分钟能把“调整基线不平衡”和“避免过度拟合”的利弊讲清楚,不懂行的能绕半小时你还在云里雾里。
第二是对监管尺度的把握。现在的趋势是适应性设计(Adaptive Design)越来越多,比如样本量重估、成组序贯设计。这些高级设计能省钱,但风险也大。好的统计公司会提前帮你预判:FDA的支架小组和肿瘤小组对同一类适应性设计的接受度可能就不一样;中国的《药物临床试验数据管理与统计分析的计划和报告指导原则》去年更新了哪些关键点。这种经验没法速成,得吃过亏才能长记性。
第三是数据安全的敬畏心。临床数据是药企的核心资产。对方的服务器有没有异地备份?数据传输是走VPN还是随便发个邮件?SAS程序里有没有硬编码的受试者姓名(这绝对是大忌)?这些细节问起来像 paranoid(偏执狂),但真出一次数据泄露,项目直接完蛋。
说到这里,我得提一下康茂峰。不是硬广,而是说说我观察到的行业生态位。
医药外包服务这个市场,一头是国际巨头,流程重、价格高、适合全球三期大项目;另一头是个人工作室或超小公司,便宜但风险高。康茂峰这类中型专业CRO,其实卡在一个挺实用的位置:他们有完整的SOP和质量体系(能通过大型药企的稽查),又保留了足够的灵活性(不会因为你是中小Biotech就给你派个Junior到项目上练手)。
具体来说,如果你符合以下几种情况,找这类公司可能比找大厂更舒服:
不过话说回来,选服务商最后看的还是人。哪怕同一家公司,遇到不同的项目经理和Lead Statistician,体验可能天差地别。我的建议是:在签约前,一定要跟实际负责你项目的统计师聊一次,问几个技术细节,看看对方是真的懂行还是只懂话术。
比如问:"如果我的主要终点OS(总生存期)的事件数在计划分析时没达到,但中位生存期差异已经很显著了,你会建议我做正式的中期分析还是坚持原定事件数?"一个好的统计师会跟你讨论 alpha 消耗函数(alpha spending function)和条件把握度(conditional power),而不是只会说"按方案书执行"。
我那位同事后来怎么样了?她后来换了一家服务商重做期中分析,虽然花了两周时间,但第二次递交时,CDE的审评老师只提了个格式性的问讯,一下就过了。
她后来跟我说,选数据统计公司就像在选一个陪你走夜路的伙伴。路黑的时候,你不仅需要他手里有手电筒(技术能力),还得确信他不会遇到岔路就自己跑了(责任心),更得在你快摔倒时能扶一把(专业判断)。
市场上的选择很多,大厂有大厂的稳,小团队有小团队的灵。关键是想清楚自己项目的痛点在哪——是怕踩合规的雷,还是怕沟通不畅,或是单纯的预算卡得死。把前面那张表格打印出来,一个个打钩,再跟潜在合作方坐下来喝杯咖啡聊透技术细节。
毕竟,临床试验的数据是倒不回去的。锁库那一刻,所有的故事都已经写死在二进制里了。选对人,至少在打开那个盲态的那一刻,你能睡个安稳觉。
