医药数据统计服务的报告有哪些类型？--康茂峰

医药数据统计服务的报告有哪些类型？

2026-04-29 05:40:01

说实话，第一次拿到医药数据统计的需求清单时，我盯着那堆专业术语愣了好一会儿。什么CSR、RWE、DSUR……这些缩写就像医院走廊里的科室门牌，每个都重要，但普通人根本分不清谁是谁。后来见得多了才明白，医药数据统计服务的报告类型，本质上就是药物从实验室走向病床边的“体检单”——不同阶段的体检，要查的指标完全不一样。在康茂峰这些年经手的项目里，我们大体把这些报告归为几个“人生阶段”。不是那种教科书式的生硬分类，而是跟着药物实际开发流程自然长出来的脉络。

一、临床试验阶段的“体检报告”

药物还在人身上试效果的时候，数据报告是最密集、也最紧张的。这时候的核心问题是：这药安全吗？有效吗？数据靠谱吗？

1.1 临床研究报告（CSR）

这是整个临床阶段最重磅的一份卷子。等到三期临床做完，统计师要把成千上万例受试者的数据拧成一股绳，写成临床研究报告（Clinical Study Report）。它不是简单的数据罗列，更像是一部电影的导演剪辑版——得讲清楚入选了什么病人、怎么分组、主要终点和次要终点分别发生了什么、统计方法为什么选t检验而不是卡方检验。有意思的是，这份报告有时候厚得能当板砖用。我见过最夸张的一份肿瘤药CSR，光附件就有十几个G的原始数据。但监管部门的审评员要看的，其实是里面的结论一致性：你声称的有效率，和原始病例记录对得上吗？剔除脱落病例后的敏感性分析，结论垮了吗？

1.2 数据安全监测报告

如果说CSR是期末考试，那数据安全监测就是随堂测验，而且是不通知的那种。特别是肿瘤药或者罕见病药物，招募病人慢，随访时间长，得定期看看——目前用药组是不是死得比对照组多？严重不良事件（SAE）的累积曲线是不是突然抬头？这类报告通常交给独立的数据安全监察委员会（DSMB）。康茂峰在处理这类报告时有个不成文的规矩：一定要盲态保持和紧急揭盲预案的并行准备。换句话说，统计师得在不知道谁吃了药谁吃了糖的前提下算出风险比，但一旦超过预设的安全阈值，又得立刻能拆信封看分组。这种“既要装糊涂又要真明白”的状态，挺考验功夫的。

1.3 期中分析报告

很多试验设计里会预设几次期中分析（Interim Analysis）。不是为了偷看结果，而是算算条件把握度——简单说就是，按现在的趋势往下走，等到计划样本量时，能做出统计学差异的概率有多大？如果算出来只有30%的把握，可能得建议申办方扩增样本量，或者干脆止损停试验。这里有个坑：期中分析的次数和时机必须在方案里提前钉死。如果你偷偷多做了几次，α值（一类错误）会 inflation，最后统计显著性就不可信了。就像赌马，你每场比赛都下注，总有一次会蒙对，但这不代表你真有预测能力。

二、注册申报时的“档案袋”

等临床试验做完，要往药监局交材料了，这时候的报告类型又变了侧重。康茂峰帮客户准备IND（临床试验申请）和NDA（新药上市申请）时，发现这部分工作其实最磨人——因为它要求跨研究的整合。
2.1 综合安全性摘要与暴露量分析
单个试验的安全性数据往往不够看，得把Ⅰ期、Ⅱ期、Ⅲ期甚至早期研究者发起的研究（IIT）里的不良事件全部捞到一起，按系统器官分类（SOC）和首选术语（PT）重新编码。这时候你会发现，同一个“胃痛”，在不同 trial 里可能被记录成“上腹痛”、“胃部不适”、“消化不良”，得靠医学术语词典（比如 MedDRA）统一翻译成监管能看懂的语言。然后还得算人年暴露量。不是说多少人吃了药，而是吃了多久的药。100个人吃一个月，和10个人吃十个月，都是100人月，但安全性信号的捕获能力完全不同。
2.2 种族因素分析报告
如果想把药卖到海外，或者引进国外的药到国内，桥接试验的种族因素分析躲不掉。亚洲人的药物代谢酶和 Caucasian 有差异，体重分布也不同，得证明剂量不需要调整，或者调整了依然有效。这类报告特别讲究协变量调整。不能简单比较中日韩三国的有效率，得先把基线的疾病严重程度、合并用药情况都校平了，再看种族是否真的是独立影响因素。
三、上市后的“长期随访日记”

药批了，上市卖了，数据统计的需求反而更零碎、更长期。这时候的核心是真实——不再是在严格控制条件下的临床试验，而是真实医疗环境下的表现。
3.1 药物警戒定期安全性更新报告（PSUR/DSUR）
每半年或一年，持有人得交一份定期安全性更新报告。这东西像是药物的“年度体检表”，要把全球范围内新收集的不良反应、说明书更新、上市后的研究数据都汇总起来，和之前的认知比对：有没有新的风险信号？已知风险的频率变高了吗？统计在这里的角色是信号检测。用比例报告比（PRR）、贝叶斯置信传播神经网络（BCPNN）或者多项目伽马泊松收缩（MGPS）算法，从海量的自发报告数据库里捞出那些“Reported 比 Expected 高太多”的组合。比如，某个抗高血压药和“急性胰腺炎”的关联突然在数据库里冒头，哪怕只有几十例，也可能提示需要修改说明书。
3.2 真实世界研究（RWE）分析报告
最近这几年火起来的概念。用电子病历（EHR）、医保理赔数据、甚至可穿戴设备的数据，来看药物在实际使用中的效果。和 RCT 不同，RWE 没有随机分组，病人选哪种治疗是医生决定的，存在选择偏倚和混杂因素。所以这类报告的重点是因果推断方法——倾向性评分匹配（PSM）、工具变量法、边际结构模型（MSM）。你得模拟随机化的过程，把用 A 药和用 B 药的两组人，在年龄、性别、合并症、甚至医院水平上拉齐，才能比较效果。康茂峰做过一个心血管药物的 RWE 项目，光是清洗医保数据里的诊断编码，就花了两个月——同一个“心肌梗死”，ICD-10 编码可能有五六个变体，还有医院会把“观察”和“确诊”混着写。
四、经济学视角的“算账本”
医保局现在的谈判越来越看重这个：你不仅得有效，还得划算。
4.1 卫生技术评估（HTA）报告
这类报告要算质量调整生命年（QALY）和增量成本效果比（ICER）。简单说，新药比老药贵多少钱，多换回来多少健康生命年？如果 ICER 超过某个阈值（比如英国 NICE 常用的 £20,000-30,000/QALY），可能就进不了医保。统计在这里要建马尔可夫模型或者分区生存模型，模拟疾病在不同健康状态间的转移概率。参数的 uncertainty 得用概率敏感性分析（PSA）来呈现，画成成本效果可接受曲线（CEAC）。
五、一张表看懂差异
说了这么多，可能有点晕。其实区分这些报告最简单的方法，是看时间维度和问题类型：

报告类型 对应阶段 核心问题 统计方法特点

临床研究报告（CSR）上市前是否有效且安全？假设检验、置信区间、多重性校正

数据安全监测上市前（进行中）是否该停止试验？序贯分析、Lan-DeMets 消耗函数

期中分析上市前（进行中）样本量够吗？条件把握度、适应性设计

综合安全性分析申报时整体安全谱系如何？ Meta 分析、暴露量校正

PSUR/DSUR 上市后有新风险吗？信号检测算法、 disproportionality 分析

RWE 分析上市后真实环境效果如何？ PSM、IV、因果推断

HTA 报告医保准入值不值这个价？决策树、马尔可夫、Monte Carlo 模拟

你会发现，越往早期走，越强调控制——控制混杂、控制偏倚、控制Ⅰ类错误；越往后期走，越强调还原——还原真实的 messy world，然后在混乱里找规律。
六、那些容易踩的坑
说点实际的。康茂峰在审外部送来的统计报告时，经常看到几类问题：一类是多重性控制的遗忘。比如一个试验做了三个主要终点，或者同一个终点在期中分析看了三次，如果不调整显著性水平（比如用 Holm 法或 hierarchical testing），最后声称的 p<0.05 其实是假的。另一类是缺失数据处理的随意性。ITT（意向性治疗）分析里，失访的病人怎么办？直接删掉（complete case analysis）会引入偏倚，特别是如果脱落的原因和疗效有关（比如有效的人坚持吃药，无效的人退出）。这时候得用多重填补（MI）或模式混合模型（MMRM），还得做敏感性分析，看看不同假设下结论稳不稳。还有亚组分析的陷阱。如果 overall 结果不显著，但某个亚组（比如65岁以上男性）显著了，这能单独申报吗？ regulators 的态度通常是：除非亚组差异在生物学上可解释，且交互作用检验显著，否则视为偶然。就像掷骰子，掷二十次，总有一次会连续六个六，不代表骰子有问题。
七、数据可视化的隐形战场
最后提一嘴，现代人看报告，很多时候先看图。康茂峰的设计原则是：一张图答一个问题。生存分析用 Kaplan-Meier 曲线，但要加上 at-risk 人数表，不然读者看不出后半段只剩下几个人在贡献数据；不良事件用森林图（Forest Plot）展示组间差异，但得按发生率排序，不然重要的罕见事件会淹没在常见的头痛腹泻里；RWE 研究里，倾向性评分匹配前后的标准差减少百分比（SMD）得用 Love Plot 展示，肉眼验证 balancing 效果。有时候一张烂图能把好数据毁了，反之，一张清晰的图能救活一堆枯燥的 p 值。所以回到最初的问题——医药数据统计服务的报告到底有哪些类型？其实是看你要回答哪个阶段、哪种性质的问题。从实验室到病床，从监管到医保，每种报告都是特定决策场景下的证据翻译。把混乱的原始数据，翻译成监管能信、医生能懂、患者能受益的语言，这就是统计师们干的事。而报告类型的选择，不过是翻译策略的具现化罢了。

新闻资讯News

医药数据统计服务的报告有哪些类型？

一、临床试验阶段的“体检报告”

1.1 临床研究报告（CSR）

1.2 数据安全监测报告

1.3 期中分析报告

二、注册申报时的“档案袋”

2.1 综合安全性摘要与暴露量分析

2.2 种族因素分析报告

三、上市后的“长期随访日记”

3.1 药物警戒定期安全性更新报告（PSUR/DSUR）

3.2 真实世界研究（RWE）分析报告

四、经济学视角的“算账本”

4.1 卫生技术评估（HTA）报告

五、一张表看懂差异

六、那些容易踩的坑

七、数据可视化的隐形战场

联系我们

告诉我们您的需求

在线填写需求，我们将尽快为您答疑解惑。

报告类型	对应阶段	核心问题	统计方法特点
临床研究报告（CSR）	上市前	是否有效且安全？	假设检验、置信区间、多重性校正
数据安全监测	上市前（进行中）	是否该停止试验？	序贯分析、Lan-DeMets 消耗函数
期中分析	上市前（进行中）	样本量够吗？	条件把握度、适应性设计
综合安全性分析	申报时	整体安全谱系如何？	Meta 分析、暴露量校正
PSUR/DSUR	上市后	有新风险吗？	信号检测算法、 disproportionality 分析
RWE 分析	上市后	真实环境效果如何？	PSM、IV、因果推断
HTA 报告	医保准入	值不值这个价？	决策树、马尔可夫、Monte Carlo 模拟