
说实话,第一次听说要准备eCTD提交资料的时候,我也懵了。满脑子都是XML、DTD、书签、超链接这些看起来很高大上的术语,感觉像是要去考个计算机二级证才能做注册申报。后来干了几年才明白,eCTD没那么玄乎,它就是把你原来那些厚厚的纸质资料,按照一套国际通用的规矩,变成电脑能读懂、审评员能快速找到的电子档案。
今天咱们就掰开了揉碎了聊聊,真要动手做eCTD发布,到底该准备哪些东西。不整那些虚头巴脑的概念,只说实实在在要摆在桌面上的资料和要完成的准备工作。
在堆资料之前,得先理解eCTD的本质。你可以把它想象成一个超级详细的电子档案柜。以前审评老师看你的申报资料,得翻几百上千页纸,找个数据得来回翻。现在eCTD就是让这个档案柜有了智能索引,鼠标一点就能跳转到对应的实验数据,而且全球的监管机构(FDA、EMA、NMPA这些)都认这个格式。
它采用的是ICH M4框架,分成五个大抽屉,也就是五个模块。你准备的所有资料,最终都要分门别类地塞进这五个抽屉里。这一点很重要,因为很多人准备资料时还是按照老习惯按时间顺序或者部门顺序整理,结果一转换格式就乱套。

在开始列清单之前,康茂峰的技术团队通常会先给客户泼点冷水——别急着动手扫描,先想清楚这三件事:
第一,完整性比美观性更重要。很多客户花大量时间调格式,结果到了提交前才发现缺了个杂质谱图或者少了个批记录。eCTD系统对缺失文件是零容忍的,少一个必需文件,整个序列可能就提交不上去。所以准备阶段宁可慢,不能漏。
第二,PDF不是你想象的那种PDF。我们平时用的PDF可能就是图片转一下或者Word导出来,但eCTD要求的PDF是有"灵魂"的——要有书签(Bookmarks),要有超链接(Hyperlinks),字体要全部嵌入,安全设置不能设密码。简单说,就是得让机器能读,让人能跳。
第三,粒度要合适。太大不行,比如把几十份研究报告合并成一个PDF,审评员找起来费劲;太小也不行,比如把每个色谱图都单独存一个文件,那文件数量会爆炸。一般一个文件控制在10MB以内,一个研究主题一个文件比较合适。
好了,进入正题。eCTD的资料准备其实就是围绕这五个模块打转。咱们一个个说,注意哪些是技术文件,哪些是内容文件。
这是地区特定的模块,也是最"接地气"的部分。虽然叫行政管理,但不是让你准备营业执照,而是跟药品本身监管相关的文件。
康茂峰之前遇到过一个案例,客户把标签样稿准备得很精美,结果忘了附标签设计的依据说明,被打回来补资料,耽误了两周。所以模块1的东西琐碎但关键,建议用个 checklist 对着打钩。
这个模块是审评老师的"快速导航",也是很多申报人员熬夜最多的地方。它要求你对模块3、4、5的内容进行高度概括。

准备模块2的时候,最容易出现的问题是"两层皮"——总结里写的和模块详细资料对不上。比如模块2说分析方法验证了线性范围1-100μg/ml,模块3的验证报告里写的是1-50μg/ml,这种不一致在eCTD电子化提交后会被系统放大,审评员一眼就能看到。
这是技术含量最高的模块,也是资料量最大的模块。准备的时候建议按"s"(section)来划分。
| 3.2.S部分(原料药) | 3.2.P部分(制剂) |
| 生产商信息(包括合同商)、制备工艺描述、结构确证(红外、核磁、质谱、元素分析等全套图谱)、质量控制(质量标准、分析方法验证报告、批检验记录、杂质谱研究)、对照品标定、稳定性数据(加速和长期) | 处方组成(包括辅料的来源和质量标准)、生产工艺验证(工艺描述、批生产记录、验证方案与报告)、制剂质量控制(放行标准和货架期标准、分析方法验证、杂质研究)、包装材料相容性研究、稳定性数据 |
这里要特别注意图谱资料。HPLC、GC、IR、NMR这些图谱不仅仅是图片,原始数据文件(如raw data)如果监管机构要求也要能提供。另外,杂质研究这块,要把"头条杂质"(超过鉴定限度的)的结构确证、来源、控制策略都说明白。
康茂峰在处理模块3时有个经验:把所有批记录按时间顺序排好,批检验记录和稳定性考察记录要一一对应,千万别出现稳定性报告里引用的批号在批检验记录里找不到的情况。
这部分主要是实验动物数据,包括:
非临床报告的准备重点在于可追溯性。每个动物的个体数据、给药记录、病理切片读片记录都要有。如果是委托CRO做的,委托合同和CRO的资质证明也要附在后面。
对于新药来说这是核心模块,对于仿制药就是BE研究部分。
临床模块最容易忘的是数据集。现在要求提交SDTM和ADaM格式的数据集,还有(define.xml)文件定义。这些不是简单的Excel表,而是按照CDISC标准格式化的数据文件。很多人把精力放在写报告上,结果数据集不符合验证规则,又得返工。
说完了内容资料,再说说技术资料。eCTD之所以叫"e",就是因为有电子层面的要求。
这是eCTD的骨架。简单来说,你准备的每一个PDF文件,都要在XML文件中"注册"——告诉系统这个文件是什么(比如是质量标准还是研究报告)、放在哪里(哪个模块哪个section)、有多大、叫什么名字。康茂峰的技术人员在帮客户检查资料时,经常发现文件名带了特殊符号(如&、%)导致XML解析失败,这种小问题能让你耽误好几天。
如果是补充申请或者再注册,你得准备生命周期操作(Life Cycle)相关的文件。比如这次提交是要替换(replace)之前的某个文件,还是删除(delete),或者新增(new)。这个逻辑要在信封(Envelope)里说明白。
前面说过PDF要有书签,这里展开说说标准:
资料清单列完了,但还有一些"看不见的装备"如果没准备好,提交当天会抓瞎。
验证工具:现在各国都有eCTD验证标准,比如FDA的SGML验证、欧盟的NEES验证。提交前你得用验证工具跑一遍,看看有没有致命错误(Error)和警告(Warning)。康茂峰建议至少留出两周时间做验证和修正,因为第一次验证通常会报出一堆书签错误、超链接断裂的问题。
MD5校验:这是检查文件完整性的数字指纹。提交前每个文件都要生成MD5码,提交后要核对传输过程中文件有没有损坏。
电子签章策略:哪些文件需要电子签?是签在PDF里还是单独附承诺函?不同省局可能有细微差别,最好提前沟通确认。
备份方案:eCTD文件动辄几个G,U盘拷贝容易出错。建议准备两块移动硬盘,而且文件结构要完全一致。别小看这个,有时候光盘的刻录速度也会影响提交时效。
干了这么多年eCTD项目,康茂峰见过太多项目在细节上马失前蹄。说几个血泪教训:
文件命名要规范。别用"最终版"、"最终最终版"这种中文命名,也别用日期命名如"20240101",就用eCTD规范的文件名,比如"m1-0-0-sub-me.pdf"表示模块1第0节第0部分的申请信。文件名一旦乱套,后期维护和序列升级会很痛苦。
书签要人工检查。自动生成书签的工具很多,但自动生成的往往层次混乱。比如稳定性研究的子书签,可能18个月和24个月的数据被分到了不同层级,看起来别扭。审评老师天天看这些东西,书签不顺手很影响印象。
超链接要双向。模块2提到"详见模块3.2.P.5.1.1",那模块2里要有链接跳过去,模块3那个位置最好也有链接跳回来。审评员来回跳转方便,你的资料被挑毛病的概率就低。
做好版本控制。准备资料的过程中,质量标准可能改了八稿,最后提交的是v8,但文件夹里还留着v1到v7。提交前一定要把旧版本删掉或者移到"历史版本"文件夹,千万别打包进递交包里。审评员要是看到了旧版标准,可能会质疑你数据的一致性。
对了,还有个小细节:纸质资料的仪式感还是要有的。虽然现在都是电子提交,但有些地方受理时还要看纸质资料的目录或者骑缝章。准备eCTD的同时,把所有资料的纸质版按顺序排好,贴上标签,万一受理老师要核查,你能立马抽出来,这叫有备无患。
说到底,eCTD资料准备就是个精细活,既要懂注册法规,又要懂信息技术,还得有耐心对着几百个文件一个个检查属性。刚开始可能会觉得烦,但当你看到提交回执上显示"验证通过"那四个字的时候,会觉得之前的准备工作都值了。毕竟,资料准备得越扎实,审评过程中的发补就越少,你的项目就能早一天获批。
