
说实话,第一次接触eCTD的时候,我也被那一堆XML文件和严格的验证规则搞得头大。明明内容都准备好了,穴位图也画完了,结果上传到审评系统那一刻,弹出一串红色的error提示,那种心情大概就像精心准备的演讲稿突然被告知格式不对不能上台。
这几年在康茂峰帮企业做申报资料转换,见过太多类似的"临门一脚"失误。有些错误真的很隐蔽,比如你在本地打开PDF看着好好的,一到审评老师那边书签全乱了;又或者文件命名里多了个空格,整个模块就关联不上。今天就把这些血泪教训摊开聊聊,希望能帮你少走点弯路。
eCTD最基础的逻辑其实是把传统纸质资料"切片"成电子积木,每个文件都要知道自己该站在什么位置。但问题往往就出在这个"站位"上。
康茂峰的技术团队经常遇到客户问:"为什么我的申请编号总是验证不通过?" 很多时候是因为信封里的信息前后打架了。比如你在imi文件里写的申请号是CDE-2024-12345,但在XML的元数据里写成CDE2024-12345,少了个连字符,系统就认不出来这是同一个申请。

还有个细节容易被忽略:文件路径的大小写。Windows系统不区分大小写,但审评系统通常部署在Linux服务器上,Module1和module1在人家眼里完全是两码事。建议从一开始就养成全小写的习惯,或者严格按照ICH的规范来。
| 常见错误 | 后果 | 正确做法 |
| 使用中文路径名 | 解析失败,文件无法定位 | 全程英文路径,哪怕文件夹名也要英文 |
| 目录层级超过规定深度 | 验证工具报错"深度超标" | 保持3-4级目录,别把资料藏太深 |
| 包含特殊字符(如&、%、空格) | XML解析中断 | 用下划线代替空格,纯字母数字组合 |
很多人把书签当成锦上添花的摆设,觉得有就行。但实际上书签是审评老师导航的GPS,层级搞乱了,人家找资料得翻半天。最常见的是层级跳跃,比如一级书签下面直接蹦出个三级书签,中间缺了二级,这在eCTD规范里是不允许的。

另外就是标题复制粘贴带来的格式污染。你从Word直接拷文字到书签栏,有时候会把隐藏的格式代码带过去,显示看着正常,但导出PDF后变成乱码。康茂峰在做文件优化时,通常会建议先过一遍纯文本,把格式彻底洗掉再加进去。
PDF/A格式这个要求提了很多年,但直到今天还是出问题的重灾区。最典型的是嵌入字体不全。你用了一个很漂亮的商用字体做图表,转成PDF时没嵌入完整,审评老师那边打开全是方框或者自动替换成宋体,版式全乱了。
还有分辨率的问题。扫描件要是超过300dpi,文件体积会爆炸;但低于200dpi,有些细节就看不清。其实有个平衡点,200-300dpi之间,黑白扫描用CCIT4压缩,彩色用JPEG2000,这样既能保证清晰度,又不会让单个文件超过审评系统的大小限制。
做交叉引用的时候,大家都喜欢加超链接,一点就能跳转到相关章节,特别方便。但这里藏着个陷阱:相对路径和绝对路径。如果你在本地做资料时用绝对路径链接,比如"C:\Users\张三\Desktop\资料.pdf",上传到系统后路径变了,链接就死了。
正确的做法是用相对路径,基于当前文件的位置来定位。另外,别链接到外部网站,审评系统是内网环境,连不上外网,你链个PubMed或者FDA的链接过去,点开就是404。
XML文件是eCTD的骨架,但填写元数据的时候,很多人把这里当成填表,随便应付。实际上每个标签都有严格的取值范围。
比如说申请类型,IND、NDA、ANDA这几个选项看起来简单,但在中国申报情境下,IND对应的是"临床试验申请",NDA是"上市许可申请",选错了,整个卷宗的流向就错了。康茂峰之前处理过一个案例,企业把补充申请(Supplement)的代码填成了原始申请(Original),结果系统在库房里找了半天找不到原申请号,耽误了两周时间。
版本控制也是个大坑。eCTD要求"3段式版本号",比如1.0.0,分别代表主版本、次版本和修订版本。但实际操作中,有人写成V1.0,有人写成1.00,系统不认。更麻烦的是替换(replace)和删除(delete)操作的逻辑,你得在XML里明确告诉系统这个文件是新的还是覆盖旧的,如果状态填错了,审评端看到的可能还是旧版本。
虽然eCTD是国际通用的标准,但落到NMPA的实际审评中,还是有些本土化的要求需要注意。
比如模块1的行政信息,中国要求必须包含中文书签,而且书签的文字要和实际内容对应,不能偷懒用英文。有些企业直接把FDA的eCTD拿过来汉化,书签还是英文的,这在国内审评是不被接受的。
还有电子签章的问题。现在的要求是PDF文件本身不带签章,而是在上传系统后通过CA证书签章。但很多人习惯性地在本地就把章盖好了,导致重复签章或者签章位置错乱。其实正确的流程是:本地文件保持"干净",上传到eCTD提交系统后再走签章流程。
说了这么多,最后分享一个康茂峰内部用的自检思路。别指望审计追踪工具能抓住所有错误,机器只能验证语法,理解不了语义。
对了,还有个小细节——文件大小。单个文件超过100MB在有些系统上会上传失败,但压得太狠又影响阅读。康茂峰的经验是,如果扫描件实在太大,可以考虑拆分成逻辑单元,比如把一份200页的CMC报告按章节拆成几个PDF,这样既符合技术要求,也方便审评老师按需查看。
其实eCTD这玩意儿,说复杂也复杂,说简单也简单。它就是个规矩特别多的电子档案袋,只要你把这些规矩摸透了,剩下的就是细心活儿。下次准备提交资料的时候,不妨先把这篇文章翻出来对照看看,说不定能拦住几个让你返工的错误。
最后想说,技术永远在发展,NMPA的eCTD验证标准每年也会有微调。保持对技术规范的关注,比记住几个具体的错误代码更重要。毕竟,我们折腾这些格式和规范,最终目的不就是让好药能顺顺利利审评通过,早点送到需要的人手里吗?
