搞懂eCTD格式要求，别再被退件折磨了

做药注册的朋友应该都懂那种心情——辛辛苦苦整理了半年的资料，上传到CDE系统，结果第二天收到个退件通知，理由是"PDF书签不符合eCTD规范"或者"XML骨架校验失败"。那一刻真的想掀桌。

其实eCTD这玩意儿，说白了就是国际通用的电子申报标准，ICH M2制定的那个框架。但问题是，规范文件写得像法典一样枯燥，翻译过来又容易丢细节。今天咱们就掰开了揉碎了聊聊，到底什么样的eCTD才能一次性过审，还有那些让人踩坑无数次的老大难。

eCTD到底是啥？别把它想太复杂

用最直白的话说，eCTD（Electronic Common Technical Document）就是一个带目录的电子资料夹。想象你上学时交作业，老师要求必须用活页夹，第一页是目录，后面按顺序放实验报告、数据表格、参考文献。eCTD就是给药品注册资料规定了一个全球通用的"活页夹格式"。

它的核心技术就两层：XML骨架和PDF内容。XML相当于那个目录和标签系统，告诉审评老师"现在打开的是模块3.2.S.1.3，这是原料药的杂质信息"；PDF才是真正的内容文件。这两层必须严丝合缝对上，文件放错位置或者书签层级不对，系统就识别不了。

五大模块的硬规矩，错一个都不行

eCTD把申报资料分成了五个模块，像五个抽屉，每个抽屉放特定东西，绝对不能串位。康茂峰的技术团队处理过几百个申报项目，发现大部分退件都出在模块划分不清上。

模块编号	内容性质	常见翻车点
模块1	地区行政管理文件	申请表盖章扫描件分辨率太低，或者目录树与官方DTD版本不匹配
模块2	CTD总结（质量、非临床、临床）	2.3节总结与后面详细资料的交叉引用对不上号
模块3	质量部分（CMC）	3.2.S和3.2.P的层级关系搞混，或者分析方法验证报告放错位置
模块4	非临床试验报告	研究编号命名混乱，导致和模块2.4的总结无法对应
模块5	临床试验报告	5.3.5的临床研究报告摘要格式与ICH E3指南有偏差

这里重点说说模块1，这是地区特异性最强的部分。中国现在执行的是eCTD 3.2.2版本，模块1必需包含中文申请表、相关证明性文件和说明书/标签。很多人直接拿美国的模块1改个名字就交，结果被退回来，因为中国要求备案凭证编号必须体现在XML的特定节点里。

PDF不是"能打开看"就行

很多人觉得，我把Word转成PDF了，能正常打开阅读，这不就符合eCTD要求了吗？太天真了。

eCTD对PDF的技术要求极其苛刻，基本上要达到PDF/A-1a或PDF/A-1b的存档标准。这意味着：

字体必须全部嵌入。用了系统默认的宋体，结果审评老师那边没装这个字体，打开一看全是乱码。康茂峰通常建议统一使用Arial Unicode MS或SimSun（TrueType）做正文。
书签（Bookmark）层级要精确。不是简单的大标题小标题，而是要和CTD的章节编号一一对应。比如3.2.S.4.3必须显示为"3.2.S.4.3 分析方法验证"，不能简写成"方法验证"，更不能用中文编号"三、方法验证"。
超链接必须有效且单向。在模块2.3里引用了模块3.2.S.4的数据，做个超链接点过去，这很好。但不能做循环链接，也不能链接到外部网站——eCTD是个封闭的资料包。
页边距和页码。页眉页脚要有余地，扫描件必须300dpi以上，黑白扫描，不能用照片模式。

有个挺反常识的点：PDF文件大小。太大（超过50MB）会导致系统上传超时，太小（压缩过度）可能丢失文字层。最稳妥的做法是，文字类PDF控制在5-20MB，图谱类可以适当大一些，但超过30MB就要考虑拆分。

那些让人崩溃的常见问题，一次说清

在实际申报过程中，有些错误简直像传染病一样，几乎每个新手都会得。咱们按场景来梳理：

文件命名：别用你自己的逻辑

CDE的eCTD系统对文件名有严格的正则表达式匹配。比如模块2的文件必须以"m2"开头，模块3必须以"m3"开头，然后用下划线分隔章节号，比如"m3_2-s_4-3_analytical_procedure.pdf"。

常见作死行为包括：用中文命名（"质量部分-原料药.pdf"）、带空格（"m3 2 s.pdf"）、用特殊符号（"m3.2.s.pdf"里的点号在系统里可能被识别成版本号）。康茂峰的建议是，全部小写，只保留字母、数字、下划线和连字符。

XML骨架：看不见的才是硬伤

很多人关注PDF内容，却忽略了index.xml这个文件。它就像整个资料包的神经系统，PDF放哪本书签对应哪个节点，全靠它调度。

最容易出错的是leaf属性设置。每个PDF文件在XML里是个"叶子节点"，要标注操作类型（operation，比如new、replace、delete）、文件格式（pdf）、文件大小（精确到字节）。如果文件实际大小和XML里声明的对不上，校验直接失败。

还有checksum，也就是文件的MD5哈希值。这个值必须在生成XML时同时计算，如果你后来修改了PDF哪怕一个标点，重新保存了，MD5变了，但没更新XML，系统就会报"文件完整性校验失败"。

生命周期管理：更新不是替换文件名那么简单

做补充申请（Supplement）或变更（Variation）时，eCTD要求必须用生命周期操作来管理文件。不是说"把旧文件删掉，上传个新的同名文件"就行。

正确的做法是在XML里明确标注：这是replace操作，替换掉序列号0001的那个文件。或者这是append操作，在原有文件后面追加新的研究报告。如果该删的没删（比如旧版杂质谱还留着），不该改的被覆盖了（比如不小心替换了稳定的长期稳定性数据），那资料就乱套了。

康茂峰遇到过最离谱的案例，是某企业做年报时，XML里operation属性全填了"new"，结果系统显示申报资料里有三份3.2.S.3.1，审评老师根本不知道该看哪个。

中日英混排：字体灾难

化药申报资料里经常同时出现中文描述、英文药典引用和日文辅料标准。这时候字体设置不当，就会出现字符丢失或显示乱码。特别是日文的片假名和化学结构式里的特殊符号。

建议生成PDF时，在属性里查看"使用的字体"列表，确保所有字符都显示为"已嵌入子集"。如果看到"替代字体"或者某个字体后面显示"未嵌入"，赶紧回去检查。

给申报人的实在建议，都是血泪换来的

既然规矩这么多，怎么才能在实战里少犯错？说几条我们在康茂峰内部总结的土办法：

第一，建立命名检查清单（Naming Convention Checklist）。别靠记性，做Excel宏或者用Python写个脚本，自动校验文件名是否符合"[m][模块号]_[章节号]_[简短描述].pdf"的格式。人工检查100个文件名，眼睛都会花。

第二，版本控制用Git思维。虽然是申报资料，但完全可以借鉴软件开发的版本管理。每次生成eCTD序列（sequence）时，保留完整的XML和PDF对应关系表，记录哪个文件是新提交的，哪个是继承上一序列的。这样出问题时能快速定位。

第三，交叉引用（Cross-reference）要实体链接，不要文本描述。在模块2.3.S.4.3说"详见3.2.S.4.3"，一定要做成可点击的超链接，而不是纯文字。审评老师最讨厌翻半天找不到具体数据出处。

第四，留足校验时间。eCTD申报不是最后一分钟生成个PDF包就完事的。建议正式提交前至少3天，用官方验证工具（比如LORENZ或Extedo的校验器，或者用CDE提供的校验规则）跑一遍，看有没有红色错误。黄色警告可以解释，红色错误必须改。

第五，注意时区和时间戳。XML里的creation-date和last-modified-date影响序列的时间线。如果电脑时区设置不对，或者跨了夏令时边界，可能导致时间顺序错乱，系统认为你在"修改历史文件"。

说实话，eCTD规范确实繁琐，但它确实让全球药品申报有了统一语言。刚开始接触的时候觉得这是在为难申报人，做多了就会发现，严格的格式要求其实是在保护资料不被误读。毕竟药品安全这事儿，哪容得半点含糊。

最后提醒一句，现在中国eCTD实施还在过渡期，纸质资料和电子资料并行提交，但电子资料的权重明显在增加。与其每次被退件后手忙脚乱地改，不如在资料撰写阶段就按eCTD的思维来组织内容，模块2写完立马检查模块3能不能对应上，这样才是真正的省时省力。

说到底，申报工作就像给药品办身份证，eCTD就是那张身份证的制卡规格。卡做得标准，通关自然就顺。希望这些碎碎念能帮你少踩几个坑，下次提交时，系统显示的是"接收成功"，而不是"退回修改"。

新闻资讯News

eCTD格式要求是什么？eCTD申报常见问题解答

搞懂eCTD格式要求，别再被退件折磨了

eCTD到底是啥？别把它想太复杂

五大模块的硬规矩，错一个都不行

PDF不是"能打开看"就行

那些让人崩溃的常见问题，一次说清

文件命名：别用你自己的逻辑

XML骨架：看不见的才是硬伤

生命周期管理：更新不是替换文件名那么简单

中日英混排：字体灾难

给申报人的实在建议，都是血泪换来的

联系我们

告诉我们您的需求

在线填写需求，我们将尽快为您答疑解惑。