
做注册申报这行年头久了,总会遇到那种让人哭笑不得的情况——明明资料内容都没问题,就是卡在格式上被打回来。记得去年有个品种,团队在实验室熬了三个月把数据补得严严实实,结果递交后第三天就收到补正意见:书签嵌套层级超过四级。就这一句话,整个项目组回去改了两天PDF。这种事儿在eCTD时代以前很少发生,但现在,技术门槛就这么实实在在地挡在你面前。
今天聊点实在的。不是什么官方指南的复读,而是康茂峰这些年在一线摸爬滚打攒下来的经验。eCTD这东西,表面看就是把纸质资料电子化,真干起来才发现,它是个系统工程。
很多人把eCTD理解成"把Word转成PDF打包发过去",这理解偏差可就大了。eCTD的核心是个结构化的生命周期管理体系。说白了,药监部门拿到的不是一堆散乱的文件,而是一个带着骨架的资料库,每个文件放在哪、跟前后什么关系、经历过几次变更,都得清清楚楚。
这套体系基于ICH M2 EWG制定的标准,用XML作为 backbone(骨架),PDF作为 leaf(叶片)。XML文件就像个严格的图书馆管理员,它告诉阅读系统:第3.2.S章节下面是原料药信息,3.2.S.1.3是结构和特性,现在这个PDF文件应该挂在哪个节点下。
明白了这个逻辑,你就会意识到:文件内容的正确性只是基础,文件在系统里的"位置感"才是eCTD申报的关键。

先说PDF这个看起来最简单的东西。康茂峰的处理规范里有个铁律:生成PDF的方式决定了你后期修改的成本。
我们见过太多申报人用Word直接另存为PDF,或者干脆用扫描件。短期内省事了,长远看全是坑:
正确的做法是:源文件用标准字体(Arial、Times New Roman或思源黑体),输出PDF时确保"符合PDF/A-1a或1b标准"。这个标准不是摆设,它规定了文件必须自包含(所有字体、颜色配置都在内部),保证十年后打开还是现在的样子。
另外有个细节很容易被忽略——文件名的命名规则。eCTD要求文件名只能包含特定字符:大小写字母、数字、连字符、下划线、点号。空格?不行。中文文件名?绝对不行。曾经有个项目,因为用了"模块3-原料药资料.pdf"这样的名字,系统在解析XML时直接把空格后的内容截断了,导致整个章节在审评系统里显示为空。
说到XML,非技术背景的注册人员往往心里发怵。其实不需要你会写代码,但得懂它的逻辑关系。
eCTD的XML结构就像俄罗斯套娃:Envelope(信封)套着Util-site(实用工具),下面是m1、m2、m3...每个模块。模块里再分章节,章节下面是具体文件。关键点在于href属性——这是XML指向PDF文件的路径声明,拼写错一个字母,文件就找不到了。
康茂峰在内部培训时常强调一个检查口诀:"三看XML"——
| 一看DTD | 确认使用的DTD版本与申报要求一致(比如v3.2.2还是v4.0),不同版本元素定义不同 |
| 二看叶子 | 检查每个leaf元素(leaf就是PDF文件节点)的ID是否唯一,operation属性是否正确(new/replace/delete) |
| 三看引用 | 确认交叉引用(cross-reference)指向的目标真的存在,特别是表格和图的引用 |
这里插一句关于生命周期管理的。eCTD不是一锤子买卖,上市后变更、补充申请都要基于原来的序列号(sequence number)继续提交。如果你第一次申报用的是0000,那么补充资料就是0001,而且XML里必须声明这次提交跟0000的关系。很多第一次做变更申报的同事容易在这里栽跟头,把0001当成全新的申请来建XML,结果系统里显示不出继承关系,审评员看不到历史版本。
纸质CTD时代,你只要在档案袋里按顺序放好文件就行。eCTD时代,超链接成了生命线。
康茂峰的项目经理们有个共识:做eCTD申报,至少要把30%的精力花在链接检查上。模块间的交叉引用必须做成可点击的超链接,而且要用相对路径。绝对路径(比如C:\Users\张三\文件.pdf)在你电脑上能打开,上传到CDE服务器上就失效了。
还有目录结构。纸质申报你交三大本(或N大本),电子申报得拆成模块文件。但要注意,拆分不是简单按页码砍。比如模块3的原料药部分,3.2.S.1到3.2.S.7是有机整体,如果因为文件太大而拆分,必须在XML里用stf(splitted technical file)标签声明这是同一内容的分卷,否则系统会认为这是两个独立的章节。
表格处理也是个技术活。Word里的复杂表格(特别是带合并单元格的)转成PDF后,有时候会出现单元格错位或者线条丢失。康茂峰的建议是:复杂表格尽量做成图片插入,但记得给图片加替代文本(alternative text),这是 accessibility(无障碍阅读)的要求,也是eCTD规范的一部分。
官方有eCTD验证标准,大概两三百条校验规则,从XML Schema语法检查到PDF/UA标准符合性。但 tools 归 tools,人的复核不可替代。
分享一个真实踩过的坑。某次项目,系统自动校验全绿了,但人工浏览时发现:模块1的申请表PDF,书签层级跳过了2.3直接到了2.4。原因是源文件里的标题样式应用错了,Word自动编号时漏了一级。这种逻辑错误机器很难识别,因为文件本身没坏,链接也有效,只是层级语义不对。
所以我们的流程是:机器验证+人工走读+双盲检查。找两个没参与编制的同事,一个人看着原始申报资料目录,一个人在系统里点开eCTD结构,逐个核对文件名、标题、版本号是否对应。
说到版本号,这是另一个重灾区。eCTD要求每个文件都有version属性,比如1.0、1.1、2.0。原则很简单:内容有实质性更新就升主版本号(1.0→2.0),只是修正错别字就升次版本号(1.0→1.1)。但实际操作中,团队内部容易搞混,特别是多人协作时,A同事改了文件忘了同步版本号,B同事直接覆盖上传,导致XML里登记的版本和实际PDF对不上。
递交之后,资料会进入药品审评中心的eCTD系统。有些细节不影响技术审评,但影响审评体验——而体验往往影响效率。
书签的颗粒度要适中。我见过极端的案例:一个50页的稳定性研究报告,有人做成50个书签(每页一个),也有人只做一个总书签。前者让审评老师点得手酸,后者让老师找不到具体数据。康茂峰的经验是:按三级目录结构做书签,既符合CTD的层级逻辑,又方便定位。
注释(Comments)的使用要克制。eCTD规范允许在PDF里加注释说明,比如"此处数据引用自批次XXX"。但别把注释当成批注功能乱用,特别是那种带箭头的、覆盖在正文上的高亮注释,在审评系统里可能显示异常,甚至遮挡关键数据。
电子签名的合规性。现在模块1的申请表、承诺书等需要电子签章。注意不是贴个图片签名上去就行,得是符合《电子签名法》的可靠电子签名,或者按照CDE要求提交纸质原件的扫描件(扫描件也需符合PDF标准)。有个模糊地带:有些省局要求同时递交纸质资料,有些不要,这个得提前沟通清楚,别到了递交窗口才发现缺材料。
最后列一些我们在内部执行的操作清单,供参考:
其实说到底,eCTD申报考验的不是某个单一技能,而是流程管理的精细度。从研究部门生成原始数据,到注册部门整理成CTD格式,再到IT或外包团队打包成eCTD,最后质量部门审核,每个环节都要对格式规范有基本认知。
我们遇到过最棘手的补救案例,不是资料内容出错,而是递交前发现XML的encoding声明写成了UTF-8,但文件实际另存时用了UTF-8 with BOM,导致解析头两个字节出错。这种字节级的错误肉眼看不出来,找问题找了整整一天。
所以不管你是自己做eCTD,还是委托像康茂峰这样的专业团队,建议至少在项目启动阶段就介入,别等资料写完了再"转eCTD"。那时候很多结构问题已经根深蒂固,改起来伤筋动骨。前期就把骨架搭好,后面不过是往格子里填内容,这才是eCTD应该说有的工作流。
做这行越久,越觉得注册申报像是一种翻译工作——把实验室的语言翻译成监管的语言,而eCTD只是规定了这种翻译必须使用电子版字典。字典本身不创造内容,但用不好字典,再精彩的故事也讲不明白。希望这些从实战里抠出来的细节,能让你在下一次申报时少走点弯路。毕竟时间真的挺贵的,不是用来返工修正文件名大小写的。
