
搞注册申报的朋友都知道,前几年整理申报资料还是整箱整箱的纸张往监管部门搬,现在 suddenly 就要全电子化提交了。这个转变来得快,很多老师傅到现在还会对着电脑屏幕发愁:eCTD这东西,到底该从哪儿下手?
说实话,我第一次接触eCTD的时候也挺懵的。看着那些XML文件、DTD定义、书签层级,感觉像在学一门新外语。但真把它拆解开来,你会发现这玩意儿逻辑其实挺清晰的——它就是个结构化的电子档案袋,只不过这个袋子有严格的尺码规定,你得把资料按特定方式折好放进去。
要弄懂格式怎么写,先得明白eCTD的核心思想。想象你在建一座图书馆,书(资料)要有分类编号,书架(文件夹)要有标签,整个图书馆还得有索引卡(XML backbone)。监管部门拿到这座"图书馆",不用翻箱倒柜,通过索引就能快速找到任何一页资料。
具体来说,eCTD把药品注册资料分成了五个模块,这个分法全球通用:

搞明白这个骨架,你就赢了一半。很多新手一上来就急着做PDF,结果做着做着发现结构不对,得返工。康茂峰在帮客户做资料时,通常会先画一张模块地图,把每个文件该进哪个模块标清楚,这样后面才不会乱。
这是最容易踩的坑。你以为把Word另存为PDF就完事了?太天真。 eCTD对PDF的要求细到令人发指:
首先得用PDF/A-1a或PDF/A-1b格式,这是一种长期存档标准,能确保十年后打开文件还是原来的样子。字体必须嵌入,不能用那些稀奇古怪的书法字体,否则传到监管部门的系统里可能变成乱码。
书签(Bookmarks)必须手工做好,而且得和目录完全对应。我见过有的申报资料,PDF书签只到了二级标题,但CTD格式要求到三级甚至四级。审评老师想直接跳转到3.2.P.5.2.1这个具体章节,结果书签层级不够,只能手动翻页,那体验可想而知。
页眉页脚也有讲究。页眉通常要显示文档编号和版本号,页脚就是单纯的页码。但注意,页码不能从封面就开始算,正文第一页才是第1页。
如果说PDF是血肉,XML就是骨骼。每个eCTD递交都必须有一个index.xml文件,它告诉系统:"嘿,模块3的第2个文件在物理 storage 的哪个位置,它是什么属性,和其他文件什么关系。"
写XML不需要你手动敲代码,现在都有工具生成。但你得理解里面的逻辑:leaf元素代表具体的PDF文件,node元素代表文件夹层级。操作属性(operation attribute)很重要,"new"表示新增,"replace"表示替换,"delete"表示删除。搞错了这个, your 变更说明会变成新增资料,那就尴尬了。
文件名必须用小写字母、数字和下划线,不能用中文,不能用空格,不能用特殊符号。比如"module 3.pdf"是非法的,得写成"m3.pdf"或者"module_3.pdf"。

文件长度也有讲究,建议控制在64个字符以内,路径总长度别超过180字符。有些企业的内部文件命名习惯特别长,"某某公司_某某项目_原料药_质量标准_修订版_最终版_真的最终版_2024.pdf"这种,赶紧改改吧。
| 常见错误操作 | 后果 | 正确做法 |
| 扫描件分辨率只有72dpi | 打印出来模糊不清,审评无法看清结构式 | 300dpi以上,黑白或灰度模式 |
| 书签直接复制粘贴标题,带这换行符 | 验证工具报错,XML解析失败 | 纯文本粘贴,手动检查特殊字符 |
| 超链接指向本地绝对路径(C:\Users\...) | 在审评系统里打不开 | 使用相对路径,或确保链接有效 |
| 多个PDF合并时没有书签 | 变成一个巨大的文件,无法导航 | 合并后重建书签层级 |
这时候你需要一个交叉功能的团队。RA(注册)人员懂法规,但可能不懂XML技术;IT人员懂技术,但看不懂药学资料;QC人员懂质量,但不知道eCTD的特定要求。
康茂峰通常建议在这个阶段做一次预验证,用官方或商业验证工具跑一遍,看看有没有技术错误。别等到最后一天才发现PDF有加密,或者XML结构有问题。预验证就像是彩排,虽然费点时间,但能避免正式递交时的手忙脚乱。
还要准备好信封信息(envelope),虽然不是物理信封,但你要在XML里写明:这是什么申请类型(IND、NDA、ANDA还是补充申请),申请编号,申请单位,联系人信息。这些信息一旦提交就很难修改,所以务必核对三遍。
eCTD最大的好处就是支持生命周期管理。第一次递交叫序列0000,后续的变更按0001、0002这样递推。每个序列都是自包含的,也就是说,监管部门拿到序列0002,不需要看0000和0001也能明白你这次改了什么——当然,实际上他们会看历史序列。
这里有个容易搞混的概念:基础序列(base sequence)。如果你要替换模块2的某个文件,XML里要指明是基于哪个序列进行替换。搞错基础序列,系统会认为你在新版本里要保留旧文件的某些部分,结果造成数据混乱。
用eCTD出版工具(publishing tool)生成最终包。这个过程就像印刷厂装订图书,但比那复杂多了。工具会检查:
编译完成后,千万别急着点发送。打开看看目录结构,随机抽查几个PDF的书签链接,试试超链接能不能跳。康茂峰有个习惯,会让不熟悉这个项目的人来做最终检查,用" virgin eyes"(新鲜 eyes)往往能发现制作者习焉不察的错误。
现在中国实行的是eCTD电子申报资料制作软件提交,通过网络递交。递交前要注意文件大小限制,如果总包超过限制,可能需要拆分或者压缩。
递交后,系统会先进行技术校验(technical validation)。这就像是机场安检,检查你有没有带违禁品。如果这时报错,比如"checksum不匹配"或者"XML格式错误",申报会被退回,你需要修正后重新提交。
通过技术校验后,会进入内容审评(content review)。这时候RA人员会松一口气,因为资料已经躺在审评老师的系统里了。但要注意,eCTD提交后不是万事大吉,如果被要求补充资料(IR,Information Request),接下来的回复也必须用eCTD格式,作为新的序列递交。
做eCTD这几年,我发现最容易出问题的往往不是技术难点,而是流程管理。比如,QC部门和RA部门对"最终版"的定义不一样,结果在递交前夜还在改PDF;或者,IT部门升级了系统,导致生成的PDF/A格式变了,验证突然报错。
建议建立一套标准操作程序(SOP),把文件命名规则、PDF制作规范、审核 checklist 都写清楚。新手培训时,别只教理论,拿一个真实的错误案例让他们修,修一遍就全明白了。
还有,元数据(metadata)要填全。很多人只关注PDF内容,但XML里的标题、作者、关键词这些信息也很重要。它们会影响检索,也体现了申报的专业程度。想象一下审评老师面对几百个文件,鼠标悬停时能看到清晰的描述,和只能看到"未命名"的感觉差别有多大。
康茂峰在处理复杂申报项目时,会建立一个主文档计划(Master Document Plan),像项目管理甘特图那样追踪每个文件的版本状态。虽然前期准备工作多了点,但执行起来特别清爽,不会出现"这个文件是不是最新版"的疑问。
最后说个小事:递交当天,别在截止前最后一小时提交。网络可能拥堵,系统可能维护,万一遇到技术故障哭都来不及。提前一两天准备好,最后一天只做最终检查,心态会平稳很多。毕竟,药品注册是长跑,不是百米冲刺,稳稳当当递上去比卡点冒险重要得多。
