新闻资讯News

 " 您可以通过以下新闻与公司动态进一步了解我们 "

eCTD文件的格式要求有哪些?

时间: 2026-04-14 14:54:51 点击量:

eCTD文件格式到底有啥讲究?

说实话,第一次接触eCTD的时候,我也被那些密密麻麻的技术规范整得有点懵。你说这不就是把PDF文件打包提交吗?咋还有那么多门道呢?后来跟着几个项目在康茂峰摸爬滚打下来,才慢慢琢磨明白——这玩意儿讲究的是标准化、结构化和可追溯性,不是简单地把扫描件扔进去就完事的。

咱们今天就掰开了揉碎了聊聊,eCTD文件格式到底有哪些硬杠杠,哪些细节容易踩坑。

eCTD到底是个啥结构?

先别急着讲格式,得弄明白这个"电子通用技术文档"长啥样。想象一下你要搬家,eCTD就是那个标准的 cardboard box(纸箱),里面分成了五个格子,每个格子放特定的东西。

这五个格子在咱们行业里叫Module 1到Module 5

  • Module 1:地区行政信息,在中国就是药品注册申请表、质量标准、说明书这些
  • Module 2:质量、非临床和临床研究的总结,CTD格式大家都知道的那部分
  • Module 3:质量部分,原料药和制剂的详细资料
  • Module 4:非临床研究报告
  • Module 5:临床研究报告

关键点来了——这五个模块不是随便堆在一起的,它们得靠一个XML backbone(XML骨架)串起来。这个XML文件就像是目录加导航,告诉审评老师:第一页是啥,第三页跳到哪里,这个文件和那个文件啥关系。

PDF文件的那些"苛刻"要求

咱们平时做Word转PDF,可能就点个"另存为"完事了。但eCTD里的PDF,那可是有明确技术参数的。

版本和兼容性

首先,PDF版本一般要求1.4到1.7之间(也就是Acrobat 5.0到X)。太高了不行,太低了也不行。为啥?因为审评中心的系统得能稳定打开,太新的特性可能解析不了,太旧的又支持不了某些安全功能。

字体和嵌入

这一点我特别想强调——所有字体必须嵌入。你说我用个特殊的宋体或者英文的特殊字体,如果在自己的电脑上有,到了审评老师那儿变成乱码或者替换成别的字体,那可就麻烦了。在康茂峰的质量检查流程里,字体未嵌入永远是首要拦截项。

页面尺寸和边距

标准A4纸(210×297mm),边距通常要求上下左右至少留出2.5cm。这个不是瞎规定的,是为了确保打印出来的时候,页眉页脚还有装订边都能看得清楚。

搜索性和可复制性

提交的PDF必须是可搜索的文本层,不能是 pure image(纯图片扫描)。我知道有些年代久远的图谱或者手写记录只能扫描,但正文部分要是全是图片格式,审评老师怎么复制检索呢?

文件名:看上去简单,实则易错

命名规则这块,说实话挺反直觉的。咱们平时习惯用中文起名,比如"质量标准.pdf"、"稳定性报告.pdf",但在eCTD世界里,这统统不行。

文件名必须遵循严格的8.3格式或者长文件名规范(取决于具体实施指南),而且只能包含:

  • 英文小写字母(a-z)
  • 数字(0-9)
  • 连字符(-)
  • 下划线(_)

空格、中文、特殊符号(&、%、$这些)统统不能出现。而且每个文件名在整个申请生命周期内必须唯一,不能这次叫"report1.pdf",下次更新还叫"report1.pdf",系统会乱套的。

在康茂峰的项目管理实践中,我们通常会建立一套命名词典,什么文件前缀代表什么模块,版本号怎么递增,都得提前约定好。不然光文件名返工就能折腾好几天。

XML骨架:看不见的神经系统

如果说PDF是肌肉,那XML就是神经和血管。ICH eCTD规范基于HL7 RPS(Regulated Product Submission)标准,中国eCTD也基于这个做了本地化调整。

这个XML文件里要包含:

元素 说明 常见错误
DTD验证 必须符合官方DTD定义 标签嵌套错误、缺少必要属性
Leaf元素 代表具体的PDF文件 文件路径写错、ID重复
标题层级 反映文档的目录结构 层级跳跃(从1.0直接到1.2,缺少1.1)
操作类型 新增、替换、删除 update操作写成new,导致版本混乱

XML文件的大小写是敏感的,<leaf><Leaf>在严格校验里就是两回事。而且属性值的引号必须匹配,要么全用双引号,要么全用单引号,混着用解析器会报错。

超链接和书签:别小看这些"跳转"

做eCTD最花时间的,往往不是准备内容,而是建立交叉引用。Module 2的总结里提到"详见Module 3.2.S.4.1",这个就得做个超链接点过去。

技术要求包括:

  • 内部链接必须有效,不能指向不存在的位置
  • 外部链接(比如参考文献的网址)通常不允许,或者需要特殊处理
  • 书签(Bookmark)结构要清晰,层级不能超过太多层,否则展开来一看乱糟糟的
  • 链接的矩形框要覆盖准确的文字区域,点"表3"不能跳到"图2"去

有一次我们检查一个即将提交的文件,发现有个链接链到了客户内部的服务器路径(file:///C:/Users/...),这种要是交上去,审评老师根本打不开。这种细节错误在康茂峰的提交前检查清单里属于零容忍项

中国eCTD的特殊"口味"

虽然ICH制定了国际统一标准,但每个国家都有Regional Annex(区域附录)。中国的eCTD在格式上有几个特别要注意的:

首先是Module 1的DTD,中国有自己的DTD定义,和欧盟、美国的不一样。做国际多区域提交的时候,不能把美国NDA的Module 1直接翻译成中文就往里放,XML结构得重新按照中国药监局的要求来组织。

其次是电子签章。中国eCTD目前对PDF签名的要求比较具体,涉及到申请人签章和公证问题,这和纯技术性的文件格式要求还不太一样,但同样属于格式合规的范畴。

还有光盘 or 网络传输的封装格式。虽然现在越来越多走电子申报系统,但文件打包的目录结构、压缩格式(通常是ZIP)、校验和(checksum)的计算方式,都有明确规定。根目录下直接放index.xml和六个文件夹(Modules 1-5加上Util),不能多套一层文件夹,也不能少。

那些容易被忽略的小细节

PDF的优化问题

文件大小是个实际问题。太大会影响传输和打开速度,太小了压缩过度图像失真。一般来说,单个PDF控制在100MB以内是比较安全的做法。如果图谱文件实在太大,得考虑拆分或者用合适的压缩算法。

颜色空间

彩色图像通常要求用RGB模式而不是CMYK,除非是专门用于印刷的材料。这个在扫描实验图谱的时候特别容易忽略。

时间戳和版本

每个文件的创建日期和修改日期最好不要来回变,保持一致性。有时候用不同的软件打开保存一下,时间戳就变了,虽然内容没变,但在严格的审计追踪里可能会引起疑问。

实际操作中的"土办法"与规范

规范是死的,操作是活的。在康茂峰处理过的几百个eCTD项目里,我们总结了一些既合规又高效的实践

别等到最后才做格式转换。最好的办法是在文档生成阶段就用标准化的模板,边写边嵌字体、边设置标签。如果等所有内容都定稿了再统一转PDF、统一调格式,那工作量是指数级增长的。

XML编辑工具的选择也很重要。手动写XML容易出错,最好用经过验证的eCTD编制软件(当然,这里只提康茂峰使用的合规工具链)。但不管用什么工具,最后都要用官方的Validate工具跑一遍,看看有没有DTD错误、链接断裂、文件缺失。

还有个小技巧——做两个版本。一个给电脑系统看(严格符合eCTD技术规范),一个给人看(打印友好版,页边距可能更宽,字体可能更大)。但提交时只能交前者,后者仅供内部校对使用。不过说实话,现在审评老师都是屏幕审阅,只要eCTD做得规范,阅读体验也不会差。

最后说一点关于变更管理的。eCTD不是一次性买卖,从IND到NDA,从补充申请到年报,同一个申请号下会有多个序列(Sequence)。每个序列的XML都要能"看到"之前的序列,操作类型(operation attribute)要选对:是replace(替换旧文件)、delete(删除)、还是new(新增)。选错了,新旧版本的关系就乱了,审评历史也就断了档。

所以你看,eCTD文件格式这事儿,说难也不难,就是个细致活加规范活。只要你把PDF当成需要精心调教的"成品"而不是"半成品",把XML当成有严格语法规则的"代码"而不是"说明文字",把文件名当成独一无二的"身份证号"而不是"备注标签",基本上就不会出大问题。

当然,每个项目的具体文件可能还有些特殊要求,这时候就需要结合CTD内容指南和技术规范一起看了。毕竟,格式是为了让内容更好地被理解和审评,别让格式问题挡住了你优秀研究数据的展示,那可就太亏了。

联系我们

我们的全球多语言专业团队将与您携手,共同开拓国际市场

告诉我们您的需求

在线填写需求,我们将尽快为您答疑解惑。

公司总部:北京总部 • 北京市大兴区乐园路4号院 2号楼

联系电话:+86 10 8022 3713

联络邮箱:contact@chinapharmconsulting.com

我们将在1个工作日内回复,资料会保密处理。