2025年11月22日,北医三院生殖医学科赵晓璐副研究员团队联合北医三院成形科毕洪森主任医师、基础医学研究中心毛凤彪研究员和中山大学附属第七医院泌尿外科向熙副研究员在Nucleic Acids Research(《核酸研究》IF:13.1)杂志在线发表题为“CircleBase V2: an eccDNA annotation platform across cancers and species”(环状DNA数据库升级版: 泛癌种、跨物种的eccDNA注释资源平台)的研究论文。

论文截图
研究团队基于大规模高通量测序数据和系统化的数据整合策略,构建了新一代染色体外环状DNA(eccDNA)数据库——CircleBase V2。平台收录来自人类与小鼠的超过740多万条染色体外环状DNA,广泛整合多种组织、细胞系以及疾病模型的数据,实现了目前最全面的eccDNA资源汇聚。
CircleBase V2为研究人员提供从eccDNA发现、调控机制解析到功能推断的一站式分析平台,有助于系统揭示eccDNA在生命过程和疾病发生中的关键作用。在肿瘤诊疗领域,平台可辅助识别驱动基因扩增来源,为靶向治疗策略制定提供新的分子标志物线索。在疾病转化研究中,平台能够支持科研团队从海量组学数据中高效筛选疾病相关eccDNA,为新靶点发现、药物研发及伴随诊断奠定坚实的数据基础。
eccDNA在基因转录调控、染色质结构重塑及肿瘤异质性等生物学过程中具有重要作用。然而,现有eccDNA数据分散在不同数据库和文献中,缺乏系统整合。研究者在获取不同组织、疾病类型和物种的eccDNA数据时面临困难,同时也缺少统一的功能注释和优先级评估工具,使得识别功能相关的eccDNA、分析其调控网络以及设计实验验证方案具有挑战性。
CircleBase V2整合了大规模、多来源的eccDNA数据,包含超过380万条人类eccDNA与360万条小鼠eccDNA,较此前版本的数据规模提升至12倍。在人类样本中,eccDNA覆盖超过300种细胞类型与组织,涵盖癌细胞系、原发肿瘤样本及正常组织,揭示其在恶性与非恶性细胞中广泛存在。小鼠模块则包含来自20余种组织与细胞类型的eccDNA数据,其中神经系统来源占比最高,其次为精子与胰腺等。
同时,平台支持eccDNA功能优先级评分和跨组织、跨物种比较分析、eccDNA断点序列特征挖掘等,分析结果可通过可视化图表直观呈现。用户可以通过细胞类型、组织来源、疾病类型或特定基因进行快速检索,也可以比较不同组织或物种中的eccDNA功能差异,从而帮助筛选潜在功能性eccDNA。

CircleBase V2概览
基于此前发布的CircleBase平台,其采用的功能优先级评分系统综合了六大调控注释类别:靶基因、表观遗传标记、调控元件、染色质可及性、染色质互作以及遗传变异。然而,原有的评分方法存在两种系统性偏差:一方面,长度较大的eccDNA更容易因随机重叠而覆盖更多的功能元件;另一方面,不同染色体区域间的注释元件密度存在明显差异。
为克服上述问题,团队在CircleBase V2中引入了经过优化的打分算法,该算法同时纳入长度标准化与染色体元件密度标准化的双重校正步骤,从而确保最终评分更精准地反映eccDNA本身的功能潜力,而不受其结构特征或所处基因组背景的影响。该优化算法有效消减了长度因素带来的干扰,使整体评分的分布更为合理,为高效筛选具有功能相关性的eccDNA提供了更加可靠的数据评分。
CircleBase V2的建设旨在解决eccDNA数据分散和功能注释不统一的问题,为科研人员提供一个全面、易用的分析平台,有助于深入理解eccDNA的生物学功能及其在癌症、发育及其它疾病中的调控作用。未来,研究团队计划进一步扩展数据覆盖范围并整合先进的分析工具,以不断提升数据库的功能性和实用性。
北医三院生殖医学科赵晓璐副研究员、成形科毕洪森主任医师、基础医学研究中心毛凤彪研究员和中山大学附属第七医院泌尿外科向熙副研究员为该论文的共同通讯作者。北医三院博士生魏玲、博士后史雷胜、博士生吴宁、硕士生赵虹钰为该论文并列第一作者。此项目受到国家自然科学基金、北京市自然科学基金、北京大学临床医学+X青年专项的资助。
原文链接:https://pubmed.ncbi.nlm.nih.gov/41273082/
点击访问CircleBase V2
共同第一作者
魏玲

基础医学研究中心博士生
史雷胜

基础医学研究中心助理研究员
吴宁

生殖医学科博士生
赵虹钰

生殖医学科硕士生
共同通讯作者
赵晓璐

北医三院生殖医学科副研究员、博士生导师
主要研究方向:妇科肿瘤发生和胚胎发育的表观遗传调控机制
毕洪森

北医三院成形科主任、主任医师、博士生导师
主要研究方向:瘢痕及再生医学机制研究
毛凤彪

北医三院基础医学研究中心研究员、博士生导师
主要研究方向:肿瘤发生发展的驱动机制