4月12日,中国科学院北京生命科学研究院赵方庆团队在《自然-实验手册》(Nature Protocols)上,发表了题为Full-length circular RNA profiling by nanopore sequencing with CIRI-long的研究论文,建立了环形RNA全长转录本解析和高效挖掘的技术体系。
近年的研究表明,环形RNA在真核生物体内具有广泛的生物学功能。环形RNA序列与线性RNA相似度高,因此如何高效鉴定环形RNA特有的外显子结构,是环形RNA研究中的重要问题。针对这一问题,赵方庆团队前期提出了CIRI-AS算法(基于BSJ读段对比结果对环形RNA内部可变剪接结构进行识别)。后续研究开发了CIRI-full算法(通过识别双端250bp测序数据中反向重叠区特征,对500bp以内的环形RNA进行全长重构)。由于上述方法主要基于短读长测序技术,难以对长度500bp以上的环形RNA的全长序列进行有效识别。在此基础上,研究组开发了基于纳米孔测序的环形RNA全长测定方法CIRI-long,实现了对不同长度环形RNA全长结构的高效鉴定。
该研究利用小鼠脑组织及人HeLa细胞系样本作为示例,阐释了环形RNA高效富集与全长测定方法:利用核糖体RNA去除试剂盒与改进的RNase R处理流程,消化RNA样本中的核糖体RNA与其余线性RNA分子,对环形RNA进行初步富集;利用随机引物逆转录与PCR扩增,构建cDNA文库。在该过程中,环形RNA模板可以发生滚环逆转录,产生含有多个环形RNA全长序列的嵌合体cDNA,而来自线性RNA的cDNA产物长度较短。因此,后续流程中使用了片段筛选策略,对环形RNA来源的cDNA片段进行了进一步富集,从而有效提升了文库中环形RNA来源片段所占比例。该工作利用长读长纳米孔测序技术进行cDNA分子的全长测定,并使用该团队开发的CIRI-long算法对测序数据中的环形RNA序列进行识别与错误校正,从而获得高置信度的环形RNA全长结构。
前期研究观察到使用具有模板切换活性的逆转录酶,可以在滚环逆转录产生的cDNA末端直接引入PCR引物序列,从而实现对低起始量环形RNA的高效捕获(图1)。然而,该活性依赖5’ RNA线性末端参与,因此不含5’与3’线性末端的环形RNA如何发生模板切换的原理尚未明确。该工作进一步利用体外转录构建的模式环形RNA探究滚环逆转录过程发现,经过逆转录后,大部分环形RNA模板发生了水解,从而提供了模板切换所需的线性5’末端。同时,在不加入逆转录酶的对照组中,环形RNA均保持了完整的环状结构。这提示环形RNA滚环反转录中的模板切换主要依赖RNA模板的线性化水解,为CIRI-long流程提供了重要的理论支持。
同时,该研究总结了CIRI-long方法的应用,提出了CIRI-long方法可为新型环形RNA如线粒体来源环形RNA或内含子自连型环形RNA的存在提供有力的支持证据。同时,重构获得的环形RNA全长序列可用于后续环形RNA的功能预测(如miRNA或RBP结合位点分析)。此外,利用长读长测序方法构建出的环形RNA序列,可作为评估基于传统二代测序技术的环形RNA拼接算法的标准数据集,为现有算法的改进提供指导方向。与近年开发的多个长读长环形RNA测序技术相比,CIRI-long方法实验步骤更为便捷,同时可实现对不同长度环形RNA全长结构的直接测定,可应用于多种组织与细胞样本,颇具应用前景。
研究工作得到国家自然科学基金国家杰出青年科学基金项目和重点项目的支持。
环形RNA滚环扩增及验证体系