背景

circRNA是一类具有共价闭环结构的内源性RNA。虽然在高等真核生物中circRNA发现已经超过20年,但一般认为他们代表拼接错误,丰度很低的RNA。随着高通量测序和新型计算方法的出现,在不同物种中成功鉴定了出大量的circRNAs,它们才引起人们的关注。大多数circRNA源于内部外显子的反向剪切,这是一种由dsRNA结构促进的非典型的剪接过程。circRNA的功能在很大程度上仍不得而知。已有少数circRNA被证明参与转录后调控,它可作为miRNA“海绵”,具有降低miRNA和锚定mRNA的能力,从而加强靶向基因的翻译。也有人提出一些miRNA可以“海绵”其他因子,如RNA结合蛋白,用于将转录因子等分子结合、储存或封存到特定的亚细胞位置, 越来越多证据表明,circRNA可能不是一类非编码RNA,至少其中一些是可翻译的。事实上,带有核糖体进入位点(IRES)的人造circRNA可以在体内或体外进行翻译,但其编码和翻译蛋白质的能力有待进一步研究。在这篇文章中,Yun et al. 不仅证实了circRNA能翻译这个特点,而且证实了circRNA的编码区前的m6A修饰序列才是翻译需要的序列。

m6A修饰与circular RNA的翻译

在这一篇文章中,作者发现了circRNA具有能够像mRNA一样被翻译的能力,并着重强调了在circRNA的m6A修饰对翻译的起始是至关重要的。该m6A驱动的翻译需要翻译起始因子eIF4G2和m6A reader YTHDF3,并且该过程能被甲基转移酶METTL3/14以及热休克蛋白增强,被甲基酶 FTO抑制。作者更进一步发现了这种m6A驱动的circRNA翻译是很普遍的,从而扩大了人类对人类转录组的功能的认识。

作者首先设计了一个circRNA报告系统,该系统能够巧妙地验证back-splicing的发生,只有发生了back-splicing,报告系统中的GFP编码序列才能从分割状态回到完整状态,并且能够通过RCP检测出来。

在设计了报告系统后,作者用该系统检测circRNA是否能够在体内翻译,并探究了翻译需要的条件。作者将该系统转入细胞中,证明了circRNA能够在细胞内进行翻译。在这一实验过程中,作为相对于核糖体进入位点IRES 的negative-control序列居然也能引起翻译,所以作者对这些序列分析,发现这些序列的共同特点是他们都是m6A motif,从而作者提出了m6A修饰促进circRNA翻译的假说。为了验证这假说,作者对circRNA的甲基化程度做了多种改变,得到了甲基化程度与circRNA翻译水平呈正相关的结论。并且,在类比mRNA甲基化的功能后,作者做了类似的circRNA在热激后的表型实验,从而提出了circRNA可能与细胞应激反应的一些蛋白表达相关的假说。

得到甲基化与circRNA翻译相关的结论后,作者寻找了与circRNA翻译相关的一些因子,推测出与circRNA翻译相关的整个流程。之后,作者深入挖掘人类转录本,得到circRNA在人体内是广泛表达的,并与编码蛋白相关的结论。

作者的研究过程是发现了circRNA能够被翻译,然后设计一个验证系统验证该功能,并且逐步挖掘出circRNA翻译机制的内在原理及调控。

circRNAs containing m6A motifs are translated inside cells

为了证实circRNA能够在细胞内被翻译,作者构建了一个最小的报告系统,该系统使用了一个split GFP,以及一个病毒来源的IRES序列。这是根据作者之前的工作Efficient backsplicing produces translatable circular mRNAs 中得到内容,该circRNA系统的翻译是被多种对照严格验证的,包括引入破坏内含子配对的突变,用RNase 处理样本,用限制性内切酶将表达质粒切割成线性DNA,以消除假阳性。A图显示了该验证系统的大致结构。circRNA一般是通过反向重复序列的内含子形成dsRNA然后剪接而成,虽然一些非重复的也能形成circRNA。A图表示,pre-mRNA通过CMV启动子转录出来,一旦形成了circRNA的结构,就能用一组反向的引物对RNA进行PCR,然后检测出是否发生了环化(图1.A, B)。并且,如果能发生翻译,在表型上也能看到GFP的表达,此设计中线性的mRNA是不会有GFP表达的。形成了circRNA 结构后,翻译可以由不同的IRES以及一些beta-actin的控制序列所驱动,能够在蛋白以及RNA水平上检测到GFP的表达,从而证明了circRNA能够被翻译。来自beta-actin的控制序列在实验设计上为IRES的negative control,然而在(图1.B)中却发现它并没有预期表型,反而同样表达了GFP。所以,为了理解“阴性对照”序列如何诱导环状rna翻译,作者检测了其翻译起始位点附近的序列(图1C),发现在起始位点附进的序列为RRACH (R = G or A; H = A, C or U) ,经过聚类分析,该序列属于RNA最广泛的m6A修饰发生的序列。在(图1D)中,横轴为m6A位点的出现频率,纵轴为累计的分布,可以看到与所有编码的mRNA相比,预测的m6A序列在已知的circRNA中显著更富集。并且通过MeRIP-Seq(一种检测m6A的测序)发现,circRNA的甲基化密度比mRNA更高(图1. E)。因为在一些文献报道中显示,mRNA的m6A修饰能提高翻译效率,而且在作者的实验中发现RRACH序列能够促进circRNA的翻译(图1. B),所以作者提出了一种假说:带有m6A修饰的RRACH序列,可能参与了circRNA翻译的起始。为了验证该假说,作者在他的circRNA翻译报告系统上使用了几种不同的序列,这些序列在start condon前,分别包含了2个,1个,0个拷贝的m6A修饰位点(GGACU),以及一个不含A的control序列(图1. F)。转染到细胞中后,都能在RNA水平上检测到circRNA的产生,但是在蛋白水平上,蛋白的表达量与甲基化的数量呈现正相关(图1. F),也就是说m6A修饰越多,表达约强。另外,使用其他文献报道过的RNA m6A位点以及削弱了甲基化的突变体做重复实验,也一样证明了m6A修饰程度与翻译的量呈正相关(图1. G)。

m6A修饰与circular RNA的翻译
图1. N6 -methyladenosine promotes circRNA translation

Modulation of m6A level in circRNA affects translation efficiency

上一段中提到了m6A程度与circRNA的翻译是正相关的,为了进一步评估m6A对circRNA的重要程度,作者首先使用RNA-IP验证了circRNA的m6A motif是否真的发生了甲基化以确认该相关性是由序列而来还是m6A修饰而来。使用anti-m6A的抗体进行RNA-IP,在获得的RNA中能够检测到circRNA(图2. A),FTO是甲基酶,能够去甲基化,在共转了FTO表达质粒的细胞中,获得的circRNA 显著减少,与减少了甲基化程度的突变体RSV-mut类似。也就是说,circRNA的m6A motif是发生了甲基化的。对这些细胞的RNA以及蛋白质进行分析,FTO对circRNA的转录几乎无影响,但是在翻译水平上,共转了FTO的细胞中,GFP的表达量显著下降(图2. B)。FTO处理降低甲基化程度,那么反过来提升甲基化程度也许能提高circRNA的翻译。METTL3/14是甲基转移酶,与(图2. A,B)一样的实验后,可以看到共转了METTL3/14能够提升circRNA的甲基化程度,并且大大增加了circRNA的蛋白质翻译(图2. C,D)。不过,METTL14的表达本身是不稳定的,但METTL3的共表达极大地稳定了METLL14,并协同诱导了GFP蛋白的翻译,支持了先前关于METTL3和METLL14可能形成一个稳定复合物的报道。所以D图中的METTL14条带显示METTL14的表达量不高。并且在这些甲基化以及去甲基化的实验中可以看到,甲基化对circRNA的稳定性没有影响,这与甲基化促进线性mRNA降解截然不同,这也预示着circRNA有着更高的稳定性,也许甲基化对稳定性的影响很小,也许circRNA有别的降解机制。

N6-腺苷甲基化已被证明会影响热休克应激下mRNA的翻译,circRNA的翻译也与N6-腺苷甲基化相关,所以也有可能受到影响。所以,包含了GFP的circRNA报告系统也许在热激后有同样的效果。将包含circRNA表达质粒的细胞进行热激后,GFP的翻译水平随着时间逐渐上升,同时circRNA的量无显著区别(图2. E,F),预示着circRNA的翻译也许与细胞受到外界压力后的反应相关。

m6A修饰与circular RNA的翻译
图2. Methylation of circRNA affects translation efficiency

Protein factors required for m6A-initiated circRNA translation

在这一部分,作者首先介绍了线性的mRNA有cap-denpendent和cap-independent两种翻译模式。在cap-independent translation中,eIF4G蛋白(eIF4G2)在eIF4E缺失的情况下直接识别IRES,启动eIF4复合物组装引发翻译。因为一些circRNA的翻译也是由IRES区引起的,很容易就得到他们的翻译机制相似的推论。所以,将eIF4G2 的表达量敲低后,circRNA的翻译水平就发生了显著的下降(图3. B)。就这样逐步分析出circRNA翻译所需的因子。

m6A修饰与circular RNA的翻译

Endogenous circRNAs that contain m6 A modification

为了验证具有m6A修饰且能被翻译的环状RNA在细胞内是否有重要功能,作者对含有m6A修饰的环状RNA进行了检测。作者用抗m6A修饰的抗体免疫沉淀用核糖核酸酶切割后的RNA样本,并进行测序。然后将测序结果与完整RNA样本测序结果中发现的环状RNA序列进行比对,发现测得的2450条环状RNA中有85条具有m6A修饰。根据这一比例估计,作者认为所有环状RNA中约有13%具有m6A修饰。作者同时发现m6A修饰及eIF4G2结合位点倾向出现在有AUG序列的环状RNA上,暗示这些m6A修饰可能确实和环状RNA翻译相关。

    通过筛选具有m6A修饰,潜在翻译起始位点及潜在开放阅读框的环状RNA,作者认为Hs68细胞中发现的7771种环状RNA中起码有25个具有翻译潜能。作者从这25个中选取了12个,发现其中10个确实与多核糖蛋白体具有联系。

为了找出在人类转录组中确实进行翻译的环状RNA,作者先用梯度离心的方法分离出与多核糖蛋白体具有联系的RNA,然后用核糖核酸酶切割后进行测序。然后通过寻找反向剪切连接找出测序结果中的环状RNA。作者通过该方法发现了250个与多核糖蛋白体具有联系的环状RNA。通过将测序结果与整体环状RNA序列比较,作者发现这些与多核糖蛋白体具有联系的环状RNA含有外显子较少,长度较短且具有较长潜在开放阅读框。同时,作者发现与GAPDH mRNA相比,这些与核糖体有相互作用的环状RNA更倾向于形成单核糖蛋白体。但用嘌呤霉素处理过后与多核糖蛋白体具有联系的环状RNA显著减少,暗示这些与多核糖蛋白体具有联系的环状RNA在细胞内是进行着活跃的翻译的。 为了找出以环状RNA为模板翻译出的蛋白质。作者将已知环状RNA包含反向剪切连接序列理论上可翻译出的肽段序列与293细胞裂解产物质谱结果相比较,发现了19条能匹配上质谱结果且序列各不相同的肽段。不过作者未能找到除环境压力外能提高这些环状RNA对应DNA表达的因素,因而这些找到的环状RNA翻译产物的功能仍需进一步探索。

亮点

1、人们对circ RNA的普遍认识是由外显子序列反向剪接形成闭合环状结构,非常稳定,还没有发现其确切的生物学功能,被认为是非编码RNA。本文的发现颠覆了以前的认知,circ RNA可以转录并翻译成蛋白质,这模糊了编码RNA和非编码RNA的定义,打开了新的研究领域。

2、本文从发生了阳性结果的阴性对照出发,无IRES和含IRES序列的circRNA均可翻译成目标蛋白出发,推断出了本文要探究的问题: m6A可能起始circ RNA的翻译。

3、人为构建了线性mini Gene,GFP蛋白基因被插入序列割裂,反向剪切形成含GFP的circ RNA基因,巧妙的用于本文circ RNA的研究。


我欲乘风归去,又恐琼楼玉宇,高处不胜寒。