長鏈非編碼 RNAs(long non-coding RNAs,lncRNAs)是一類長度在200nt以上且不編碼蛋白質(zhì)的RNA,以帶polyA尾和不帶polyA尾兩種形式廣泛存在于各種生物體內(nèi),參與細(xì)胞內(nèi)多種過程調(diào)控,具有跨物種的低保守性,組織特異性表達(dá)和豐度低等特點(diǎn)。
近年來的研究表明,lncRNA參與了X染色體沉默、基因組印記、染色質(zhì)修飾、轉(zhuǎn)錄激活、轉(zhuǎn)錄干擾和核內(nèi)運(yùn)輸?shù)榷喾N重要的調(diào)控過程,但絕大部分lncRNA的功能目前仍不清楚。應(yīng)用高通量測(cè)序技術(shù),研究人員能夠快速獲得與疾病或者特定生物學(xué)過程相關(guān)的lncRNA 并進(jìn)行深入研究。
實(shí)驗(yàn)方案
測(cè)序策略:Illumina 平臺(tái) PE150
數(shù)據(jù)量:12G clean data
技術(shù)優(yōu)勢(shì)
(1)任意物種檢測(cè):相對(duì)傳統(tǒng)芯片而言,無需預(yù)先設(shè)計(jì)特異性探針,因此無需了解物種基因或基因組信息,能夠直接對(duì)任何物種進(jìn)行最全面的轉(zhuǎn)錄組分析;
(2)分辨率高:可以檢測(cè)轉(zhuǎn)錄本中單堿基的差異;
(3)檢測(cè)范圍廣:從幾個(gè)到數(shù)十萬個(gè)拷貝精確計(jì)數(shù),可同時(shí)鑒定正常和稀有的轉(zhuǎn)錄本;
(4)信息分析廣:可以做基因差異表達(dá)分析、可變剪切、融合基因分析;新轉(zhuǎn)錄本預(yù)測(cè)及注釋。
數(shù)據(jù)分析
標(biāo)準(zhǔn)信息分析
(1)數(shù)據(jù)過濾及質(zhì)量評(píng)估
(2)核糖體RNA去除率計(jì)算
(3)比對(duì)參考基因組及統(tǒng)計(jì)
(4)基因表達(dá)水平分析
(5)基因表達(dá)差異及聚類分析
(6)差異基因KEGG生物通路富集分析(僅限于模式物種)
(7)差異基因GO功能富集分析(僅限于模式物種)
(8)已知mRNA表達(dá)量分析
(9)已知mRNA差異表達(dá)及聚類分析
(10)已知lncRNA表達(dá)量分析
(11)已知lncRNA差異表達(dá)及聚類分析
(12)預(yù)測(cè)新lncRNA
(13)新lncRNA鑒定和表達(dá)量分析
(14)新lncRNA差異表達(dá)及聚類分析
(15)新lncRNA家族分析
(16)SNP和InDel檢測(cè)與注釋
(17)生物學(xué)重復(fù)樣品間相關(guān)性分析
(18)蛋白互作網(wǎng)絡(luò)分析
(19)基因融合
(20)主成份分析(PCA)
(21)特征性差異表達(dá)基因分析
(22)lncRNA保守性分析
(23)可變剪切
高級(jí)分析
(1)已知mRNA-lncRNA共表達(dá)網(wǎng)絡(luò)構(gòu)建
(2)基因結(jié)構(gòu)優(yōu)化及優(yōu)化基因的表達(dá)值計(jì)算
(3)eQTL分析
技術(shù)流程
案例分析
案例(1)瘦豬和肥胖豬組織中l(wèi)ncRNA的表達(dá)水平不同
該研究對(duì)豬的兩個(gè)品種陸川和杜洛克的肝臟、肌肉和脂肪組織分別進(jìn)行了lncRNA測(cè)序,共鑒定出4868個(gè)lncRNA轉(zhuǎn)錄本,其中3235個(gè)為新轉(zhuǎn)錄本,而且lncRNA和mRNA的表達(dá)模式是組織特異性的。脂肪組織中差異表達(dá)的lncRNA具有794個(gè)潛在的靶基因,這些靶基因富集到脂肪細(xì)胞因子信號(hào)通路、PI3k-Akt信號(hào)通路和鈣離子信號(hào)通路。此外,差異表達(dá)的lncRNA位于13個(gè)脂肪相關(guān)的數(shù)量性狀位點(diǎn),其中包括65個(gè)QTL_ID。接著,分析了同一QTL_ID中的lncRNA和mRNA,并通過qPCR證實(shí)了其在兩個(gè)QTL_ID中的共表達(dá)。該研究為兩個(gè)豬品種脂肪代謝差異的分子機(jī)理提供了新的觀點(diǎn),為進(jìn)一步研究lncRNA在肥胖發(fā)育中的調(diào)控作用奠定了重要基礎(chǔ)。
圖1 組織中l(wèi)ncRNA和mRNA的差異表達(dá)
圖2 lncRNA和mRNA差異表達(dá)的熱圖
案例(2)長非編碼RNA控制造血干細(xì)胞功能
造血干細(xì)胞(hematopoietic stem cell,HSC)具有獨(dú)特的基因表達(dá)程序,能夠自我更新和分化成各類成熟血細(xì)胞。長非編碼RNA(lncRNA)已成為基因表達(dá)和細(xì)胞命運(yùn)決定的重要調(diào)節(jié)因子,盡管它們?cè)贖SC中的功能尚不清楚。該研究對(duì)純化的HSC進(jìn)行l(wèi)ncRNA測(cè)序,鑒定出323個(gè)未注釋的lncRNA。比較這些lncRNA在差異譜系中的表達(dá)顯示159個(gè)lncRNA富集于HSC,其中一些可能是是HSC特異性的(LncHSC)。這些lncRNA基因與編碼蛋白基因具有相似的表觀遺傳學(xué)特征,如通過DNA甲基化調(diào)節(jié)表達(dá)。敲低兩種LncHSC對(duì)HSC自我更新和譜系定型產(chǎn)生了的不同影響。該研究結(jié)果表明,lncRNA在HSC調(diào)控中起重要作用,為HSC調(diào)控的遺傳回路提供了一個(gè)新的思路。
圖1 HSC特異的lncRNA的鑒定
參考文獻(xiàn)
[1] Yu et al. Comparative analyses of long non-coding RNA in lean and obese pig. Oncotarget, 2017.
[2] Luo et al. Long non-coding RNAs control hematopoietic stem cell function. Cell Stem Cell, 2015.