動植物基因組從頭測序
簡介:
基因組從頭測序也叫de novo測序,主要針對基因組序列未知的物種,構建不同類型的基因組DNA文庫,并進行序列測定。然后使用生物信息學方法對測序得到的序列進行拼接、組裝和注釋,從而獲得該物種完整的基因組序列信息。
一、技術路線
動植物基因組從頭測序的主要策略:1、對短片段Shotgun文庫(300-1000 bp)進行深度測序,確保序列覆蓋度和測序準確性,獲得基因組基本序列信息;2、構建較長插入片度的Mate pair文庫(2 kb、5 kb、8 kb、10 kb、20 kb)并測序,確定短片段序列間的相對位置,通過拼接組裝獲得基因組序列框架,在此基礎上通過生物信息學方法進行基因注釋和分析。
Illumina MiSeq數據為主,結合Illumina HiSeq2000數據
二、生物信息分析
1.原始數據整理、過濾及質量評估
2. 基因組序列拼裝與分析:
♦基因組序列拼裝
♦基因組拼裝效果評估 (Contig N50、Scaffold N50、基因組大小和GC含量 )
3. 功能元件分析:
♦蛋白編碼基因預測
♦非編碼RNA預測
♦蛋白編碼基因的功能注釋
♦蛋白編碼基因的KOG和GO注釋
♦蛋白編碼基因的代謝途徑注釋(KEGG pathway)
4.根據客戶要求進行個性化分析
三、結果展示
四、樣品要求
1、DNA樣品:Miseq DNA PE文庫濃度≥20ng/μl,總量≥6μg(熒光定量);Miseq DNA MP文庫濃度≥40 ng/μl,總量≥12 μg(熒光定量);454 DNA庫濃度≥20 ng/μl,總量≥3 μg(熒光定量),電泳檢測無明顯RNA條帶,基因組條帶清晰、完整,主帶應在100 kb以上。若樣品中有多糖、糖蛋白的殘留,對打斷DNA樣品帶來非常大的困難,且很難去除,因此特別要求所提供的樣品不要有多糖或糖蛋白污染。
2、動物樣品:對于一般物種應挑選肝臟、腎臟、血液等組織取樣,對于珍貴物種請提供耳樣、毛發(帶毛根)等脂肪含量較少的組織進行取樣。為了減少個體差異對后續拼接產生的影響,盡量從同一個個體中取樣。若物種體積較小,從一個個體中提取的DNA量不能滿足測序實驗所需,在保證量的前提下,應盡量減少采樣個體的數量。提供組織樣品應>500 mg,盡量提供較多量,不同的物種DNA提取產量有差異。
3、植物樣品:植物材料應盡量選取植物組織幼嫩部位。提供組織樣品應>500 mg,盡量提供較多量,不同的物種DNA提取產量有差異。
五、華津優勢
1. 利用Illumina MeSeq平臺的長讀長優勢和Illumina HiSeq2000的高通量優勢,能獲得高質量的基因組圖譜。
2. 已完成多項大型動植物基因組測序項目,有豐富的基因組測序及分析經驗。
3. 可根據實際需求個性化定制基因組測序方案。
經典案例一
蒙古馬和普氏野馬全基因組測序
結果:雄性蒙古馬和雄性普氏野馬在拼接組裝中分別組裝了2 Mb和3 Mb的Y染色體序列,獲得了迄今為止最完整的馬的Y染色體的序列圖譜;通過蒙古馬5號染色體與普氏野馬23、24號染色體間的序列相似性分析,確認了蒙古馬和普氏野馬間的一次染色體羅伯遜易位事件,并且發現羅伯遜易位并沒有導致染色體更多的局部重排,說明羅伯遜易位和染色體局部重排可能是由不同的機制引起的。研究還發現兩種重復序列對基因組的不穩定性有著強烈的影響。
原文索引:[Huang J L, et al. Analysis of horse genomes provides insight into the diversification and adaptive evolution of karyotype. Sci. Rep, 2014, 4: 4958.]
駱駝全基因組測序
背景:駱駝是駱駝科,駱駝屬的動物,分單峰駝、雙峰駝兩種。野駱駝生活在中國西北和蒙古西南部,能夠忍受酷熱和酷寒,并且適應貧瘠和稀缺的植被。駱駝有諸多特性:一天之內,駱駝的體溫可能經歷從34到41攝氏度的巨大變化;駱駝進食八倍于牛和羊的鹽,血糖水平是其他反芻動物的兩倍,但并未罹患糖尿病和高血壓;駱駝還能制造一種名為重鏈抗體的抗病蛋白。
結果:雙峰駝全基因組大小為2.38 Gb,發現20,821個蛋白編碼基因。在其它已完成基因組測序的物種中,雙峰駝與牛的遺傳關系最近,預計的分化時間大約在5500萬—6000萬年前?焖龠M化分析發現,調節胰島素信號途徑的基因在雙峰駝中存在快速進化。研究還發現駱駝具有多個CYP2J基因拷貝,CYP2J基因與高壓升高相關。研究同時解析了駱駝嗅覺基因、解毒基因和免疫球蛋白的遺傳分子特征。
原文索引:[ Meng H, et al. Genome sequences of wild and domestic bactrian camels. Nat Commun, 2012, 3: 1202-1209.]
常見問題
1、Q:基因組框架圖和精細圖有什么不同?
2、Q:動植物基因組從頭測序時為什么需要構建不同類型的文庫?
3、Q:在動植物基因組從頭測序中,不同測序平臺分別有什么優勢?
動植物基因組重測序
簡介:
基因組重測序是對已知基因組序列物種的個體進行基因組測序,并在此基礎上對個體或群體進行比較基因組學分析。通過全基因組重測序可以找到大量的單核苷酸多態性位點(SNPs)、插入缺失(InDel)、結構變異(Structure Variation,SV)等變異信息,廣泛應用于群體遺傳學、臨床醫藥、動植物分子育種等眾多領域。
二、生物信息分析
1. 原始數據整理、過濾及質量評估
2. 基因組重測序分析:
♦與參考基因組比對
♦SNPs和InDel的檢測
♦SNPs和InDel的注釋
3. 根據客戶需求進行個性化分析
三、結果展示
四、樣品要求
1、DNA樣品:Miseq DNA PE文庫濃度≥20 ng/μl,總量≥6 μg(熒光定量);Miseq DNA MP文庫濃度≥40 ng/μl ,總量≥12 μg(熒光定量);454 DNA庫濃度≥20 ng/μl,總量≥3 μg(熒光定量),電泳檢測無明顯RNA條帶,基因組條帶清晰、完整,主帶應在100 kb以上。若樣品中有多糖、糖蛋白的殘留,對打斷DNA樣品帶來非常大的困難,且很難去除,因此特別要求所提供的樣品不要有多糖或糖蛋白污染。
2、動物樣品:對于一般物種應挑選肝臟、腎臟、血液等組織取樣,對于珍貴物種請提供耳樣、毛發(帶毛根)等脂肪含量較少的組織進行取樣。為了減少個體差異對后續拼接產生的影響,盡量從同一個個體中取樣。若物種體積較小,從一個個體中提取的DNA量不能滿足測序實驗所需,在保證量的前提下,應盡量減少采樣個體的數量。提供組織樣品應>500 mg,盡量提供較多量,不同的物種DNA提取產量有差異。
3、植物樣品:植物材料應盡量選取植物組織幼嫩部位。提供組織樣品應>500 mg,盡量提供較多量,不同的物種DNA提取產量有差異。
四、華津優勢
1、豐富的基因組重測序及分析經驗。
2、可根據實際需求個性化定制測序及分析方案。
雞基因組重測序
背景:雞是第一個完成基因組序列測定的農業動物(2004年),是研究脊椎動物遺傳、進化和發育重要的模式生物。