藏刊網,職稱文章發表、期刊投稿權威機構

投稿咨詢

投稿在線咨詢

專著咨詢

合著&獨著&編委

編輯在線咨詢

專利咨詢

專利申請&轉讓

編輯在線咨詢

軟著版權

軟著版權

編輯在線咨詢

在線溝通

論文&專著&專利

編輯在線咨詢

微信聊

微信掃一掃

首頁 > 科學論文 > > 淺析現階段高通量測序中的拼接問題
淺析現階段高通量測序中的拼接問題
>2023-07-21 09:00:00

本文總結了現階段高通量測序中拼接問題的研究結果,針對現在流行的各種算法進行了簡單介紹。大家在相關論文寫作時,可以參考這篇題目為“淺析現階段高通量測序中的拼接問題”的基因工程論文。

原標題:高通量測序中拼接問題的研究現狀

摘要:近年來,隨著第二代測序技術的普及和第三代測序技術的逐步發展,高通量測序技術在實際研究中的應用越來越廣泛。高速率、高性價比是其主要優點。相對于傳統的桑格(Sanger)法測序來言,高通量測序得到的片段長度較為短小,故如何拼接得到完整的序列一直是炙手可熱的研究方向。本文總結了現階段高通量測序中拼接問題的研究結果,針對現在流行的各種算法進行了簡單介紹。

關鍵詞:高通量測序;reads 拼接;contigs 組裝;OLC、De brujin 圖

一、測序技術的發展過程和現狀[1]

(一)桑格法

桑格法又叫做雙脫氧鏈終止法,由Sanger在1977年提出。通過加入帶有放射標記的dd NTP(雙脫氧核苷酸)使DNA合成終止。再通過電泳,并使用放射自顯影技術讀出堿基。此方法得到的片段較長,能達到1000bp左右。

(二)第二代測序技術

隨著科學技術的發展,傳統的桑格法已經不能滿足研究的需要??茖W家們需要更快的速度、更高的通量以及更低廉的價格,于是第二代測序技術應運而生。其核心思想是邊合成邊測序?,F在主要有454 GS FLX、SOLi D和Illumina/Solexa GenomeAnalyzer三個平臺。第二代測序是現階段測序技術的主流,也是高通量測序的開始。

(三)第三代測序技術

第三代測序技術是指單分子測序技術。不需要經過PCR的過程即可測序,速度可以達到每秒十個堿基。通量更大,讀長更短,是現階段測序技術的發展方向。

二、高通量測序中的拼接工作

(一)高通量測序所得片段的特點

高通量測序之后所得到的序列片段稱為reads(讀?。?,其主要特點兩點。一是長度短,一般在200bp以 下,最長的454平臺能達到的長度也不過1000bp,因此需要進行 大量的拼接才能得到整條DNA序列。二是有部分重疊,由于測序位置具有隨機性,故各reads總會有一定的重疊,這些重疊是拼接工作的關鍵。

(二)拼接過程

整個拼接過程分為兩步。第一步,考察reads的重復序列,并拼接成更長的片段,稱為contigs(重疊群),這一步稱為reads的拼接;第二步,確定contigs之間的順序關系,并按此排列,形成稱為scaffolds的序列,這一步叫做contigs的組裝。

三、Reads的拼接

(一)拼接過程的難點

reads拼接過程中要克服的難點主 要有兩點,一是高通量測序得到的reads長度較短,故內含信息較少,不易確認相對順序。二是遠程連接信息(Long-range linking information)的不可靠性。 2這兩點制約著reads拼接過程的準確率。

(二)方法[3]

reads拼接過程中算法的基本要求是de novo(從頭測序),即不需要任何序列信息即可對原料進行測序。由此衍生出兩種主流的算法:

1.OLC

OLC,即交疊-排列-共有序列算法(Overlap-layout-consensus),是一個比較傳統的算法,其基本思想為根據reads間的重復部分,確定可能性的reads連接順序。

其步驟為:構建交疊圖:對每兩個reads進行比對,計算它們的重疊度---排列reads:將reads進行排列,確定它們之間的相對位置,建立overlap圖---生成共有序列:通過多序列比對等方法,確立最后的contig.

OLC算法的計算量主要體現在交疊圖的構建,而高通量測序得到的海量短序列有大量的交疊,往往需要大量的運算時間。故OLC算法并不適合現在高通量測序的發展趨勢?,F在某些拼接軟件,如Shorty、CABOG等仍在使用基于此的算法。雖然這些軟件針對OLC算法有一定的改進和優化,但其拼接速度和準確性仍受到限制。

2.De brujin圖

基于De brujin圖(DBG)的算法是現在最流行的算法,許多常用的拼接軟件如Velvet、ABy SS等都在使用這種算法。其特點為把基因序列的拼接問題轉化為了數學上的圖論問題,大大提高了拼接效率。

(1)基本思想

reads中 連 續 的k個 堿 基 稱 為k -mer,作 為DBG的節點,兩個k-mer如 果在同一read中 相鄰,則形成一條邊。故每個read都會對一些邊加權,最后形成一個含有節點、有權值的邊的DBG,由此生成最佳的contig.

綜合排序
投稿量
錄用量
發行量
教育界

主管:廣西壯族自治區新聞出版局

主辦:廣西出版雜志社

國際:ISSN 1674-9510

國內:CN 45-1376/G4

級別:省級期刊

中國報業

主管:中國報業協會

主辦:中國報業協會

國際:ISSN 1671-0029

國內:CN 11-4629/G2

級別:國家級期刊

中國房地產業

主管:中華人民共和國住房部和...

主辦:中國房地產業協會

國際:ISSN 1002-8536

國內:CN 11-5936/F

級別:國家級期刊

建筑與裝飾

主管:天津出版傳媒集團有限公司

主辦:天津科學技術出版社有限...

國際:ISSN 1009-699X

國內:CN 12-1450/TS

級別:省級期刊

財經界

主管:國家發展和改革委員會

主辦:國家信息中心

國際:ISSN 1009-2781

國內:CN 11-4098/F

級別:國家級期刊

文化月刊

主管:中華人民共和國文化部

主辦:中國文化傳媒集團有限公司

國際:ISSN 1004-6631

國內:CN 11-3120/G2

級別:國家級期刊

期刊在線投稿系統
上傳文件
支持上傳.doc、.docx、.pdf文件
18年國內外學術服務,發表國際文獻請認準藏刊網官網

資深編輯團隊

專業設計投入方案

投稿成功率極高

企業信譽保障

對公交易更安全

人民群眾口碑好

高效投稿流程

審稿快!出刊快!檢索快!

正規刊物承諾

無假刊!無套刊!

投稿成功!

藏刊網提醒您

1.稿件將進入人工審稿階段,審稿后會有編輯聯系您,請保持手機暢通。

2.為避免一稿多投、重刊等現象影響您的發表,請勿再投他刊。

確定

投稿失??!

藏刊網提醒您

由于網絡問題,提交數據出現錯誤,請返回免費投稿頁面重新投稿,謝謝!

確定

藏刊網收錄400余種期刊,15年誠信發表服務。

發表職稱文章,覆蓋教育期刊、醫學期刊、經濟期刊、管理期刊、文學期刊等主流學術期刊。

  投稿郵箱:cangkan@163.com

本站少量資源屬于網絡共享如有侵權請您聯系我們,將在第一時間刪除。

版權 2009-2022 版權所有:河北藏刊文化發展有限公司 工信部備案:ICP備20016223號 冀公網安備13010502002858號

青青青爽不卡一区二区_操婷婷色六月中文字幕_国产精品yjizz视频网_中文无码一级大片_A级毛片100部免费观