基因組編輯是指定點改造基因組,得到預期的生物體基因組序列從而發生遺傳改變的技術,主要是進行 DNA 序列的敲除、插入、定點突變和組合編輯等,從而實現基因功能與調控元件的系統研究[1].基因組編輯技術日益成為生物學研究的熱點,目前基因組編輯技術主要包括巨核酶技術、鋅指核酸酶技術、轉錄激活因子樣效應因子核酸酶技術及CRISPR 相關核酸酶技術[2].它們在基因工程中已經得到了諸多成功的應用,然而上述傳統的基因組編輯技術存在明顯的不足。例如,鋅指核酸梅(zinc-fingernucleases,ZFN)和轉錄激活因子樣效應因子核酸梅(transcriptionactivator-likeeffectornucleases,TALEN)核酸酶技術原理幾乎是一樣的,而一個新的 ZFN 和 TALEN 嵌合蛋白均需改造才能識別靶序列,這就使得兩種基因組編輯技術的廣泛推廣應用受阻,但 CRISPR 相關核酸酶技術只需要一小段引 導 RNA(guideRNA、g RNA) 就 能 識 別 特 定 的DNA[2],且一個新的位點只需要一個新的 g RNA,極大的簡化了基因組編輯的過程,擴大靶位點的選擇,具有更大的潛力。CRISPR 系統也可以應用于靶向基因突變和基因修正,可以實現大片段 DNA 的缺失以及復合基因編輯。
本文將針對 CRISPR/Cas 系統的結構、分類、原理以及目前具有突破性研究并迅速發展的 Type ⅡCRISPR/Cas 系統和 Type ⅢCRISPR/Cas 系統的突破性研究做較為詳盡的綜述。
1 CRISPR/Cas的基因座結構
CRISPR/Cas 的基因座結構相對簡單(圖 1),對于一個有效的 CRISPR/Cas 系統而言,通常包含兩個部分 :第一部分是位于基因組中正向重復序列和來源于外源 DNA 的間隔序列組成 3‘端 CRISPR 基因座,對于重復序列而言在長度和序列上幾乎一致,在不同的物種之間長度范圍在 21-47bp,平均在32bp[3,4];間隔序列在長度上是一致的,長度范圍在 20-72bp,但在序列上表現出多樣性[4,5].親緣關系相近的物種具有相似的重復序列,但是在全部的細菌和古細菌序列中間隔序列和重復序列都表現出極大的差異[6].第二部分是位于 CRISPR 基因座 5’端成簇的 Cas 基因,主要包括一些核酸酶、解旋酶、聚合酶和 RNA 結合蛋白等,主要參與 CRISPR/Cas系統介導的免疫過程[7].
2 CRISPR的分布與分類
目前對于 CRISPR/Cas 系統而言主要分為 3 種類型 :Type Ⅰ、Type Ⅱ、Type Ⅲ三種不同類型[8],從另一方面也反映出在自然界中 CRISPR/Cas 系統具有多態性。
Type Ⅰ CRISPR/Cas 系統在細菌和古細菌中被發現,包含 6 種不同的 Cas 蛋白,其中在干涉反應中最重要和最顯著的是 Cas3 蛋白,它包含一個 HD磷酸化水解酶結構域和一個類 DEx H 解旋酶結構域,這兩個結構域在 ATP 和Mg2+存在的情況下能夠解開ds DNA(解旋酶結構域)和切割 ss DNA(HD 核酸結構域)[9].
Type ⅡCRISPR/Cas 系 統 僅 僅 在 細 菌 的 基 因組中發現[9],其中 Cas9 是分子量很大的多功能蛋白, 參 與 cr RNAs 的 成 熟 和 隨 后 的 干 涉 反 應[10].Cas9 蛋白包含有兩個亞基,在 Mg2+存在條件下,其中 Mcr A/HNH 切割與 cr RNA 互補的 DNA 鏈,而類Ruv C 切割非互補鏈[9].
Type ⅢCRISPR/Cas 系統主要在古細菌中發現,包括 typeIII-A 和 typeIII-B 兩種類型,兩者的差別主要是A型干擾的靶標是 m RNA,B 型干擾的靶標是 DNA[11], 其 中 typeIII-B 系 統 與 其 他 1 或 2 種CRISPR 亞單位相結合[9].
typeIII-B 系統特征性蛋白是 Cas10 蛋白,而Cas10 蛋白具有 RNA 活性參與 cr RNA 的成熟和剪切入侵外源 DNA[9,10].
最近幾年,CRISPR/Cas 技術因其相對較為簡單,而得到較為迅速的發展,如在作物育種、基因治療以及動物建模等領域都已得到廣泛的應用[12].隨著測序技術的不斷發展,越來越多的細菌和古細菌的基因組信息被解密,為后續 CRISPR/Cas 系統的改造和應用提供更加有力的指導。
3 CRISPR/Cas作用機制
3.1 TypeⅡ CRISPR/Cas系統基本原理
一個簡易的 Type ⅡCRISPR/Cas 系統必定要含有 Cas9 和 g RNA,Cas9 核酸酶具有改造 cr RNA 和破壞雙鏈 DNA 的雙重功能[13],位于 g RNA5‘端的 20個左右的堿基決定 CRISPR/Cas9 系統在應用時 Cas9核酸酶特異性切割的部位,主要負責決定 CRISPR/Cas9 系統的特異性。
基 本 原 理( 圖 2):首 先,Cas9 蛋 白 與 g RNA形成復合體 ;其次,上述復合體切割與 g RNA 的spacer 互補的基因組 DNA 序列 ;隨后造成雙鏈 DNA的損傷 ;最后通過體內的 NHEJ 或 HR 修復機制將引入基因突變[14].
3.2 TypeⅢCRISPR/Cas系統基本原理
Type ⅢCRISPR/Cas 系統包含的兩種類型中以A 型研究較為突出,這里以 typeIII-A為例。A型干擾的 m RNA 首先轉錄形成 DNA,Cas10-Csm 核糖核蛋白體,在 cr RNA 的引導下對與 cr RNA 互補的DNA 雙鏈或單鏈進行切割[16],從而造成 DNA 的損傷(圖 3)。
4 CRISPR/Cas系統之間的比較
Type ⅡCRISPR/Cas 系統在最近幾年研究火熱,其突出的優點在于結構簡單,系統容易設計,僅需要較短的 g RNA 和 Cas9 核酸酶就可以完成對特定靶基因的人工編輯,但是該系統存在較嚴重的脫靶把效應,使其廣泛應用受到限制。
Type ⅢCRISPR/Cas 系統與其他兩種類型相比存在自己獨有的亮點 :(1)Type ⅢCRISPR/Cas 系統只有在靶 DNA 轉錄的情況下才發揮功能。(2)Cas10-Csm 復合物不僅具有執行引導 RNA 切割 DNA的能力,也具有切割 RNA 的能力。這些突出的優點揭示了一種全能型的 CRISPR 免疫系統[16].