多細胞生物體內存在不同類型的器官、組織、細胞, 它們有各自的特性, 擔負著不同的功能。例如, 植物根表皮中的根毛細胞, 主要負責從周圍土壤中吸收水分與礦質營養。與這一功能相適應, 它們在發育過程中向外突起形成管狀結構以增加其表面積和吸收水分、養分的能力(Grier-son和Schiefelbein 2002); 植物根里的內皮層細胞在發育過程中通過特殊的細胞壁加厚和特定部位胼胝質的沉積形成“凱氏帶”, 阻止礦質養分向維管束和地上部分滲透, 控制皮層和維管柱之間的物質運輸; 在莖和葉片中, 保衛細胞可以調節內部葉肉細胞與外部環境之間的氣體交換, 這一過程需要依賴周圍細胞通過K離子交換來創造一個調節氣孔關閉與打開的膨壓(Raschke和Fellows 1971)。這些不同類型器官、組織、細胞的形成, 以及它們之間功能的差異, 在很大程度上取決于特異性表達的基因。因此, 研究不同器官、組織、細胞中呈特異性表達的基因, 對了解植物生長發育調控機理, 細胞類型與功能之間的關系都有重要意義。
此外, 研究組織特異性表達的基因的調控機理, 可幫助我們構建植物組織特異性表達體系, 有目的地在特定器官、組織、細胞中表達特定靶基因, 以便進行靶基因功能分析。組織特異性表達技術在植物基因工程中具有一定的應用前景, 如利用植物的特定組織細胞合成所需要的代謝產物,還可以用于作物改良的基因工程等。組織特異性表達技術是近年來植物學研究中的一個重要領域(Ubeda-Tomas等2008; Plett等2010; Duan等2013)。
本文主要介紹目前被廣泛使用的兩種植物組織特異性基因表達方法, 即特定啟動子驅動法和GAL4/UAS激活標簽法。
1 組織特異性啟動子驅動法
1.1 植物組織特異性啟動子
啟動子是一段位于功能基因5‘端上游的DNA序列, 包含特定的保守序列, 長度因基因而異。啟動子上的多種順式作用元件能識別RNA聚合酶,并指導相應類型的RNA聚合酶與模板正確結合,形成轉錄起始復合體, 控制轉錄的時空特性和強度, 從而精確有效地啟動基因的表達。有些啟動子, 如花椰菜花葉病毒(CaMV) 35S啟動子(Odell等1985)、水稻Actin1基因的Act1啟動子(McElroy等1990)和玉米Ubiquitin基因的Ubi啟動子(Christensen等1992)等, 其調控的基因不受時空及外界因素的影響, 幾乎在植物所有組織都有表達, 而且表達水平在不同組織部位沒有明顯差異, 被稱之為組成型啟動子或非特異性表達啟動子。
組織特異性啟動子, 又稱為器官特異性啟動子或細胞特異性啟動子, 則不同于組成型啟動子,其所控制的基因只在或主要在特定的組織中表達。除具有一般啟動子的特性外, 組織特異啟動子還具有一些調控目的基因特異表達的調控元件,這些調控元件的位置、數目、種類決定了目的基因表達的時空專一性, 是基因特異表達所必需的。因此, 組織特異型啟動子已成為轉基因研究中常用的外源基因的啟動元件。
目前研究人員已經在不同植物中分離并證實了多種具有組織表達特異性的啟動子, 按照其驅動基因的表達部位, 可分為植物營養器官, 如根、塊莖、維管組織和莖葉綠色組織等表達的組織特異性啟動子, 植物生殖器官如花器、果實和種子表達的組織特異性啟動子(表1)。根據調控的組織特異性基因表達模式是否受光、熱等條件的誘導,又可分為可誘導和無需誘導的組織特異性啟動子,比如水稻綠色組織特異表達的Rca基因和LP2基因的啟動子要受到光的誘導(Thilmony等2009; Yang等2012)。研究人員也發現, 許多植物的內含子也有調控基因時空表達的作用, 例如擬南芥花同源基因AGAMOUS中內含子中有增強子序列, 它和該基因在花器官中的特異區域表達相關(Busch等1999)。水稻OsTubA1基因由4個外顯子和3個內含子組成, 在不同的組織如根尖、幼葉和花中有表達, 而這一表達模式需要第一個內含子的調控(Jeong等2000)。矮牽?;≒hADF1基因中第1個內含子會增強其在維管組織的特異性高表達, 后來研究證明, 這一內含子改變PhADF1基因組織特異性表達的過程是一種轉錄后調控機制, 而且進化比較保守(Mun等2002; Jeong等2007)。
1.2 植物組織特異性啟動子的一般研究方法
研究植物的啟動子一般采用如下手段, 首先通過PCR擴增法, 從植物基因組中擴增已知全部或部分序列的啟動子片段, 然后通過PLACE (Higo等1999)和PLANTCARE (Lescot等2002)網站, 對得到的啟動子片段進行生物信息學分析, 預測啟動子的核心結構和功能, 并在啟動子片段的后面融合GUS和GFP等報告基因, 通過瞬時和穩定的轉化,對啟動子的表達模式進行分析, 最后通過點突變、片段缺失等分析, 得到該啟動子的核心調控元件(Ellerstrom等1996; Li等2005; Konishi和Yanagisawa2010)。
cDNA微陣列的數據給開發新的啟動子提供了有利條件。Ye等(2012)人利用水稻cDNA微陣列數據庫CREP (Collection of Rice Expression Profiles,http://crep.ncpgr.cn), 鑒定得到一個只在綠色組織中特異表達的基因, 與水稻基因組數據庫中數據進行序列比對發現, 該基因編碼一個蛋白DX1.RT-PCR分析表明, DX1確實是在葉、葉鞘、莖和穗莖中表達, 而在根、花藥和胚乳中都沒有表達。通過將編碼區上游1 505 bp和下游558 bp序列作為該基因的候選啟動子, 并提交到PlantCARE網站與已有數據進行比較分析, 采用片段缺失分析和凝膠阻滯實驗EMSA (Electrophoretic Mobility Shift As-say), 得到位于–71至–61的序列5' CAGGACATATT3' (GSE1)和位于+1至+86的5' ATGAACTCAAA-GAGCC 3' (GSE2)的2個綠色組織特異的順式調控元件。點突變分析表明這兩個順式調控元件都是正調控因子。
近些年來, 由于基因組、轉錄組學技術和測序技術的快速發展, 使得大規模預測啟動子序列和找到發揮作用的調控原件變得可行。Verelst等人(2007)通過分析擬南芥花粉的4個發育階段中不同組織的ATH1基因芯片結果, 找到了很多花粉特異表達的基因, 啟動子分析發現約22.9%的TCP-MPG類基因啟動子中含有一個MEF2基序。差異基因表達也常被用來研究組織特異的啟動子, 通過cDNA-AFLP (cDNA擴增長度多態性), 得到具有差異表達的轉錄片段, 通過這種方法, 在馬鈴薯中得到了一個具有在塊莖和匍匐莖等莖組織特異表達的StCCS啟動子(Trinade等2003)。轉錄組測序也有助于非模式物種的差異基因表達研究, Geng等(2014)通過在花生中建立一個基于高通量測序的篩選系統, 獲得584條根特異和316條種子特異表達的基因片段, 其中的55.3%和64.6%經半定量RT-PCR驗證為組織特異表達基因, 并從中分離鑒定了一個根特異表達的啟動子Asy.
1.3 植物組織特異性啟動子的應用
目前, 植物基因工程中使用的多是組成型啟動子, 其中CaMV 35S啟動子主要用于雙子葉植物的遺傳轉化, Ubi啟動子主要用于單子葉植物的遺傳轉化。雖然這類啟動子驅動的基因在轉基因植物的不同組織、不同生長階段均有高水平表達(Ranjan等2011; Park等2012), 也易于構建目的基因過表達的載體, 但在應用中逐漸暴露出一些問題和局限性。例如, 組成型的啟動子不能用于研究不同類型細胞和組織的功能, 而且靶基因在發育過程的錯誤時間和錯誤空間過量表達有時會對植物生長發育產生影響(Potenza等2004)。組成型的基因表達可能會造成轉基因植物生長延緩, 開花延遲, 減產, 品質降低, 甚至不育等現象(Kasuga等1999和2004; Pino等2007)。此外, 在同一個植物中重復使用同一個組成型啟動子驅動多個不同基因表達容易造成基因沉默現象(Palauqui等1996;Vaucheret等1998; Galili和Hofgen 2002; Lessard等2002)。
組織特異性啟動子則可克服上述缺點, 它們可以驅動外源基因在植物發育過程中某一特定的時空表達, 使目的基因的表達產物在特定細胞或組織中積累(Jeong等2010)。伸展作用因子(expan-sin)是調控植物生長過程中細胞壁伸長的主要調節因子。在煙草中用擬南芥根系特異表達的啟動子Pyk10 (Nitz等2001)驅動β型伸展基因TaEXPB23,不僅增加了側根的數目, 而且與35S組成型啟動子表達該基因的植株和野生型相比, 根系生物量明顯提高; 在缺水脅迫條件下, 與野生型相比, 根系特異表達該基因的植株光合速率增加, 積累的活性氧(reactive oxygen species, ROS)更少, 具有較高水平的抗氧化酶的活性, 使轉基因植株的抗脅迫能力提高(Li等2015)。植物發達的根系會增加其抗脅迫能力。水稻根系特異表達的RCc3啟動子的分離給提高作物抗脅迫能力和作物產量提供了有效工具(Xu等1995)。Jeong等(2010)用RCc3啟動子驅動水稻受干旱、高鹽和脫落酸等脅迫誘導表達的OsNAC10基因, 使其在根中過量表達, 轉基因水稻根直徑是非轉基因水稻的1.25倍, 根的中柱、皮層和表皮都變大; 在干旱脅迫和正常條件下, 水稻產量與野生型相比都有不同程度的提高。
油菜是世界上廣泛種植的油料作物, 含有高不飽和的C18脂肪酸和低芥酸, 具有很高的營養價值。Ellerstrom等(1996)從油菜中分離得到一個只在胚和胚乳特異表達的啟動子napA.利用napA驅動調控不飽和脂肪酸合成的LEC1和L1L基因, 使它們在種子中特異表達, 轉基因植株種子含油量提高2%~20%, 但油分品質沒有發生明顯改變, 也沒有影響其他主要的農業性狀, 而且這些改良與作物生長條件無關(Tan等2011)。
木質素是一類酚類次生代謝產物, 在植物體內行使重要的生理功能, 但對于造紙工業而言是有害成分, 必須從木纖維中去除, 木材中的木質素是形成造紙污染的主要來源。編碼咖啡酸酸-O-甲基轉移酶(caffeic acid O-methyl-transferase, COMT)相關基因的克隆, 使研究者可以下調楊樹中COMT的含量, 通過RNAi可以減少轉基因楊樹中約90%COMT活性, 木質素的含量沒有受到影響, 但使木質素的結構發生明顯變化, 轉基因楊樹更加適用于紙漿工業(Lapierre等1999)。在煙草中用組成型啟動子35S表達木質素合成途徑相關基因肉桂酰輔酶A還原酶(cinnamoyl-CoA reductase, CCR)反義基因雖然可以下調CCR基因的表達, 減少木質素的含量, 但也會影響整個植株的生長發育, 出現延遲生長, 皺葉等表型; 為了克服這樣的困難, 用維管組織特異表達的啟動子LlCCR和LlCAD可能會避免對整個植株造成的傷害, 從而實現特異性地降低木材中木質素的含量, 減少造紙工業中為去除木質素而消耗的能源和化學原料(Prashant等2011,2012)。
2 GAL4/UAS激活標簽法
2.1 GAL4/UAS系統簡介
GAL4/UAS雙因子反式激活體系介導的基因異位表達可實現轉基因的空間控制, 加上適當的修飾可以實現時空雙重控制。Brand和Perrimon(1993)首次在果蠅中構建GAL4/UAS體系, 建立了一個可將任何外源基因以果蠅自身細胞或組織特異的方式被選擇性激活表達的系統, 并利用該系統來研究果蠅even-skipped蛋白的功能。Guyer等(1998)將修飾過的GAL4/UAS系統GAL4/C1首次運用到雙子葉模式植物擬南芥中, 在植物中建立了GAL4/UAS外源基因異位表達系統(圖1)。
GAL4/UAS是由酵母的GAL4基因和GAL4基因的上游激活因子序列UAS兩部分組成。GAL4/UAS系統的建立, 首先需要將GAL4基因與組織特異性的啟動子或增強子相連接, 建立以細胞和組織特異性的方式調控表達的GAL4轉基因系; 同時將UAS與感興趣的靶基因融合, 建立帶有UAS-靶基因的轉基因系。在UAS-靶基因轉基因系中, 靶基因只需和UAS序列相連接, 不再需要特定的啟動子。因為GAL4蛋白只能與UAS相結合之后才能調控GAL4基因的表達, 所以只有將2個轉基因系進行雜交, 在雜交后代中, 特異性表達的GAL4才能以同樣的方式調節UAS-靶基因的表達(Brand和Perrimon 1993)。
為了便于檢測GAL4/UAS系統雜交子代中靶基因表達的位置, 通常采用的方式為運用GUS和GFP等報告基因建立UAS-靶基因-報告基因, 將靶基因的編碼區域與報告基因融合, 整合到宿主的基因組中; 此UAS轉基因系與GAL4系雜交后, 子代中報告基因由于GAL4與UAS的結合, 伴隨著靶基因開始表達, 通過檢測報告基因在不同細胞中的活性, 就可方便地對靶基因的表達模式進行更為準確的分析, 再對其表達產生的生物學效應做進一步的研究(Wu等2003)。此外, 為了方便在建立的GAL4系親本中提前檢測GAL4在不同細胞組織中的表達, 可將報告基因GUS或GFP融合到GAL4片段后, 隨著GAL4隨機的插入受體植物基因組中, 由于和它鄰近的基因表達位置的不同, 就可以得到標記了綠色熒光蛋白的表達GAL4基因的株系(Laplaze等2005)。
2.2 植物GAL4/UAS體系的建立
2.2.1 擬南芥中GAL4/UAS體系構建及應用Haseloff (1999)發現由于GAL4序列中存在高A/T含量, 這些序列會影響植物中mRNA的加工,使GAL4不能在擬南芥中表達。為了解決這一問題, 他們用VP16代替GAL4中的激活部位, 建立了一個高A/U含量的GAL4-VP16體系, 使得其在植物前mRNA拼接過程中起到很好的識別內含子的作用, 從而在擬南芥中高效表達。GAL4-VP16隨機插入到擬南芥基因組中, 其表達依賴于與它鄰近的基因增強子序列。為了檢測GAL4-VP16的表達, 他們還將mGFP5基因融合到這段插入片段中, 由于和它鄰近的基因表達位置的不同, 這樣就得到標記了綠色熒光蛋白的表達GAL4基因的不同細胞。在這些細胞中, 篩選收集到了250株只在擬南芥根尖不同細胞中穩定表達的GAL4株系(圖2)。
后續研究者可以將感興趣的目標基因融合到UAS編碼框后, 得到UAS-目標基因系, 通過與這些GAL4-VP16系雜交, 或者用UAS-目標基因農桿菌,直接轉化GAL4-VP16系, 獲得在根尖不同細胞中穩定表達目的基因的子代, 有利于更精確地研究目的基因的功能。除上述最初篩選到的250個株系外, 其他研究者還從Haseloff等建立的GAL4-VP16株系中篩選到了新的組織特異性表達株系, 如Laplaze等(2005)篩選得到401株在側根不同發育階段特異性表達的株系; Gardner等(2009)篩選得到了4株在氣孔保衛細胞特異表達的株系, 并發現其中大部分只在氣孔保衛細胞表達, 且其表達特異性不受外界環境變化。
這些制備并經過驗證的細胞和組織特異表達的GAL4-VP16株系為研究植物信號傳導及其作用機制提供了有效工具。赤霉素(gibberellin, GA)可以通過促進擬南芥根中細胞的有絲分裂來調節分生組織大小, 進而調控根細胞的伸長, 維持根生長。為了確定GA是通過分生區中哪些細胞來控制根細胞的增殖, Ubeda-Tomas等(2008, 2009)利用上述Haseloff等建立的在不同根組織中表達的GAL4-VP16株系, 包括J0571 (在皮層和內皮層表達)、Q2500 (內皮層)、J0631 (根伸長區)和J2341 (根柱干細胞), 使突變基因GAI在這些組織中特異性表達, 結果發現在柱干細胞和伸長區細胞中表達GAI后, 分生組織大小與野生型一樣; 而在皮層或內皮層中表達GAI則導致分生組織明顯變小, 從而說明GA是通過促進內胚層中細胞的增殖來控制根分生組織的大小, 控制根的生長。同樣Duan等(2013)利用Haseloff等建立的株系研究高鹽脅迫對擬南芥幼苗側根的抑制作用中的細胞特異性。他們在前期研究中發現ABA參與這一抑制作用。為了驗證ABA的這一調控是否具有組織特異性, 作者首先利用上述Haseloff等建立的在不同根細胞中表達的GAL4/UAS株系, 特異表達能引起ABA不敏感的突變基因abi1-1, 發現在這一調控中ABA信號傳導主要在內皮層和皮層; 然后他們進一步利用內皮層和皮層特異表達的啟動子, 鎖定了內皮層為ABA信號傳導的關鍵場所。
Haseloff等建立的組織特異性表達株系也被用來研究植物對環境因子的響應機理。如Moller等(2009)利用在擬南芥根中細胞特異性表達的GAL4/UAS株系研究鈉離子轉運蛋白的組織特異性表達對植物抗鹽性的影響。作者選用兩種在根和中柱中穩定表達的GAL4株系, J2731 (只在主根和側根的中柱鞘表達)和E2586 (在主根和側根的維管柱和中柱表達), 使HKT基因在這些細胞中特異表達。發現在根中柱細胞中表達HKT1.1會增強鈉離子流入的能力, 減少鈉離子從根中到莖中的轉移, 并導致莖中鈉離子濃度降低, 使植物的抗鹽能力增強。Plett等(2010)用在表皮和皮質細胞層特異表達的GAL4株系發現在擬南芥根表皮和皮層特異表達HKT1.1會增加莖中鈉離子的積累。
2.2.2 水稻GAL4/UAS體系構建及應用Wu等(2003)在水稻’中花11‘和’中花15‘中建立了GAL4-VP16/UAS體系, 將經過修飾的GUS報告基因(GUS Pluse)放在6×UAS啟動子上, 用來檢測基因在不同位置的表達, 得到了約31 443株F1代有GUS標記的單株(表2)。通過用GAL4/VP16編碼區的引物進行PCR擴增和GAL4/VP16特異探針進行核酸雜交驗證, 大部分F1代GAL4株系都有T-DNA插入, 其中約有一半為單拷貝插入。由于GUS標記需要經過組織化學染色、固定等步驟才能確定表達位置。Johnson等(2005)以GFP為報告基因, 得到具有不同表達強度的GFP轉化株, 在水稻中建立了一個可快速、跟蹤檢測的GLA4/UAS系統。Plett等(2010)利用Johnson等人建立的水稻GAL4-GFP系統中在木質和皮層有GFP特異表達的AGF03和AOHB03株系, 將擬南芥HKT1.1基因在這些GAL4系中特異表達。發現當用鹽脅迫處理時, 與對照相比, 水稻皮層中特異表達HKT1.1的轉化株(AOHB03)干重明顯增加, 根中鈉離子增加, 莖中鈉離子濃度變低; 而木質部中HKT1.1的特異表達轉化株(ASGF03)干重減輕, 莖中鈉離子濃度升高, 而根中降低。這些結果與在擬南芥中得到的結果相同, 說明鈉離子在特定細胞中的轉運與植物抗鹽性間的關系在擬南芥和水稻中非常相似??梢娊M織特異性表達這一研究工具在糧食作物的重要農藝性狀研究中具有廣闊的應用前景。
3 討論與展望
雖然現在已經分離得到了許多細胞或組織特異的啟動子, 但對于多細胞和組織器官復雜的高等植物來說, 還是遠遠不夠的, 而且啟動子具有物種特異性, 在不同物種中其驅動的基因表達位置可能存在差異。目前, 由于轉錄組、蛋白質組和基因組測序技術的發展, 給分離更多的特異性啟動子提供大量數據, 尤其是轉錄組數據的分析可以幫助我們更快的認識基因在時間和空間的表達模式, 進而開發更多新的有用的特異性啟動子(Po-tenza等2004; Shelenkov和Korotkov 2009), 實現對外源基因表達的定時、定點、定量三維精確調控,使其在可控條件下為基礎研究和作物性狀改良創造更多可能(Jeong等2010; Ye等2013; Li等2015)。
由于GAL4-UAS系統在建立時GAL4基因是隨機插入基因組的, 這就使它存在不可避免的缺點: (1)單一株系在多個不同細胞和組織中都有目的基因的表達; (2)這種多細胞表達的組合是隨機的, 強弱不同, 不是研究想要的組合; (3)得到的不同組織特異的GAL4群體可能不能完全包含研究所需要的全部細胞類型。因此, 在研究特定基因的功能或信號響應和應答的特異組織定位時, 不僅需要篩選分離和驗證更多細胞或組織特異的啟動子, 建立和擴大組織特異的GAL4/UAS群體, 優化得到有規律或實驗所需的細胞表達組合, 還要將組織特異的啟動子和GAL4/UAS株系結合起來,利用各自特點先通過在多個不同細胞和組織中都有目的基因表達的GAL4/UAS株系, 將信號響應目標細胞定位到很小的區間(一到兩種細胞類型), 再通過已知的細胞特異的啟動子驅動目的基因在其表達, 最終將響應特定信號的細胞類型確定下來。
目前文獻中報道和廣泛使用的GAL4/UAS系統大多是以果蠅(Brand和Perrimon 1993)、老鼠(Mallo 2006)、斑馬魚(Halpern等2008)、擬南芥(Haseloff 1999)和水稻(Wu等2003)等模式生物建立的, 主要用于研究特定基因的功能或者信號響應的特異組織定位, 或者在特定細胞或組織中表達致死的基因, 達到切除靶細胞的作用(Brand和Per-rimon 1993)。隨著測序技術和遺傳轉化技術的進步, 使得GAL4/UAS技術日益成熟, 我們有望在更多的動植物中建立這種細胞和組織特異表達的庫,用于改良作物的產量和品質, 疾病治療等。