萜(terpenoid)是以異戊二烯(isoprene)為基本單元的生物大分子, 在人們日常生活、 食品、 醫療保健、 化工材料及軍事等領域蘊藏著巨大的商業價值。 甲羥戊酸途徑(mevalonate pathway, MVA pathway)和 2-甲基-D-赤蘚醇-4-磷酸途徑(2-C-methyl-D-erythritol-4-phosphate, MEP pathway)是生物中萜類物質合成的 2 條基本途徑, 前者存在于幾乎所有古生菌和真核生物, 也存在于一些革蘭氏陽性菌中; 后者存在于大多數細菌和植物體內。 2-甲基-D-赤蘚醇-2,4-環焦磷酸合酶(2-C-Methyl-D-erythritol-2,4-cyclodiphos-phate synthase, MDS)是 MEP 途徑第 5 個作用酶, 催化 4-(5′-焦磷酸胞苷)-2-C-甲基-D-赤蘚醇-2-磷酸(4-diphosphocytidyl-2-C-methyl-D-erythritol-2-phosphate, CDP-MEP)生成 2-甲基-D-赤蘚醇-2,4-環焦磷酸(2-C-methyl-D-erythritol-2,4-cyclodiphosphate, MEcPP), 該反應需要鎂離子(Mg2+)或錳離子(Mn2+)協助, 并釋放出 1 分子胞苷磷酸。 一些研究認為 MDS 是 MEP 途徑關鍵酶, 在異戊烯焦磷酸(IPP)生物合成過程中起重要的調節作用。 在懸浮培養長春花細胞中發現上調 MDS 基因可提高單萜類物質吲哚膽堿的含量,也有利于 MEP 途徑代謝流向更下游的方向。 半定量 RT-PCR 結果顯示紅豆杉 Taxus chinensis 和銀杏Ginkgo biloba MDS 基因具有組織特異性, 并都以葉中表達量最高。 杜仲 Eucommia ulmoides 是中國名貴的中藥材和工業橡膠原料樹種, 適生于華中、 華西、 西南及西北各地, 現廣泛栽培。 以杜仲膠和環烯醚萜類為典型的杜仲萜類次生產物具有重要的應用與經濟價值, 其中杜仲膠屬多萜化合物, 具有優良的共混和加工性能, 是材料領域重要的新型戰略物質; 杜仲 環烯醚萜類屬單萜化合物 , 具有利膽、 鎮痛、 保肝、 抗癌、 抗炎、 抗氧化以及抗骨質疏松等功能, 是保健及醫藥領域重要的天然活性成分。 目前對杜仲萜類生物合成特別是 MEP 途徑相關作用基因開展的研究不多, 對杜仲 MDS 基因的克隆及序列分析尚無報道。 本研究以杜仲葉片為材料, 分離 MDS 同源基因全長 cDNA, 通過生物信息學方法對基因序列及推導的氨基酸序列進行分析, 以期為研究杜仲 MDS 基因功能, 闡釋杜仲萜類生物合成機制和分子育種提供參考。
1、 材料與方法
1.1 材料
2011 年 4 月下旬于中國林業科學研究院經濟林研究開發中心院內采集杜仲良種 ‘華仲 6 號’ 葉片,清洗干凈后投入液氮帶回室內-80 ℃保存備用。
1.2 試劑
焦碳酸二乙酯(DEPC)(Sigma,德國), 聚乙烯吡咯烷酮(PVP)(Amresco,美國), 十二烷基磺酸鈉(SDS)(上海生工,中國), 氯化鋰(Amresco,美國), 十六烷基三甲基溴化銨(CTAB)(Amresco,美國), MightyAmpDNA Polymerase Ver. 2 (Takara, 中國大連), 瓊脂糖凝膠 DNA 回收 試劑盒(天根, 中國北京), 3′-FullRACE Core Set(Takara,中國大連), 5′-Full RACE Kit(Takara,中國大連), M-MLV RTase cDNA SynthesisKit(Takara,中國大連), pEASY-T1 Cloning Kit(全式金,中國北京), DH5α 感受態細胞(天根, 中國北京)。
1.3 試驗方法
1.3.1 總核糖核酸(RNA)提取與單鏈 cDNA 的合成 采用改良的 CTAB-LiCl 法提取杜仲葉片 RNA,對滿足實驗要求的 RNA 樣品保存于-80 ℃冰箱備用。 按 M-MLV RTase cDNA Synthesis Kit 說明書進行單鏈 cDNA 的合成。
1.3.2 引物設計 根據一段已知杜仲 MDS unigene 序列, 結合試劑盒錨定引物序列, 設計適于 3′RACE的巢式擴增的引物 3P1: 5′-CGTACACTCGGTTCTCGTT-3′, 3P2: 5′-CTCGACTCCGTCGAAGTCGCTC-3′以及 5′RACE 巢式擴增引物 5P1: 5′-TGGATCGGAATCTGGAAATATC-3′, 5P2: 5′-AGCAATACATCGC-CGTCGGAGT-3′。
1.3.3 基因全長 cDNA 末端擴增 3′RACE 及 5′RACE 的聚合酶鏈式反應(PCR) 反應體系與反應條件參照 Takara 3′-Full RACE Core Set Ver.2.0 與 Takara 5′-Full RACE Kit 說明書操作。
1.3.4 目的片段回收與測序 按 TIANGEN 通用型 DNA 回收試劑盒說明進行目的 PCR 產物的回收; 按pEAZY-T 克隆試劑盒說明將擴增片段連接至克隆載體, 鑒定后將陽性克隆送至南京金斯瑞公司測序。
1.3.5 生物信息學分析 利用美國生物技術信息中心 NCBIBlast 程序進行序列相似性檢索, 并用 ORF Finder 程序查找基因 cDNA 開放閱讀框架; 利用 ExPASy ProtParam 程序與 ScanProsite 程序分析氨基酸殘基數目與組成、 蛋白質相對分子量、 理論等電點以及功能位點等; 利用 Predict Protein以及 PSIPRED 方法預測蛋白質的細胞定位及二級結構; 利用 ChloroP 1. 1 Server進行轉運肽的預測; 利用 SWISS-MODEL 程序 進行 蛋白質的同源建模; 利用 Lasergene 軟件進行蛋白質序列的多重比對并通過 MEGA 5 軟件構建基因的系統進化樹。
2、 結果與分析
2.1 杜仲 MDS 基因全長 cDNA 的 分 離及序列特征
分別利用 3′RACE 引物和 5′RACE 引物在逆轉錄的 cDNA 模板上擴增出 1 條約 650 bp和 1 條約 500 bp 的特異條帶(圖 1a,圖 1b), 測序拼接后得到 1 條長 976 bp 的基因序列, 與紫莖澤蘭 Ageratina adenophora(GU828010.1),甜菊 Stevia rebaudiana(DQ631427.3), 長春花Catharanthus roseus(EU034700.1),、 葡萄 Vitisvinifera(XM_002278370.1), 蕪菁 Brassica rapa(AB300309. 1)MDS 序 列 的 相 似 性 分 別 為79%, 78%, 79%, 77%, 79%。 通過 ORF finder 工具查找到 1 個長 711 bp 的開放閱讀框 , 5′-UTR 長119 bp, 3′-UTR 長 146 bp, 共編碼 236 個氨基酸殘基(圖 2)。 推導氨基酸序列與毛果楊 Populus trichocarpa(XP_002304519.1), 橡膠 Hevea brasiliensis (AAS94122.1), 啤酒花 Humulus lupulus(AEV89963.1) , 丹 參Salvia miltiorrhiza (AEZ55667.1), 蘿芙木 Rauvolfia verticillata(ABV89583.1)MDS 蛋白序列相似性分別為73%, 73%, 76%, 74%, 76%, 確定取得杜仲 MDS 基因 cDNA 全長序列, 將其命名為 EuMDS。
2.2 EuMDS 編碼蛋白的結構特征
2.2.1 EuMDS 蛋白一級結構分析 ExPaSy ProtParam 程序預測 EuMDS 編碼蛋白分子量為 25. 14 kD, 理論等電點為 7. 77; 氨基酸組成中以亮氨酸(12. 3%), 丙氨酸(10. 6%), 脯氨酸(9. 3%), 絲氨酸(9. 3%)含量較高, 蛋白不穩定系數 50. 02, 屬不穩定蛋白質。 TargetP 1. 1 Server 預測 EuMDS 亞細胞定位于葉綠體上, 預測分值為 0. 943, 可靠性Ⅰ級。 Expasy protscale 程序推斷 EuMDS 為疏水性蛋白。 Vector NTIAdvance 10 多重比對顯示 EuMDS 蛋白具有植物 MDS 蛋白典型的保守位點(圖 3), 包括構成蛋白分子內腔所需的天冬氨酸位點(A87)和 2 個組氨酸位點(A89, A121), 以及其他保守的活性位點(A84, A213, A217,A218, A221, A223, A228)。 5 種同源 MDS 序列多重比對后相同的氨基酸位點達 70 個, 幾種植物 MDS 蛋白N 端比大腸埃希菌 Escherichia coli 多出 1 段約 80~90 個氨基酸殘基的蛋白序列, 說明此段區域可能存在轉運肽, ChloroP 1. 1 Server 程序推導 EuMDS 蛋白轉運肽序列長為 56 個氨基酸殘基, 在去除轉運肽序列后 EuMDS 成熟蛋白分子量為 19.24 kD。
2.2.2 EuMDS 蛋白二級結構及保守結構域分析 Predict Protein 在線預測 EuMDS 蛋白二級結構中 α-螺旋占 40. 25%, β-折疊占 13. 56%; 螺環結構占 46. 19%, 屬于混合型結構(圖 4)。 保守結構域分析 Eu-MDS 結構域屬 MECDP 合成酶蛋白家族, 并包含鋅離子(Zn2+)結合位點、 CDP 結合位點以及三聚體接觸面等功能域(圖 5)。
2.2.3 EuMDS 蛋白功能位點與翻譯后磷酸化修飾預測 ExPaSy ScanProsite 程序分析 EuMDS 基序類型分為 5 種, 含有 9 個潛在的功能位點, 包括 1 個蛋白激酶 C 磷酸化位點(SlR,42-44); 3 個酪蛋白激酶Ⅱ磷酸化位點(TavE, 61-64; SdgD, 114-117; SlgE, 148-151); 2 個 N 端糖基化位點(NRSI, 152-155;NLSA, 189-192); 2 個 N 端豆蔻?;稽c(GAdpSV, 195-200; GAasSV, 214-219); 1 個酪氨酸激酶磷酸化位點(RlmhEag. Y, 226-233)。 NetPhos 2. 0 server 共預測出 11 個磷酸化位點, 包括 6 個絲氨酸磷酸化位點(A42, A45, A75, A114, A185, A218), 3 個蘇氨酸磷酸化位點(A60, A61, A73)以及 2 個酪氨酸磷酸化位點(A9,A168)(圖 6)。
2.2.4 EuMDS 蛋白三級結構分析 以擬南芥 Arabidopsis thalana MDS 蛋白(2 pmp)為模板對 EuMDS 蛋白同源建模, 并利用 Swiss Pdb Viewer 4. 0. 4 對相應功能域進行標注, 如圖 7 所示, EuMDS 蛋白空間上由 3 個亞單位組成, 三者相互圍繞形成 1 個分子內腔結構, 且結構內部有多個高度保守的氨基酸殘基。ExPAsy structure assessment 程序評測推導的 EuMDS 蛋白模型 QMEAN 6 得分為 0. 950, 與模板蛋白序列的相似性為 91.88%。
2.3 EuMDS 同源蛋白系統進化樹的構建
利用 MEGA5 中 Clustal W 法對 20 個物種 MDS 氨基酸序列進行比對, 并用 Neighbor-joining 法構建了系統進化樹(圖 8)。 結果表明: 不同來源的 MDS 蛋白序列在進化上分屬不同的分類群, 植物 MDS 蛋白之間分類界限較為模糊, 說明其進化關系較為復雜。 EuMDS 蛋白與啤酒花 MDS 蛋白間的親緣關系最為接近, 距離為 0.032, 其次為紫莖澤蘭(0.039), 美麗帽柱木 Mitragyna speciosa(0.052), 毛果楊(0.052), 葡萄(0.052)和橡膠(0.066)。
3、討論
從杜仲皮、 葉中分離出十幾種環烯醚萜類化合物, 包括京尼平苷、 京尼平苷酸、 桃葉珊瑚苷、 杜仲苷、 筋骨草苷和車葉草酸等。 這些活性物質具有豐富且獨特的藥理藥效和保健功能, 而高分子材料杜仲膠在海底電纜、 器件裝飾、 綠色輪胎、 醫療器械、 消音減震、 密封堵漏等領域發揮獨特作用。 自杜仲萜類化合物開發利用以來, 研究者們不斷嘗試各種方法以期提高產量。 但是基于化學合成法需經一系列繁雜的催化反應, 且成本高、 得率低、 毒性大, 隨基因工程方法不斷發展, 于分子水平上進行萜類合成的人工調控, 對目的化合物定向生產和樹種定向培育具有重要意義。 MEP 合成途徑相對于 MVA 途徑更廣泛地存在于自然界中, MEP 途徑相關基因對萜類合成的生物調節機制日益引起萜類研究關注。
基于生物信息學分析的結果表明 EuMDS 蛋白具有植物 MDS 典型功能位點、 基序及結構域, 意味著所克隆 EuMDS 是高等植物 MDS 基因家族新成員, 可為杜仲萜類代謝工程候選基因篩選提供基礎信息, 但對其基因功能的判定有待深入研究。
植物 MDS 蛋白晶體結構首先從擬南芥中得到解析, 發現與細菌類存在一定差別, 主要在于由 3 個MDS 分子亞單位相互圍繞形成的分子內腔(molecular cavity)結構不同, 細菌 MDS 蛋白分子內腔適合與IPP 結合, 并被推測發揮著負反饋調節功能, 而擬南芥分子內腔中幾個高度保守的氨基酸殘基阻礙與二磷酸鍵結合, 兩者效應位點的差異意味著細菌和植物 MDS 蛋白在 MEP 合成途徑中具有不同的調節機制。 但也有一些實驗推斷與之相悖, 缺失 MDS 的大腸埃希菌突變體轉入擬南芥 MDS 會使其致死表形得到轉變, 因而推斷細菌與植物 MDS 催化機制類似。 目前 PDB 數據庫已注冊 53 種 MDS 蛋白晶體模型, 包括類鼻疽桿菌 Burkholderia pseudomallei, 棲熱菌 Thermus thermophilu, 大腸埃希菌等 51 種細菌類型和 2 種真核生物類型。 本研究通過 Swiss-model 同源建模法預測 EuMDS 蛋白三維結構與已解析擬南芥 MDS 蛋白空間特征吻合度很高, 為蛋白功能預測以及進一步解析杜仲 MDS 催化機制提供初步參考。
參考文獻:
[1] MICHEL R. The discovery of a mevalonate-independent pathway for isoprenoid biosynthesis in bacteria , algae andhigher plants[J]. Nat Prod Rep, 1999, 16: 565 - 574.
[2] HENRY M M. Enzymes of the mevalonate pathway of isoprenoid biosynthesis [J]. Arch Biochem Biophys, 2011, 505(2):131 - 143.
[3] LAURIS E K, CHARLES S B, WILLIAM N H. Structure of 2C-methyl-D-erythritol 2,4-cyclodiphosphate synthase:An essential enzyme for isoprenoid biosynthesis and target for antimicrobial drug development [J]. PNAS, 2002, 99(10): 6591 - 6596.
[4] STEFAN S, JOHANNES K, JURAITHIP W, et al. Structure of 2C-methyl-D-erythritol-2,4-cyclodiphosphatesynthase involved in mevalonate independent biosynthesis of isoprenoids [J]. J Mol Biol, 2002, 316: 79 - 88.
[5] BERTRAND V, MARTINE C, AUDREY O, et al. Cloning and expression of cDNAs encoding two enzymes of theMEP pathway in Catharanthus roseus [J]. Biochem Biophys Acta, 2000, 1517(1): 159 - 163.
[6] 劉萬宏. 紫杉醇前體合成途徑 2 個關鍵酶基因克隆和分析[D]. 重慶: 西南大學, 2008.