藏刊網,職稱文章發表、期刊投稿權威機構

投稿咨詢

投稿在線咨詢

專著咨詢

合著&獨著&編委

編輯在線咨詢

專利咨詢

專利申請&轉讓

編輯在線咨詢

軟著版權

軟著版權

編輯在線咨詢

在線溝通

論文&專著&專利

編輯在線咨詢

微信聊

微信掃一掃

首頁 > 科學論文 > > 基于二階馬爾可夫隨機場模型來對蛋白質功能的注釋
基于二階馬爾可夫隨機場模型來對蛋白質功能的注釋
>2022-12-26 09:00:00


引言

人類基因組計劃大規模測序工作的完成標志生命科學的研究將進入后基因組時代。由于蛋白質是生理功能的執行者以及生命現象的體現者,對蛋白質功能的研究將成為后基因時代研究的核心內容之一.

早期的蛋白質功能預測方法大多基于蛋白質序列間的同源性,認為序列上相似的蛋白質具有相似的功能。通過運用FASTA、BLAST等工具對數據庫中已知功能的蛋白質序列進行搜索,為待注釋功能的蛋白質尋找序列相似性最高的蛋白質來進行功能預測.隨著高通量實驗技術的應用,基于蛋白質交互網絡的蛋白質功能預測方法受到越來越多的關注。

Deng 假設蛋白質的功能獨立于與其直接相鄰的鄰居之外的所有蛋白質,提出了基于馬爾可夫隨機場模型來對蛋白質進行功能注釋,并且取得了不錯的預測效果。本文在Deng模型基礎之上將其推廣到二階馬爾可夫隨機場模型,并且利用偽似然估計方法來估計模型參數,在平均預測準確率的意義下,取得了比Deng模型更好的預測結果。

1.二階馬爾可夫隨機場模型

我們如下定義蛋白質的二階鄰居:對于一個蛋白質,它的所有直接交互伙伴以及它所有直接交互伙伴的直接交互伙伴都稱為該蛋白質的二階鄰居(不包括自身)。為了簡化計算,我們假設二階鄰居中的所有蛋白質對預測蛋白質功能的影響是相同的。

假 設 一 個 基 因 組 有 N 種 蛋 白 質 P1,?,PN以 及 M 類 功 能F1,?FM.對于每一個蛋白質 Pi,我們定義Nei(i)為它的鄰居組成的蛋白質集合。記πj表示所有的蛋白質有 Fj功能的比例。假設 S 是所有交互蛋白質對組成的集合。對于某個感興趣的功能,設(x1,?,xN)是 N個蛋白質的功能標記:如果第 i 個蛋白質有這個功能,則 xi=1;否則xi=0.根據Deng模型我們知道第 i 個蛋白質有此功能的先驗概率為:【1】


交互鄰居中無此功能和有此功能的個數,α=ln?è??π1-π, β-1和 γ-β為待定參數。我們利用計算機視覺中常用的偽似然估計方法來估計,具體操作如下:

首先考慮如下的條件似然函數:【2-3】



選取適當的初值和閾值后,便可以估計出參數 β-1和 γ-β,從而可以得到 S 中每個蛋白質含有任意一種功能的后驗概率。

2.實驗結果及分析

在本文中,我們用平均預測準確率來衡量模型的優劣。換言之,平均預測準確率越高,模型性能越好,反之則性能越差。這里的平均預測準確率是按如下定義的:

對每種功能來講,首先根據模型計算出 S 中每個蛋白質含有這種功能的概率,然后取閾值為0.5,如果某蛋白質含有此功能的后驗概率大于(或等于)0.5,我們便認為該蛋白質擁有這個功能。于是得到 S 中蛋白質的預測功能矩陣,將其與原始數據相比較,預測正確的個數比上S 中總的蛋白質個數便是此功能的預測準確率,所有功能的預測準確率的算術平均即為平均預測準確率。

本文中的實驗是在以下軟硬件平臺的PC機下完成:CPU:T6570,主頻率2.1G,2G內存,Windows7操作系統,編譯工具是Matlab.其中酵母菌蛋白質數據估計參數 β -1和 γ-β時初值分別選擇為-0.1和1,閾值選擇為 0.001.Deng 模型和本文模型的平均預測準確率分別為 96.18%、97.26%,從而在平均預測準確率的意義下,本文模型要優于 Deng 模型。

3.總結

針對蛋白質的功能預測問題,本文基于二階馬爾可夫隨機場模型對蛋白質進行了功能預測。結果表明,在平均預測準確率意義下,取得了較好的預測效果。值得提出的是,本文假設只有蛋白質的二階鄰居對其功能有影響且影響是相同的,而實際上不同的二階鄰居對其功能的影響是不盡相同的,并且蛋白質交互網絡中距離更遠的蛋白質也可能對其功能有影響,這些都是需要后續研究的問題。

參考文獻

[1]朱薿。蛋白質相互作用網絡在蛋白質功能預測中的應用[J].咸寧學院學報(醫學版),2008,22(4):364-366.
[2]Pearson W. R, Lipman D. J. Improved Tools for BiologicalSequence Comparison[J]. Proc Natl Acad Sci USA, 1988, 85(8) :2444-2448.
[3]Altschul S. F, Madden T. L, Schaffer A. A, et al. GappedBLAST and PSI- BLAST: a New Generation of Protein DatabaseSearch Programs[J]. Nucleic Acids Res, 1997, 25(17) : 3389-3402.
[4]Deng M, Zhang K, Mehta S, et al. Prediction of ProteinFunction Using Protein- protein Interaction Data[J]. J Comput Biol,2003, 10(6): 947-960.
[5]Li S. Z Markov Random Field Modeling in Computer Vi-sion[M]. Springer-Verlag: Tokyo. 1995.

綜合排序
投稿量
錄用量
發行量
教育界

主管:廣西壯族自治區新聞出版局

主辦:廣西出版雜志社

國際:ISSN 1674-9510

國內:CN 45-1376/G4

級別:省級期刊

中國報業

主管:中國報業協會

主辦:中國報業協會

國際:ISSN 1671-0029

國內:CN 11-4629/G2

級別:國家級期刊

中國房地產業

主管:中華人民共和國住房部和...

主辦:中國房地產業協會

國際:ISSN 1002-8536

國內:CN 11-5936/F

級別:國家級期刊

建筑與裝飾

主管:天津出版傳媒集團有限公司

主辦:天津科學技術出版社有限...

國際:ISSN 1009-699X

國內:CN 12-1450/TS

級別:省級期刊

財經界

主管:國家發展和改革委員會

主辦:國家信息中心

國際:ISSN 1009-2781

國內:CN 11-4098/F

級別:國家級期刊

文化月刊

主管:中華人民共和國文化部

主辦:中國文化傳媒集團有限公司

國際:ISSN 1004-6631

國內:CN 11-3120/G2

級別:國家級期刊

期刊在線投稿系統
上傳文件
支持上傳.doc、.docx、.pdf文件
18年國內外學術服務,發表國際文獻請認準藏刊網官網

資深編輯團隊

專業設計投入方案

投稿成功率極高

企業信譽保障

對公交易更安全

人民群眾口碑好

高效投稿流程

審稿快!出刊快!檢索快!

正規刊物承諾

無假刊!無套刊!

投稿成功!

藏刊網提醒您

1.稿件將進入人工審稿階段,審稿后會有編輯聯系您,請保持手機暢通。

2.為避免一稿多投、重刊等現象影響您的發表,請勿再投他刊。

確定

投稿失??!

藏刊網提醒您

由于網絡問題,提交數據出現錯誤,請返回免費投稿頁面重新投稿,謝謝!

確定

藏刊網收錄400余種期刊,15年誠信發表服務。

發表職稱文章,覆蓋教育期刊、醫學期刊、經濟期刊、管理期刊、文學期刊等主流學術期刊。

  投稿郵箱:cangkan@163.com

本站少量資源屬于網絡共享如有侵權請您聯系我們,將在第一時間刪除。

版權 2009-2022 版權所有:河北藏刊文化發展有限公司 工信部備案:ICP備20016223號 冀公網安備13010502002858號

青青青爽不卡一区二区_操婷婷色六月中文字幕_国产精品yjizz视频网_中文无码一级大片_A级毛片100部免费观