抗原表位預(yù)測適用于已知一級結(jié)構(gòu)的蛋白質(zhì)或多肽抗原的線性表位的預(yù)測。人們通過觀察抗原表位與已知氨基酸序列的蛋白質(zhì)某些結(jié)構(gòu)特征關(guān)系,發(fā)現(xiàn)一些蛋白質(zhì)的序列或結(jié)構(gòu)特征與抗原表位有關(guān)。在抗原抗體的結(jié)合反應(yīng)中,抗原參與結(jié)合的部位稱為 B 細(xì)胞抗原決定簇或者表位。從空間結(jié)構(gòu)上看,B 細(xì)胞表位可分為線性表位(也稱 連續(xù)表位)和構(gòu)象表位(也稱不連續(xù)表位)。線性表位由肽鏈上連續(xù)的氨基酸組 成;構(gòu)象性表位由空間結(jié)構(gòu)上接近但肽鏈上不連續(xù)的氨基酸組成; Rubinstein 等研究從 PDB 數(shù)據(jù)庫篩選的抗原抗體復(fù)合物,總結(jié)了 B 細(xì)胞表位生化、結(jié)構(gòu)特點:(1) 75%的表位是由跨越 600Å ~1000Å 40 面積的 15~25 個氨基酸組成;(2)平均 90% 的表位殘基是與抗體的互補決定區(qū) (CDR)的殘基相互作用;(3)表位和非表位區(qū)的氨基酸組成有很大的不同;(4)環(huán)狀結(jié)構(gòu)利于抗體的結(jié)合,因此表位多含有環(huán)狀結(jié)構(gòu),而螺旋和折疊結(jié)構(gòu)比較少見。
表位是蛋白質(zhì)抗原性的基礎(chǔ),確定 B 細(xì)胞表位對于設(shè)計疫苗和藥物具有重要的指導(dǎo)作用。確定 B 細(xì)胞表位的傳統(tǒng)方法有兩種:X-射線衍射方法和實驗方法。但是這些方法比較繁瑣,工作量也非常大。隨著計算機技術(shù)的發(fā)展和生物信息數(shù)據(jù)庫的日益擴大,從已有數(shù)據(jù)中總結(jié)抗原表位的序列及結(jié)構(gòu)特征,并通過計算手段對可能的表位進(jìn)行預(yù)測,然后結(jié)合實驗手段予以驗證成為另外一條可能的技術(shù)路線。
1、B 細(xì)胞表位在線預(yù)測工具:
數(shù)據(jù)是 B 細(xì)胞表位分析與預(yù)測的基礎(chǔ)。研究者們通過收集和整理已有的研究成果,開發(fā)了一些 B 細(xì)胞表位數(shù)據(jù)庫。常用數(shù)據(jù)庫見下表:
PDB 數(shù)據(jù)庫于1971 年建立,主要收集通過 X-射線單晶衍射、核磁共振、 電子衍射等實驗手段確定的蛋白質(zhì)、核酸和糖的三維結(jié)構(gòu)。因此,該數(shù)據(jù)庫也存儲了一些抗原或者抗原-抗體復(fù)合物的三維結(jié)構(gòu)。
IEDB 數(shù)據(jù)庫[5]在 2004 年建立,是使用最為廣泛和最具權(quán)威性的表位數(shù)據(jù)庫。 該數(shù)據(jù)庫存儲由實驗確定的 B 細(xì)胞表位(線性表位和構(gòu)象表位),這些表位收 60 集自公開發(fā)表的出版物或者由研究組自行提交。目前,IEDB 數(shù)據(jù)庫包含 159,339 條 B 細(xì)胞相關(guān)記錄。每個表位都提供了對應(yīng)的參考文獻(xiàn)、結(jié)構(gòu)、來源抗原等信息。此外,該數(shù)據(jù)庫還集成了一些表位預(yù)測工具。
Bcipep 數(shù)據(jù)庫包含實驗確定的線性 B 細(xì)胞表位(來源于文獻(xiàn)或者其它的數(shù)據(jù)庫)。目前,該數(shù)據(jù)庫存儲了 555 條表位。對于每一條表位,數(shù)據(jù)庫給出了其肽段序列、來源蛋白、病原體等。如果數(shù)據(jù)來源于其它數(shù)據(jù)庫,Bcipep 數(shù)據(jù)庫也提供了鏈接。
CED 數(shù)據(jù)庫存儲了 293 條構(gòu)象表位記錄。研究者從 PubMed 和 ScienceDirect 數(shù)據(jù)庫收集和整理文獻(xiàn),然后手工分析超過 3000 條文獻(xiàn),保留了高分辨率和完整的構(gòu)象表位,并存入數(shù)據(jù)庫。CED 數(shù)據(jù)庫提供了表位的相關(guān)信 70 息,包括表位在抗原體的位置、表位的免疫特性、抗原體、抗原所對應(yīng)的抗體等。 該數(shù)據(jù)庫提供了友好的操作界面,能夠展示表位的 3D 結(jié)構(gòu)。
Epitome 數(shù)據(jù)庫存儲從抗原-抗體復(fù)合物推斷的抗原表位。在該數(shù)據(jù)庫中, 抗原殘基和 CDRs 之間的反應(yīng)稱為免疫反應(yīng)。研究者通過對復(fù)合物的比對和分析,識別抗原的 CDRs 區(qū)域,然后根據(jù)抗原抗體反應(yīng)來標(biāo)注與 CDRs 反應(yīng)的抗原 75 殘基。該數(shù)據(jù)庫存儲了 142 條標(biāo)記抗原,也提供了可視化工具分析抗原-抗體復(fù)合物以及標(biāo)注的表位。
AntiJen是一個綜合數(shù)據(jù)庫,涵蓋了與免疫和疫苗相關(guān)的動力學(xué)、熱力學(xué)和分子數(shù)據(jù)。AntiJen v2.0 包含 3541 條 B 細(xì)胞表位(線性表位和構(gòu)象表位)。每條表位都提供了其肽段來源、抗體、外部鏈接。
HIV 分子免疫數(shù)據(jù)庫包含 HIV 病毒表位。該數(shù)據(jù)庫中的數(shù)據(jù)來源于 HIV 免疫文獻(xiàn),目前包含 11,361 條 HIV 相關(guān)的 B 細(xì)胞反應(yīng)和 T 細(xì)胞反應(yīng)數(shù)據(jù)。
3、B細(xì)胞表位預(yù)測方案簡介
從80年代Hopp和Woods提出親水性參數(shù)對抗原表位預(yù)測的方法以來,已有許多參數(shù)、算法發(fā)表,對B細(xì)胞蛋白抗原表位研究起到巨大的推動作用。現(xiàn)已被大眾認(rèn)可并具有較好預(yù)測效果的方法,主要有以下6種:
(1)親水性方案(Hydrophilicity)
常用的有五種方法:Nozaki-Tanford scale,Hopp-Woods scale,Eisenberg scale,Kyte-Doolittle scale,HPLC scale。其中尤以Hopp-Woods方案最為有名。認(rèn)為蛋白質(zhì)抗原各氨基酸殘基可分為親水殘基和疏水殘基兩類。在機體內(nèi),疏水性殘基一般埋在蛋白內(nèi)部,而親水性殘基位于表面,因此蛋白的親水部位與蛋白抗原表位有密切的聯(lián)系。Hopp-Woods方案是以殘基由有機相環(huán)境轉(zhuǎn)移到水相環(huán)境的自由能為依據(jù)計算各個氨基酸的親水性。現(xiàn)已明確,親水性部位與抗原表位并無很好的一致性,即高親水性部位不一定是表位,表位也不一定是親水性部位。
(2)可及性方案(Accessibility)
如Janin可及性參數(shù),指蛋白質(zhì)抗原中氨基酸殘基被溶劑分子接觸的可能性。它反映了蛋白質(zhì)抗原內(nèi)、外各層殘基的分布情況。
(3)抗原性方案(Antigenicity)
對20個已研究得很透的蛋白質(zhì)的69個連續(xù)位點的606個氨基酸統(tǒng)計分析,Welling建立了抗原性刻度。每個氨基酸用出現(xiàn)在抗原區(qū)的頻率描述,此頻率除以各氨基酸在所有蛋白質(zhì)中的頻率就可推出此刻度值。該法研究表明,疏水性氨基酸殘基對抗原表位形成亦有貢獻(xiàn)。缺點是其所用的數(shù)據(jù)庫有限,并且連續(xù)位點內(nèi)的殘基被認(rèn)為是同等重要的。顯然那些不重要的殘基歸入計算會明顯降低相關(guān)性。
(4)可塑性方案(Flexibility)
指蛋白抗原構(gòu)象不是剛性不變的,其多肽鏈骨架有一定程度的活動性,活動性強的氨基酸殘基即可塑性大的位點,易形成抗原表位。Karplas 和Schulz基于已知結(jié)構(gòu)的31個蛋白質(zhì)的Cx的溫度β因子,發(fā)展了一種預(yù)測蛋白質(zhì)片段活動性的方法。
(5)電荷分布方案(Charge distribution)
認(rèn)為對堿性抗原特異的抗體多趨于酸性,對酸性抗原特異的抗體多趨于堿性。
(6)二級結(jié)構(gòu)預(yù)測方案(Secondary structure)
認(rèn)為β轉(zhuǎn)角結(jié)構(gòu)為凸出結(jié)構(gòu),多出現(xiàn)在蛋白質(zhì)抗原表面,利于與抗體嵌合,較可能成為抗原表位。而α螺旋、β片層結(jié)構(gòu)規(guī)則不易形變,較難嵌和抗體,一般不作為抗原表位??深A(yù)測蛋白質(zhì)β轉(zhuǎn)角的有Chou-Fasman,Garnier,Cohen等方法。其中各種方法預(yù)測的成功率均不超過65%。一般認(rèn)為Cohen方法對轉(zhuǎn)角的預(yù)測正確率很高,對于已知折疊類型的蛋白質(zhì)(αα類,ββ類,α/β類)正確率高達(dá)95%,對于未知結(jié)構(gòu)類型的蛋白質(zhì),可用3種類型分別預(yù)測,3類預(yù)測一致的轉(zhuǎn)角對預(yù)測表位有幫助。
對上述各種參數(shù)的預(yù)測比較表明,各種方案預(yù)測的正確率均不高。一般將上述多種方案綜合考慮,尤以可及性方案、可塑性方案、抗原性方案及二級結(jié)構(gòu)預(yù)測為重要。概括而言,作為B細(xì)胞蛋白抗原的表位首先應(yīng)易于位于或移動于蛋白質(zhì)抗原表面,有利于與抗體結(jié)合。另外,具有一定柔韌性,因為抗原與抗體結(jié)合時蛋白構(gòu)象有一定的變化。已經(jīng)有一些文獻(xiàn)提出了各自不同的綜合分析方法。1988年Jameson和Worf提出一種綜合預(yù)測方案。權(quán)重選擇為:40%來自二級結(jié)構(gòu)成分,可及性、柔韌性各15%,30%來自親水性。在吳加金等編的Goldkey軟件中,以六種參數(shù)Hopp-Woods,HPLC,Accessibility,F(xiàn)lexibility,Charge,Antigenivity綜合考慮,得出綜合判斷圖,閾值以上的峰即認(rèn)為是預(yù)測的抗原表位。