多溴聯苯醚\\(PBDEs\\)是溴代阻燃劑類化合物,共有209種同系物,常作為阻燃添加劑加入到樹脂、聚苯乙烯和聚氨酯泡沫等高分子合成材料中,廣泛應用于塑料制品、紡織品、電路板和建筑材料等領域.PBDEs相對分子質量大、熔點高、蒸氣壓低、水溶性低及辛醇-水分配系數高,因而具有親脂性和生物易累積等特點,能在生物體內的脂肪和蛋白質中蓄積,并通過食物鏈放大,對高營養級的生物造成影響.PBDEs作為一種新型的全球性、持久性有機污染物,對環境生物以及人體健康的造成危害,并引起了廣泛的關注.
生物富集因子\\(BCF\\)是評價有機污染物生物累積性的重要指標.在PBDEs的環境評估中,生物富集因子是一個重要的參數.雖然對于PBDEs的生物富集因子的測定有標準的方法,但要測定209種PBDEs的BCF值,實驗顯然耗時、耗力,測定費用高.
因此,目前由實驗測定PBDEs的BCF極其有限.
定量結構-活性關系\\(QSAR\\)指化合物的分子結構與其活性之間的定量預測模型.QSAR可以根據化合物的結構參數來預測其活性,彌補數據的缺失,降低昂貴的測試費用.本文擬通過Gaussian 03將PBDEs進行B3LYP/6-31G*水平上的分子結構優化,從中提取相關量子化學參數.
1、材料與方法
1.1 BCF文獻值的選取
多溴聯苯醚\\(PBDEs\\)通用結構式,如圖1所示,圖1中:m+n的范圍是1~10.本研究所用19種PBDEs的BCF實測值取自Mansouri等的工作,其數據從寡毛綱淡水生物正顫蚓獲得,生物富集系數,如表1所示.表1中:隨機選取的13種PBDEs組成模型訓練組,其他6種PBDEs則作為模型檢驗組\\(見*標注\\).
1.2量子化學參數選取
應用量子化學軟件包Gaussian 03,以密度泛函理論的方法計算,選擇考察包括22個量子化學參數在內的24種變量,所涉及的量子化學參數包括:最高占有軌道能量\\(EHOMO\\)、最低空軌道能量\\(ELUMO\\)、次高占有軌道能量\\(ENHOMO\\)、次低空軌道能量\\(ENLUMO\\)、分子總能量\\(ET\\)、電子空間廣度\\(Re\\)、分子偶極矩\\(μ\\)、1,1′號碳原子與氧原子間的鍵長\\(RC1-O、RO-C1′\\)、分子骨架中13個原子的帶電量\\(QC1,QC2,QC3,QC4,QC5,QC6,QO,QC1′,QC2′,QC3′,QC4′,QC5′,QC6′\\).
此外還考察了ELUMO-ENHOMO,ELUMO+ENHOMO兩種前線軌道能量的組合.
1.3模型的優化建立
應用Simca-P\\(11.5版\\)軟件進行偏最小二乘法\\(PLS\\)分析.模型的檢驗采用外部樣本預測檢驗法,即將樣本分為模型訓練組和模型檢驗組.表1用Simca-P軟件建模,當某個PLS主成分交叉有效性判別系數的Q2值大于程序缺省設置的顯著性水平限\\(0.097 5\\)時,即認為該主成分有意義.
當累積交叉有效性判別系數Q2cum大于0.5時,認為所建立的模型有較好的預測可靠性.考慮到PBDE溴取代的個數\\(NBr\\)對PBDEs的BCF可能有影響,為了獲得統計學上合理的模型,將log BCF與NBr進行組合,log BCF,log\\(BCF+NBr\\),log\\(BCF-NBr\\),log\\(BCF×NBr\\)和log\\(BCF/NBr\\)作為因變量,采用PLS方法擬合建立模型.
2、結果與分析
2.1模型的建立
模型訓練組不同因變量PLS模型最終擬合參數,如表2所示.
由表2可知:以log BCF為因變量建模的Q2cum小于0.5,說明該模型預測性較差,無法建立可信度較高的定量預測模型;以log\\(BCF-NBr\\)
為因變量建立的PLS模型的模型擬合精度相對較高,Q2cum為0.921,包含了自變量52.2%的變異信息,對因變量的解釋能力高達98.0%;log\\(BCF+NBr\\),log\\(BCF×NBr\\)和log\\(BCF/NBr\\)優化后的Q2cum為0.865,0.817和0.788,所建立的模型分別包含了更多的自變量變異信息50.5%,36.5%和36.6%,對因變量的解釋能力為96.5%,89.3%和90.6%.
綜合比較分析Q2cum和R2Y\\(cum\\)可知,log\\(BCF-NBr\\)的擬合效果最好.
2.2模型的驗證
為了確定最優模型,本研究對模型進行了驗證.將所有樣本\\(模型訓練組和模型檢驗組\\)的自變量分別帶入到各PLS模型中,并將得到的預測結果與實驗數值進行比較,結果如表3所示.
表3中:*為模型檢驗組的數據,殘差指預測值與文獻中實驗值之差.由表3可知:log\\(BCF+NBr\\),log\\(BCF-NBr\\),log\\(BCF×NBr\\)和log\\(BCF/NBr\\)4個模型均具有一定的預測能力,其殘差范圍分別為-0.60~0.69,-0.49~0.96,-1.53~1.13,0.21~6.02.從殘差范圍來看,log\\(BCF+NBr\\)與log\\(BCF-NBr\\)的預測效果明顯優于其他兩個模型,預測效果較好.PBDEs4個模型檢驗組的殘差,如圖2所示.
從圖2可以看出:log\\(BCF-NBr\\)模型檢驗組的殘差值相對較低\\(log\\(BCF+NBr\\),log\\(BCF×NBr\\)和log\\(BCF/NBr\\)檢驗組的殘差絕對值分別為2.59,2.95和16.95\\),其殘差絕對值之和為2.12,是4種模型中最低的.這也說明了以log\\(BCF-NBr\\)為因變量建立的PLS模型為本研究的最佳預測模型.
2.3 BCF影響因素的分析
以log\\(BCF-NBr\\)為因變量建立的模型,如表4所示.
表4中:x為自變量;a為系數.表4列出該最優模型的自變量在方程中對應的系數及相應的VIP值,所得回歸模型為
上式中:系數a為各自變量對應的系數值;常數為C.
在PLS建模中,VIP是一個反應自變量重要性相對大小的參數,自變量的VIP值越大,說明該自變量對因變量的影響越大.
由表4可知:分子總能量ET與電子空間廣度Re的VIP值分別為1.71,1.48,遠高于其他自變量的VIP值,說明這兩個自變量對PBDEs的BCF有著重要的控制作用;Re在同系物中可用于表征不同分子間分子體積的大小,雖然某些情況下Re與分子體積間的相關性不好,但對PB-DEs這類結構上非常相似的同系物而言卻具有較好的相關性;ET數值上的較大變化意味著分子組成中取代溴原子個數的變化,而相同分子組成的同分異構體之間也存在著微小的差異;Re的系數為正,ET的系數為負,說明在PBDEs的溴取代基數目相同的情況下,隨著Re數值的減小或ET數值的增大,log\\(BCF-NBr\\)的值逐漸減小,即相應的PBDEs更不易富集在土壤、沉淀物、生物體中.
Harrie等和Qin等對二噁英及多氯聯苯富集情況的研究,也說明了鹵素\\(氯和溴\\)取代基數目對有機化合物的BCF數值有較大的影響.
3、結論
通過Gaussian 03將PBDEs進行B3LYP/6-31G*水平上的分子結構優化,應用PLS分析,建立了PBDEs生物富集系數的QSAR模型.結果表明:溴取代基個數對PBDEs的BCF有較大影響,直接用log BCF建模無法得到較好的預測模型.
以log\\(BCF+NBr\\),log\\(BCF-NBr\\),log\\(BCF×NBr\\)和log\\(BCF/NBr\\)作為4種因變量Y建模,發現用log\\(BCF-NBr\\)建立的模型具有較好的預測能力,并通過log\\(BCF-NB\\)模型建模,得到其擬合相關系數平方和累積交叉有效性判別系數分別為0.980和0.921,可有效預測PBDEs的生物富集系數.
此外研究發現ET,Re以及NBr對PBDEs的BCF有著較大的影響.較低ET,較大Re的PBDEs呈現出較低的BCF,隨著溴原子數的遞增,BCF呈現先增大后減小的趨勢.
參考文獻:
[1]HITES R A.Polybrominated diphenyl ethers in the environment and in people:Ameta-analysis of concentrations[J].Environ Sci Technol,2004,38\\(4\\):945-956.
[2] 劉藝凱,唐建輝,潘曉輝,等.環境中多溴聯苯醚分析方法的研究進展[J].環境化學,2012,31\\(12\\):1908-1915.