多溴联苯醚(PBDEs)是溴代阻燃剂类化合物,共有209种同系物,常作为阻燃添加剂加入到树脂、聚苯乙烯和聚氨酯泡沫等高分子合成材料中,广泛应用于塑料制品、纺织品、电路板和建筑材料等领域.PBDEs相对分子质量大、熔点高、蒸气压低、水溶性低及辛醇-水分配系数高,因而具有亲脂性和生物易累积等特点,能在生物体内的脂肪和蛋白质中蓄积,并通过食物链放大,对高营养级的生物造成影响.PBDEs作为一种新型的全球性、持久性有机污染物,对环境生物以及人体健康的造成危害,并引起了广泛的关注.
生物富集因子(BCF)是评价有机污染物生物累积性的重要指标.在PBDEs的环境评估中,生物富集因子是一个重要的参数.虽然对于PBDEs的生物富集因子的测定有标准的方法,但要测定209种PBDEs的BCF值,实验显然耗时、耗力,测定费用高.
因此,目前由实验测定PBDEs的BCF极其有限.
定量结构-活性关系(QSAR)指化合物的分子结构与其活性之间的定量预测模型.QSAR可以根据化合物的结构参数来预测其活性,弥补数据的缺失,降低昂贵的测试费用.本文拟通过Gaussian 03将PBDEs进行B3LYP/6-31G*水平上的分子结构优化,从中提取相关量子化学参数.
1、材料与方法
1.1 BCF文献值的选取
多溴联苯醚(PBDEs)通用结构式,如图1所示,图1中:m+n的范围是1~10.本研究所用19种PBDEs的BCF实测值取自Mansouri等的工作,其数据从寡毛纲淡水生物正颤蚓获得,生物富集系数,如表1所示.表1中:随机选取的13种PBDEs组成模型训练组,其他6种PBDEs则作为模型检验组(见*标注).
1.2量子化学参数选取
应用量子化学软件包Gaussian 03,以密度泛函理论的方法计算,选择考察包括22个量子化学参数在内的24种变量,所涉及的量子化学参数包括:最高占有轨道能量(EHOMO)、最低空轨道能量(ELUMO)、次高占有轨道能量(ENHOMO)、次低空轨道能量(ENLUMO)、分子总能量(ET)、电子空间广度(Re)、分子偶极矩(μ)、1,1′号碳原子与氧原子间的键长(RC1-O、RO-C1′)、分子骨架中13个原子的带电量(QC1,QC2,QC3,QC4,QC5,QC6,QO,QC1′,QC2′,QC3′,QC4′,QC5′,QC6′).
此外还考察了ELUMO-ENHOMO,ELUMO+ENHOMO两种前线轨道能量的组合.
1.3模型的优化建立
应用Simca-P(11.5版)软件进行偏最小二乘法(PLS)分析.模型的检验采用外部样本预测检验法,即将样本分为模型训练组和模型检验组.表1用Simca-P软件建模,当某个PLS主成分交叉有效性判别系数的Q2值大于程序缺省设置的显著性水平限(0.097 5)时,即认为该主成分有意义.
当累积交叉有效性判别系数Q2cum大于0.5时,认为所建立的模型有较好的预测可靠性.考虑到PBDE溴取代的个数(NBr)对PBDEs的BCF可能有影响,为了获得统计学上合理的模型,将log BCF与NBr进行组合,log BCF,log(BCF+NBr),log(BCF-NBr),log(BCF×NBr)和log(BCF/NBr)作为因变量,采用PLS方法拟合建立模型.
2、结果与分析
2.1模型的建立
模型训练组不同因变量PLS模型最终拟合参数,如表2所示.
由表2可知:以log BCF为因变量建模的Q2cum小于0.5,说明该模型预测性较差,无法建立可信度较高的定量预测模型;以log(BCF-NBr)
为因变量建立的PLS模型的模型拟合精度相对较高,Q2cum为0.921,包含了自变量52.2%的变异信息,对因变量的解释能力高达98.0%;log(BCF+NBr),log(BCF×NBr)和log(BCF/NBr)优化后的Q2cum为0.865,0.817和0.788,所建立的模型分别包含了更多的自变量变异信息50.5%,36.5%和36.6%,对因变量的解释能力为96.5%,89.3%和90.6%.
综合比较分析Q2cum和R2Y(cum)可知,log(BCF-NBr)的拟合效果最好.
2.2模型的验证
为了确定最优模型,本研究对模型进行了验证.将所有样本(模型训练组和模型检验组)的自变量分别带入到各PLS模型中,并将得到的预测结果与实验数值进行比较,结果如表3所示.
表3中:*为模型检验组的数据,残差指预测值与文献中实验值之差.由表3可知:log(BCF+NBr),log(BCF-NBr),log(BCF×NBr)和log(BCF/NBr)4个模型均具有一定的预测能力,其残差范围分别为-0.60~0.69,-0.49~0.96,-1.53~1.13,0.21~6.02.从残差范围来看,log(BCF+NBr)与log(BCF-NBr)的预测效果明显优于其他两个模型,预测效果较好.PBDEs4个模型检验组的残差,如图2所示.
从图2可以看出:log(BCF-NBr)模型检验组的残差值相对较低(log(BCF+NBr),log(BCF×NBr)和log(BCF/NBr)检验组的残差绝对值分别为2.59,2.95和16.95),其残差绝对值之和为2.12,是4种模型中最低的.这也说明了以log(BCF-NBr)为因变量建立的PLS模型为本研究的最佳预测模型.
2.3 BCF影响因素的分析
以log(BCF-NBr)为因变量建立的模型,如表4所示.
表4中:x为自变量;a为系数.表4列出该最优模型的自变量在方程中对应的系数及相应的VIP值,所得回归模型为
上式中:系数a为各自变量对应的系数值;常数为C.
在PLS建模中,VIP是一个反应自变量重要性相对大小的参数,自变量的VIP值越大,说明该自变量对因变量的影响越大.
由表4可知:分子总能量ET与电子空间广度Re的VIP值分别为1.71,1.48,远高于其他自变量的VIP值,说明这两个自变量对PBDEs的BCF有着重要的控制作用;Re在同系物中可用于表征不同分子间分子体积的大小,虽然某些情况下Re与分子体积间的相关性不好,但对PB-DEs这类结构上非常相似的同系物而言却具有较好的相关性;ET数值上的较大变化意味着分子组成中取代溴原子个数的变化,而相同分子组成的同分异构体之间也存在着微小的差异;Re的系数为正,ET的系数为负,说明在PBDEs的溴取代基数目相同的情况下,随着Re数值的减小或ET数值的增大,log(BCF-NBr)的值逐渐减小,即相应的PBDEs更不易富集在土壤、沉淀物、生物体中.
Harrie等和Qin等对二噁英及多氯联苯富集情况的研究,也说明了卤素(氯和溴)取代基数目对有机化合物的BCF数值有较大的影响.
3、结论
通过Gaussian 03将PBDEs进行B3LYP/6-31G*水平上的分子结构优化,应用PLS分析,建立了PBDEs生物富集系数的QSAR模型.结果表明:溴取代基个数对PBDEs的BCF有较大影响,直接用log BCF建模无法得到较好的预测模型.
以log(BCF+NBr),log(BCF-NBr),log(BCF×NBr)和log(BCF/NBr)作为4种因变量Y建模,发现用log(BCF-NBr)建立的模型具有较好的预测能力,并通过log(BCF-NB)模型建模,得到其拟合相关系数平方和累积交叉有效性判别系数分别为0.980和0.921,可有效预测PBDEs的生物富集系数.
此外研究发现ET,Re以及NBr对PBDEs的BCF有着较大的影响.较低ET,较大Re的PBDEs呈现出较低的BCF,随着溴原子数的递增,BCF呈现先增大后减小的趋势.
参考文献:
[1]HITES R A.Polybrominated diphenyl ethers in the environment and in people:Ameta-analysis of concentrations[J].Environ Sci Technol,2004,38(4):945-956.
[2] 刘艺凯,唐建辉,潘晓辉,等.环境中多溴联苯醚分析方法的研究进展[J].环境化学,2012,31(12):1908-1915.