[  企业注册  登录  ]

上海巴亚科学仪器有限公司

当前位置:首页

应用案例

主成分分析与聚类分析在水质评价中的应用

文件大小: 格式: 发布时间:2007-11-26 浏览次数:
更多
【中文关键词】 主成分分析  聚类分析  水质评价  应用            
【摘要】 目前对水环境的质量评价主要有物理、化学和生物学3种方法。随着计算机技术的广泛应用,生态学家开始使用计算机处理采样数据,用多元分析方法对群落进行相似性分析,直接将结果和聚类图输出。目前这种新兴的方法已经在国内外得到广泛应用[1]。本文尝试应用主成分分析和聚类分析的方法,综合化学和生物指标评价福州市内河的水环境质量,以期为内河水质的监测评价和综合治理提供基础资料。
【部分正文预览】

1 前言
目前对水环境的质量评价主要有物理、化学和生物学3种方法。随着计算机技术的广泛应用,生态学家开始使用计算机处理采样数据,用多元分析方法对群落进行相似性分析,直接将结果和聚类图输出。目前这种新兴的方法已经在国内外得到广泛应用[1]。本文尝试应用主成分分析和聚类分析的方法,综合化学和生物指标评价福州市内河的水环境质量,以期为内河水质的监测评价和综合治理提供基础资料。

2 材料与方法
2.1 采样点的设置
­­­­­­­­­­­­­­­­­­­根据福州市内河分布及污染源的特征分成3片河网,共设置12个采样点(图1),东片采样点为1#象园闸、2#三孔闸、3#化工河和4#新华印刷厂,中片为5#五四河、6#安泰河、7#东西河和8#瀛洲河,西片为9#市一家倶厂、10#大庆河口、11#彬德闸和12#新西河口。

2.2 浮游动物的采集和水样处理
2000年9月~2001年8月,每月月初采集浮游动物。定性采集用25号浮游生物网,定量采集用1L采水器,鲁哥氏液固定,实验室内镜检。浮游动物的鉴定参见文献 [2~11]。计算3种多样性指数:Shannon-Weaver多样性指数[12], Margalef 多样性指数[13]和Simpson 多样性指数[14]。同步测定NH3-N、TN、TP、CODMn和DO 5项化学指标。
2.3 主成分分析和聚类分析
选取5项化学指标和3种生物多样性指数,即x1-NH3-N、x2-TN、x3-TP,x4-CODMn、x5-DO、x6-Shannon-Weaver多样性指数、x7-Margalef 多样性指数和x8-Simpson 多样性指数。多元分析方法原理参见文献[15]。全部过程在计算机上用统计软件SPSS10.0完成,操作方法参见文献[16]。

3 结果与分析
­­­­­­­­­­­­­­3.1 主成分分析
将12个采样点测定的5项化学指标及3种多样性指数用主成分法进行分析,得到8个主成分。
根据提取主成分的个数一般要求其累计方差贡献率超过85%的原则,提取前4个主成分,其累计方差贡献率达96.737%(见表 1)。前4个主成分代表了全部原始指标96.737%的信息,表明主成分分析对原始指标分类作用是有效和客观的。
表1 相关矩阵的特征值(%)
项目 主成分1 主成分2 主成分3 主成分4
特征值
贡献率
累计贡献率 2.850
35.627
35.627 2.610
32.631
68.258 2.076
25.947
94.206 0.202
2.531
96.737

经方差极大正交旋转后得前4个主成分的荷载矩阵(见表2)。主成分1反映了内河营养化这一指标起主要作用的是TN、TP和DO,其相关系数值分别为0.963、0.711和-0.900,在主成分1的正、负方向上起作用。TN和TP是反映水体营养化程度的主要指标,其值越大,水体营养化程度越高。在高度营养化的水体中,由于藻类过量繁殖,其死亡后会消耗水体中大量的氧气,造成水体缺氧,故测得的DO含量肯定就低,主成分1很好地反应了这一情况。主成分2是NH3-N和S值在起作用,其相关系数分别为0.889和-0.871,这2项指标在主成分2的正、负方向上起作用。一般说来,NH3-N值越高,水体所受的有机污染越严重,水体中生物种类相对减少,多样性指数就会下降。主成分3是M值和H值在起作用,其相关系数分别为0.869和0.867,反映内河的生物多样性指标,二者呈正相关。主成分4反映了内河有机污染的指标,由CODMn起作用。
表2 方差极大正交旋转后的荷载矩阵
化学和生物指标 主成分1 主成分2 主成分3 主成分4
TP
DO
TN
NH3-N
CODMn
S值1)
M值2)
H值3) 0.963
-0.900
0.711
0.263
0.525
-0.274
8.791×10-02
-0.426 0.121
-0.360
0.633
0.889
0.536
-0.871
-0.435
-0.198 -0.112
0.119
-0.267
-0.327
-0.534
0.283
0.869
0.867 9.074×10-02
2.930×10-02
-6.56×10-02
1.606×10-02
0.373
-9.08×10-02
-0.167
0.118

1) S值表示Simpson 多样性指数;
2) M值表示Margalef 多样性指数;
3) H值表示Shannon-Weaver多样性指数。

表3 主成分标准得分系数
采样点 主成分1 主成分2 主成分3 主成分4
1#象园闸
2#三孔闸
3#化工河
4#新华印刷厂
5#五四河
6#安泰河
7#东西河
8#瀛洲河
9#市一家俱厂
10#大庆河口
11#彬德闸
12#新西河口 0.79983
-0.58755
0.09700
-0.51127
1.33572
1.46539
0.00678
0.01920
-0.35905
0.19332
-0.08474
-2.37463 -0.57009
0.05060
2.52534
-0.88357
-0.67355
-0.75386
0.38305
-0.56547
-0.50524
1.00755
0.60720
-0.62195 -0.46997
0.74657
-1.51466
0.16698
-1.07165
0.00457
1.22736
-0.95548
0.96163
1.25882
0.76094
-1.11512 -1.35722
0.53520
-0.01161
0.44622
2.42451
-1.07133
0.31449
-1.14844
0.24453
0.04275
-0.40831
-0.0107


3.2 聚类分析
计算前4个主成分的标准得分系数(见表3),将主成分的得分系数代替原始指标进行聚类分析。利用统计软件SPSS10.0提供的方法,先后用组内联结法、最短距离法、最长距离法、重心法、中间距离法、离差平方法等6种系统聚类法对12个站点进行R型聚类,即对个案聚类,得到聚类结果(见图2)。6种方法的聚类结果完全一致,表明在主成分分析基础上进行的聚类分析是有效的。
聚类分析将12个采样点分为6类,结合化学和生物指标的评价标准,给每一类确定污染等级。2#三孔闸、4#新华印刷厂和9#市一家俱厂受污染的状况基本一致,聚为一类,为乙型至甲型“中污”; 7#东西河、10#大庆河口和11#彬德闸归为一类,为甲型至乙型“中污”;1#象园闸、6#安泰河和8#瀛洲河归为一类,为甲型“中污”;5#五四河和3#化工河被分成2类,污染均较严重,主要为甲型“中污”至“多污”;12#新西河口单独列为一类,污染最轻,水质评价为“寡污”至乙型“中污”。聚类分析方法客观地将污染状况相近的采样点归为一类,与化学、生物指标综合评价结果基本一致。
4 结论
4.1 选用5项化学指标和3项生物指标,通过主成分分析将这8项繁杂无序而又相关的指标简化为4个独立且功能明确的主成分,各主成分结构层次趋于简便和直观。在此基础上进行聚类分析,以各站点的主成分得分系数来代替原始指标进行聚类,就避免了因原始指标间存在相关性所造成的聚类偏差,聚类结果较为客观准确。
4.2 利用主成分分析和聚类分析的方法来评价水质,克服了传统生物指标和理化指标难以综合评价的缺陷,且运用计算机进行数据处理,直接将结果输出,简单易行,是未来水质评价中的一种重要方法。
 

暂无评论信息



相关案例

联系方式

—上海巴亚科学仪器有限公司
地址:上海市长乐路191号锦江俱乐部58353室
邮编:200000
电话:021-54662692/54560316
传真:021-54662692
网址:http://www.gimatchina.com/
*留言类型: 采购咨询 售后咨询
*联系人:
*联系电话:
*电子邮箱:
*单位名称:
*留言内容: