- 相关推荐
马氏距离与欧氏距离方法在地球化学异常处理中的对比
第27卷 第4期吉 林 地 质 Vol127 No14
2008年12月Dec12008JILINGEOLOGY
文章编号:10012427(2008)0411704
马氏距离与欧氏距离方法在地球化学异常处理中的对比
宋运红,李振祥,孙连辉,贾大成,部雪娇
1.吉林大学地球探测科学与技术学院,吉林长春 130061;2.,1
2
2
1
1
摘要:,马氏距离就是一个在地球以往比较普遍使用的是以欧氏距离为基础的计算方法,1∶5万地球化学数据处理为例,,马氏距离方法考虑到了不同元素之间的相互关系,利用马氏距离方法求得的综合地球化学异常范围集中、界线清楚、强度突出、与已知矿体的吻合程度高,较欧氏距离方法具有明显优势,并在实际中可行。
关键词:地球化学数据处理;综合地球化学异常;欧氏距离;马氏距离;对比中图分类号:P618,P632 文献标识码:A
ContrastbetweenMahalanobisdistanceandEuclideandistance
ingeochemicalexplorationprocessing
SONGYun2hong,LIZhen2xiang,SUNLian2hui,JIADa2cheng,BUXue2jiao
1.CollegeofGeoexplorationScienceandTechnology,JilinUniversity,Changchun130026,Jilin,China;2.InnerMongoliaNo.
10InstituteofGeologyandMineralExplorationandDevelopment,Chifeng,024005,InnerMongolia,China
1
2
2
1
1
Abstract:Theaccuracyandvalidityofthedeterminationofsyntheticgeochemicalanomalyaretheimportantcontentsintheprocessingofgeochemicalanomaly.Thedeterminationofsyntheticgeochemicalanomalyisbasedonmulti2variatenormaldistributiontheory,whichisthedirectlypromotionandapplicationofmultivariablestatisticalmethod,Mahalanobisdistanceisacompositeindicatorthatwidelyappliedinidentifyingoutlier,discriminantanaly2sisandotherrelatedareaofgeochemistry.Euclideandistancewasuniversallyusedintraditionalmethed,however,inrecenttwentyyears,Euclideandistancehasbeenappliedincreasedly.Takingtheprocessingof1∶50000geo2chemistrydataforexampleinthispaper,twomethodswerecontrastedfromtheoryandappliedeffects.
Interrela2
tionshipoftheelementshadbeenconsideredinMahalanobisdistance.SyntheticgeochemicalanomalycomputedbyMahalanobisdistancehassuchcharactersascentralizedshttp://www.unjs.comcope,cleardemarcationline,prominentintensity,highanastomosiswithknownorebody.MahalanobisdistancehasobviousadvantageoverEuclideandistanceandisfeasi2bletobeappliedinreality.
Keywords:geochemicaldataprocessing;syntheticgeochemicalanomaly;Mahalanobisdistance;Euclideandistance;contrast
收稿日期:2008204225;改回日期:2008211210
作者简介:宋运红(19832),女,山东泰安人,吉林大学地球探测科学与技术学院硕士研究生。
118
吉 林 地 质 第27卷
地球化学背景和异常划分是地球化学处理方法
中的重要内容,直接影响地球化学找矿的效果。基于一元正态分布理论,通过计算样品数据的统计学参数(均值、标准离差等)得出背景值和异常下
[1]
限,获得单指标异常,随着多元正态分布理论在地球化学数据处理中的应用,综合地球化学异常在地化找矿和成矿预测中的优势得到充分的发挥,已逐渐成为一种常规的地球化学异常处理方法。基于多元正态分布理论的多指标综合地球化学异常处理方法,实际上是多变量统计方法的直接推广与应用,算方法,,20[2]
别。由于,常上也有所差别,然而,对于这两种方法在地球化学异常处理效果上的差异如何却鲜有讨论。本文以河北某地1∶5万地球化学数据处理为例,试图从理论上和应用效果上对两种方法进行比较,查找各自的优缺点,以便在进行地球化学综合异常评价时为选择合理处理方法提供依据。
并作为区分背景与异常的有效方法112 马氏距离的基本原理
[3]
。
由于欧氏距离只是各变量至变量平均值的几何距离,而没有考虑到变量之间的相关关系,为解决这个问题,印度著名统计学家马哈拉诺比斯提出了“基于多元统计的马氏距离方法”,它是一种有效X-X)=D
2
-1
-1
[6]
。
(3)
2
;X为元素平均值;S为原始;S为原始数据协方差矩阵逆矩阵。
在原始变量空间中,马氏距离是考虑样本中变量间相关性的各样本到样本平均值的距离,对于每
-1
(X-X)一个给定的正值D,(X-X)′S
=D就
2
确定了一个m维超椭球。通过不断改变D值,就
可以得到具有相同中心的超椭球束,它们的形状和方向由S确定,它们的大小由D确定。在椭球面
2
上,马氏距离的概率密度不变,D越小,概率密度越大,D越大,概率密度越小,当D大到一定程度时,其分布的概率密度就会小到一定的程度,以至于在此范围外的所有点不再属于正态分布总体,即它们在一定程度上属于异常点,因此,只要找到这个临界距离Dα,则大于它的均为异常样
2
[4]
2
2
1 马氏距离和欧氏距离的基本原理
111 欧氏距离的基本原理
。
欧氏距离是使用最为广泛的一种方法。其计算公式为:
m
从总体中剔除异常样品,剩下的就是正态分布总体,从而可求得正态分布总体的平均值,这就是所求得的综合背景值,剔除的异常样就是我们所需要的综合异常样。
2
在实际应用中,临界距离Dα可用F分布(可由F分布表查出)确定:
d=
=1
(X
ik
-Xjk),i、j=1,2,…,n
2
(1)
其中一种特殊情况,点i到分布中心的欧氏距
离,公式如下:
m
d=
=1
(X
ik
-Xj),i=1,2,…,n
2
(2)
Dα
2
=Fα(m,n-m)(n-m)n
2
(4)
式中:Xij为样品点;Xj为变量的平均值。
欧氏距离是一种点与点间的距离,在多元统计中,我们所要解决的不再是具体的点到点的距离,而是样品点到相应总体的距离,因此,需要在总体中找一个最具代表性的点,用样品点到代表点的距离定义样品点到相应总体的距离,总体的均值向量Xj就是这样的代表点,因为它是总体的取值以概率加权后的“中心”点,从而可以很容易的推广到3个变量乃至更多变量的场合。欧氏距离的突出特点是考虑到各变量至各变量平均值的几何距离,
马氏距离是建立在多元正态分布理论之上的方法,由于其所考虑的是多种相互作用的因素,因而更适合多元或多因素的求异。
2 马氏距离与欧氏距离基本原理比较
虽然综合地球化学异常的确定是以多元正态分布理论为基础,但基于上述不同的计算方法,对于多元数据统计过程存在不同条件和含义。对于确定综合地球化学异常,欧氏距离体现出3个主要的不足:(1)欧氏距离的值与总体各分量的量纲有关,
第4期 宋运红李振祥等:马氏距离与欧氏距离方法在地球化学异常处理中的对比
119
而各种元素在地壳中的含量有着明显的差距,需要统一量纲,在统一量纲过程中有一定的人为性和随意性,而且任何一个变量计量单位的改变都会使此距离的数值改变;(2)欧氏距离的定义没有考虑各个变量之间的相关性。实际上,欧氏距离是把各个变量都同等看待,将两个样本在各个变量上的离差简单地进行了综合;(3)欧氏距离必须满足正态分布条件,对地球化学数据首先要进行正态分布检验。
同样建立在多元正态分布理论基础上的马氏距离方法,考虑了均值、方差和协方差3,。
马氏距离是考虑样本中变量间相关性的各变量至变量平均值的距离;而欧氏
[5]
距离只是各变量至变量平均值的几何距离。马氏距离相对于欧氏距离而言具有以下优点:(1)马氏距离是欧几里德空间中非均匀分布的归一化距离,不用考虑各特征参数的量纲,且与各分量单位的选取无关;(2)马氏距离是根据整个空间上的特征分布情况作为判别依据的,考虑了变量之间的相关性影响。因此,它能更好地描述元素之间的相似性,为更高一级的数据分析提供有效的数据;(3)可以不严格地满足正态分布条件。
在实际应用中,地球化学样品往往要受到多种互相关联的因素控制。如该地区的地层、岩石、构造以及化学物质的污染情况等等多种地质条件、地球化学因素,这些因素彼此影响,在很大程度上影响样品中各元素的分布状态和结构。在同一地质环境中,有显著异常的区域往往与成矿作用或其它特有地质作用有关,此外,我们实地遇到的某地区也并不是只有一次成矿作用和只产一种矿床,即使是一种矿床也往往会有多种伴生元素,所以得到这个地区综合异常是非常必要的,然而只有在查明数据总体与各变量及各变量之间的联系,刻画出总体多元结构的基础上,才有可能正确区分背景与异常。马氏距离D是广义平方距离的一种,以多元正态分布理论为基础,有效地考虑了均值、方差、协方差3个参数,由于其所考虑的是多种相互作用的因素,是一个能够较全面描述总体多元结构的综合指标,在矿产资源预测、异常圈定、生态环境研究、
2
气象等方面得到了广泛的应用。
3 马氏距离和欧氏距离地球化学综合异常
效果对比
以河北某地区正规1∶5万水系沉积物地球化学测量数据为例,比较应用马氏距离和欧氏距离确定多元综合异常的方法1476个样品,,根据综合异常直观地比较两。
31 R型因子分析地球化学组合异常
对该图幅数据处理得到R型因子分析结果(表1),其中:F1因子主要是Au、Ag、Pb、Sb组合;F2因子主要是Mn、As、Sb组合;F3因子主要是Cu、Pb组合;F4因子主要是Mo、Mn组合;F5因子主要是Co、Mn组合;F6因子主要是Zn(Mn、Pb)组合;F7因子主要是Ni异常;F8因子主要是Sn异常;F9因子主要是Bi异常。选择以Au为主的F1因子得分做累加综合异常图(图1)。
在F1因子得分综合异常图中,有10个主要异常区(Z1~Z10),其异常主要分布在右上半部分,构成西北和东南走向异常带与线性构造基本一致,Z2和Z4两个异常与已知矿区基本吻合(图1)
。
图1 R型因子分析F1因子组合异常等值线图
Fig11 F1factorsyntheticanomalycontourmapwithR
-factoranalysis
120
吉 林 地 质 第27卷
表1 全部样品正交旋转因子载荷矩阵
Table1 Loadmatrixoforthogonalrotationfactorforallsamples
F1
AuAgCuPbZnMnMoCoNiSnAsSbBi
0181201799010570161901100-0104001080011130102601003-001431010292011%
F20105801015-0104801069010520147301008-01058010890101665010933114%
F3-011740124001907014640105601243-01008-010460101017-01137010434111%
F4-0111301214-01017010990105701304019530110109601009-01032010694916%
F50103201080-01015010490103801010113201122-01004-01052010505712%
F601066-0103301028012351970001007010150108101046-01015010126416%
F7-01018010270103601100-01940105101181019500103701191-01098010237112%
F8-01019-010210104210981076-01262010960116901037019280113701074-010017715%
F901017-01045010230113001011-01036010730106301022-010020116701070019848312%
累计方差贡献
312 马氏距离地球化学综合异常
依据公式(3)至(4),计算样品的马氏距离
2
D,以剔除异常样品后的正常总体的马氏距离上线值Dα为异常下限,利用所有样品的马氏距离D做地球化学综合异常图(图2)
。
2
2
区(M1~M10),其异常主要分布在图幅上半部分,与线性构造一致,西北和东南走向异常带更为明显,M2~M8两个异常与已知矿区基本吻合(图2)。
313 马氏距离与欧氏距离地球化学综合异常比较
两种方法确定的综合异常分布总体上具有类似性,综合异常个数相同,多数异常基本可以对应,如图1中Z1、Z2、Z7、Z3、Z4、Z5、Z6、Z8号异常分别对应图2中的M1、M2、M4、M5、M6、M8、M10、M7号异常。但是在异常空间位置、异常范围和异常强度等方面仍然存在一定差异。
从两异常图对比可以看出,马氏距离综合异常具有如下优势:异常范围面积比较小,界线清楚,异常浓集中心明显,且异常含量等级清晰,异常强度突出,与已知矿体的吻合程度高,异常空间分布与区域线性构造的关系更密切,异常的带状能够体现出区域成矿带的特征,有利于在找矿中的实际应用。由此可见,利用马氏距离方法确定的综合异常具有比较好的应用效果。
图2 马氏距离综合异常等值线图
Fig12 SystheticanomalycontourmapwithMahalano2
bisdistance
4 结论
(1)马氏距离和欧氏距离都是建立在多元正
(下转129页)
在马氏距离综合异常图中,有10个主要异常
第4期 丁志江王 猛:基于GoogleEarth影像图遥感解译在我国西北矿产地质调查中的应用
129
变化、植被覆盖等等容易时过境迁的图象信息反映差异较大。显然GE影像更加接近于目前工作区内的实际情况。能更加准确有效地指导野外调查工作。GE还能够动态显示光标位置的经纬度及高程,虽然其数据误差较大,但我们可以利用它能大体测算区内各地点间的相对高差,及时发现野外调查工作当中的安全隐患,减少安全事故的发生。让我们在任何一个陌生环境中仍能做到心中有数。不至于无的放失。
另外GE还可以与GPS进行连接,对野外调查工作进行实时控制。也可以通过GE采集种类界线的坐标点,编辑航线,导入GPS后进行导航地质观测。
其实GE的应用远远不限于此。我们可以在实地的工作当中充分利用GE带给我们的丰富的免费信息,,让GE在 (上接120页)
态分布理论之上的方法,在处理地球化学测量数据中都有应用,但基于欧氏距离的计算方法应用得较为普遍。从两种计算方法的原理分析,欧氏距离只是各变量与变量平均值的几何距离,而马氏距离是考虑样本中变量间相关性的各变量至变量平均值的距离,因而考虑到多种相互作用的因素,由于地球化学异常的形成是各种地质和成矿因素的综合,因而应用马氏距离方法求多元综合地球化学异常较欧氏距离方法更为客观。
(2)从实际应用效果上看,马氏距离法所确定的综合异常与欧氏距离法所确定的综合异常总体上在异常个数和分布特征方面基本可以对比,具有相似性。然而,马氏距离法所确定的综合异常范围集中、浓集中心明显、界线清楚、强度突出、与已知矿体和线性构造的吻合程度高,既减轻了多元组合异常重叠而造成的图面负荷太重,又便于对多元组合异常的验证和评价,其应用效果明显优于欧氏
距离方法。参考文献:
[1]吴锡生.化探数据处理方法[M].北京:地质出版
社,1992,38245.
[2]朴寿成,陶文宏,连长云.利用X分布确定多元地
2
球化学异常的方法[J].吉林地质,1997,16(3):
71274.
[3]时艳香,纪宏金,郝立波等.利用水系沉积物地球化
学数据判别浅覆盖区岩性与构造-欧氏距离法[J].物探化探计算技术,2004,26(3):2432246.
[4]纪宏金,林瑞庆,周永昶.关于若干化探数据处理方
法的讨论[J].地质与勘探,2001,37(4):56259.
[5]时艳香,纪宏金,陆继龙等.水系沉积物地球化学分
区的因子分析方法与应用[J].地质与勘探,2004,
40(5):73276.
[6]李玉榕,项国波.一种基于马氏距离的线性判别分析
分类算法[J].计算机仿真,2006,32(8):86289.
【马氏距离与欧氏距离方法在地球化学异常处理中的对比】相关文章:
加权欧氏距离及其应用04-27
距离02-17
距离08-26
距离(经典)11-27
论审美经验中的距离问题05-01
略论人际交往中的距离04-28
基于改进鲁棒马氏距离与卡平方分布的粗差判别及其应用04-30
[精品]距离11-28
河岸的距离05-02
距离作文04-28