蓝田玉PDF文档网 / 地理旅游 / 现代地理学中的数学方法
 


现代地理学中的数学方法



前 言


  本人在大学本科学习数学专业,而到了研究生阶段则改学地理学,毕业 后一直在兰州大学地理系从事地理数量方法的教学与科研工作。本书就是笔 者结合自己近几年来的教学与科研工作,在总结国内外学者有关研究成果的 基础上写成的。希望它能对从事地理学、生态学、人口学、经济学、城市科 学和农业科学方面的科研人员及高等院校师生有一点参考价值。
  本书初稿完成之后,于 1994 年 7 月在呼和浩特市召开的全国高校计量地 理学与 GIS 教学研讨会上,向与会代表作了介绍,得到了大家的肯定和鼓励, 并根据代表们提出的意见,作了修改、补充。在本书的写作过程中,得到中 国科学院院士、兰州大学地理系主任李吉均教授及本人的导师艾南山教授的 指导和鼓励。本书的出版,得到了兰州大学教务处及高等教育出版社地理编 辑室的大力支持,书中插图由高等教育出版社郝林清绘。谨此,一并致谢! 由于笔者水平所限,本书一定存在不少错误与缺点,敬请读者批评指正。
徐建华
1994 年 10 月于兰州大学

内容提要


本书是关于地理数量方法方面的一部新作。全书十二章:1.绪论;2.统计分 析方法;3.线性规划方法;4.多目标规划方法;5.随机型决策方法;6.AHP 决策分析方法;7.网络分析方法;8.控制论及其应用;9.模糊数学方法;10. 灰色系统方法;11.系统动力学方法;12.投入产出分析方法。本书对于从事 地理学、生态学、经济学、人口学、环境学、农业科学、城市科学方面的科 研人员以及高等院校师生均有一定的参考价值,亦可作为综合性大学和高等 师范院校地理系高年级本科生及研究生的教材或教学参考书。

第一章 绪 论


  数学方法,不仅是人们进行数学运算和求解的工具,而且能以严密的逻 辑和简洁的形式描述复杂的问题,表达极为丰富的实质性思想。数学方法是 现代地理学研究中必不可少的重要方法之一。

第一节 现代地理学中的数学方法

——它的形成和发展


  地理学是一门古老的学科,早在我国战国前后和古希腊、古罗马时代就 开始萌芽,至今已有 2000 多年的发展历史。纵观地理学的发展史,可划分为 三个基本阶段:①古代地理学,是农牧业社会的产物,以地理知识的记载为 主体;②近代地理学,是工商业社会的产物,是一种对各种地理现象进行条 理化归纳,并对其间的关系作解释性描述的多分支知识体系;③现代地理学, 是新的科学技术社会,即信息社会的产物,它把地理环境及其与人类活动的 相互关系看作统一的整体,采用定性与定量相结合的方法,规范研究与实证 研究并举,以解释各种地理现象的内在机制并预测其未来演变的科学。
地理学,自其产生之日起,就与数学有着不解之缘。在古代,地理学与
数学之源泉科学——几何学,几乎都是研究地表的。正象《辞海》关于几何 学的解释那样:“古代埃及为兴建尼罗河水利工程,曾经进行过测地工作, 它逐渐发展为几何学”。因此,在来自希腊文的西方文字中,几何学有“测 地”之意,如其英文为 Geometry ,与地理学 (Geography) 、地貌学
(Geomorphology)、地植物学(Geobotany)、地生态学(Geoecology)等术语
有着一个共同的前缀 Geo。在古代地理学时期,人们为了测算河流长度、山 体高度,计算土地面积,不得不运用几何学原理和方法。古希腊学者艾拉托 塞尼(Eratcsthenes)测算地球周边,就是运用了几何学原理和方法。在近代 地理学时期,经济学中的区位论被移植到地理学中,开了地理学运用分析数 学之先河。本世纪 20—30 年代,地理学研究中的统计方法开始萌芽,并开始 进行地理要素的统计概括和相关关系探讨。这些事实充分说明,数学方法对 于地理学家来说,并不陌生。但是,在古代地理学中,运用数学方法仅仅是 为了描写地理事件,地理事实和记载地理知识;在近代地理学中,运用数学 方法,又只是局限于对地理现象的解释性描述。而在现代地理学中运用数学 方法,则是为了更进一步深入地进行定量化研究,以揭示地理现象发生、发 展的内在机制及运动规律,从而为地理系统的预测及优化调控提供科学依 据。现代地理学中的数学方法的出现,反映了地理学朝着定量化方向发展的 新趋势。这种新趋势就是在地理学研究中,以定量的精确判断来补充定性的 文字描述的不足;以抽象的、反映本质的数学模型去刻划具体的、庞杂的各 种地理现象;以对过程的模拟和预测来代替对现状的分析和说明;以合理的 趋势推导和反馈机制分析代替简单的因果关系分析;以最新的定量化技术革 新地理学的传统研究方法。
  现代地理学中的数学方法的产生与形成,可以追溯到本世纪 50 年代末 期。今天,我们所说的现代地理学中的数学方法,就是在 50 年代末开始的计 量运动的基础上进一步发展的产物。
  
一、现代地理学发展史上的计量运动 近代地理学的发展,曾形成了三种主要学派,即①由赫特纳(A.Hettner)
首倡,哈特向(R.Hartshorne)继承和发展了的区域学派;②由洪堡(Alexander Von Humb-oldt)和李特尔(Karl Ritter)创建,李希霍芬(F.Richthofen) 继承和发展,拉采尔(Friedrich Ratzel)等代表“决定论”,白兰士(Paul Vidal de la Blache)和白吕纳(J.Brunhes)等代表“或然论”的人地关系 学派;③由施吕特尔 (O.Schlüter)提出,帕萨格(S.Passarge)、苏尔
(C.O.Sauer)等阐发的景观学派。到本世纪 40 年代,由于老的人地关系学派 日趋落后,而景观学派的理论体系又尚未成熟,因而区域学派就成了当时地 理学的主流学派。该学派的主要观点是,地理学的研究对象是区域,研究目 标是描述和解释地球表面区域的差异性;在地理学中不存在法则,地理学只 能以区域为单元进行类型研究;专论地理学是地理学研究的起点,区域地理 学是地理学研究的终点;区域地理的样板,包括区域内的地质、地形、气候、 水文、动植物与人类各要素及其相互关系。在赫、哈二氏的倡导下,经马东
(E.de Martonne)、惠特利西(D.S.Whittlesey)、詹姆斯(P.E.James)等地 理学家的努力,在西方着实出现了一个区域地理发展的黄金时代。区域地理 范式也由此而变成了传统地理学的科学范式。
但是,自本世纪 50 年代以来,区域学派的观点开始受到质疑。一些学者
认为,对于区域的描述冗长、乏味、没有生气;对于许多区域的划分,特别 是划分大区域,都是很幼稚的、不成熟的、不科学的,区域研究当属于小范 围的研究。向区域范式提出最尖锐、最直接批评的是德籍旅美地理学家舍弗 尔(F.K.Schaefer),1953 年他发表了一篇题为“地理学中的例外论”的文 章,抨击了哈特向的地域独特主义观点,即“例外主义”观点。他认为,把 区域地理作为专论地理成果的综合是妄自尊大,不切合实际的;在区域地理 著作中没有引人注目的深刻见解;地理学应该是解释现象,而不应该是罗列 现象。解释现象必须有法则,应该把地理现象看成是法则的实例。地理学的 目的应该与其它科学有相似之处:都是追求、探索法则的。
舍弗尔等人对区域学派的批评与否定,拉开了现代地理学发展史上的计
量运动的帷幕。在舍弗尔的学术思想的影响下,从本世纪 50 年代末期开始, 首先在美国掀起了建立地理学法则的热潮。然而,究竟怎样建立地理学法则? 不同学者从不同的角度作了探索,但一般都是将数学、物理学、社会学、经 济学的理论和方法引入地理学,探求地理事物的空间格局,其共同之处在于 都是开展地理学定量化研究,建立定量模式。这种定量化研究之热潮,就是 所谓的计量运动。
  计量运动,主要是由美国地理学家发起的,早期主要集中在几所大学。 由于各校所持观点不同,研究方向不同,从而形成了各种不同的学派。其中, 主要有如下三大学派:
(1)衣阿华的经济派。该学派的主要代表人物是舍弗尔和麦卡尔蒂
(H.McCarty)。此学派受经济学影响较深,着重探讨经济区位现象间相互内 在联系及其组合类型。舍氏深受杜能(J.H.von Thünen)、廖什(A.L?sch)、 克里斯塔勒(W.Christaller)及胡佛(E.Hoover)等区位论学者和区域经济学 家的影响,他花费了大量的精力去翻译和宣传廖什的《区位经济学》,极力 倡导建立地理学法则。麦卡尔蒂于 1954 年出版了《对经济地理理论的探讨》 一书,认为生产布局理论解释有两种:其一,为因果解释,但是影响生产布

局的变量如此之多,无法处理,所以这种解释是行不通的;其二,为结合联 系的解释,从结合的观点出发,只要发现两种现象常常同时出现,就无需探 讨其内在因果关系,而只需探讨现象之间分布的结合律。这一学派尤其重视 相关分析与回归分析等统计分析方法在人文地理学中的应用。
(2)威斯康星的统计派。早在 1943 年,该校地理系研究生威弗尔
(J.Weaver)就发表了“论美国大麦生产与气候的关系”一文,他运用相关分 析、多元回归分析等方法去鉴定气候参数对大麦产量的影响,并用计算方法 进行作物布局规划。后来,罗宾逊(A.H.Robi-nson)领导一个研究小组,继 续发展统计分析方法。1961 年,该校的社会学家东坎(O.D.Duncan)和仇佐 里(R.P.Cuzzori)完成了巨著《统计地理学》。该学派以发展和应用统计分 析方法为其主要特征。
(3)普林斯顿的社会物理学派。该学派的领袖人物是天文学家司徒瓦特
(J.Q.Ste-wart)。1950 年,司徒瓦特尝试着把物理学原理应用于社会现象 的研究之中,创立了颇具特色的社会物理学派。通过比较研究,司氏发现, 在许多社会问题研究中,可以借鉴物理学中已经建立起来的规律、定量模式 和研究方法。他成功地借鉴物理学中的万有引力定律研究了人口分布的规 律,发表了题为“与人口分布和均衡有关的经验数学法则”的论文。司氏认 为,社会量纲与自然量纲是极相似的,具有一致性。他还在普林斯顿大学创 建了社会物理学实验室。受此学派影响,引力模型、位势模型、空间相互作 用模式得到了许多地理学家,特别是理论地理学家的青睐。
无论从美国还是从全世界来看,现代地理学发展史上的计量运动的兴
起,首先要归功于加里森(William L.Garrison)及其领导的华盛顿小组。加 氏是第一个把地理学的理论和方法建立在定量基础上的倡导者和实践者,是 第一本《计量地理学》教材的作者。他第一个率先在华盛顿大学举办了地理 计量方法研讨班,从推广中心地方论、交通网络理论和统计方法等开始,培 养了贝里(B.J.L.Berry)、帮吉(W.Bunge)、戴西(M.F.Dacey)、盖提斯
(A.Getis)、马尔布 (D.F.Marble)、毛里尔(R.L.Morril)、奈斯丘恩
(J.D.Nystuen)、托布勒(W.R.Tobler)等现代地理学名家。 促进计量运动的还有美国区域科学协会和瑞典地理学定量化研究的影
响。美国区域科学协会是由经济、地理、社会、城市与区域规划、建筑及工
程等各个学科的学者组成的,其发起人为艾萨德(Walter Isard)。该协会组 织了大量的学术活动,编辑出版了《区域科学年鉴》,因此,该协会成为美 国计量运动的源地之一。瑞典学者哈格斯特朗(Torsten H?g-erstrand)是 著名的地理计量学者,早在本世纪 30 年代,哈氏领导的隆德学派就开始了对 空间扩散模式的探讨。50 年代,他曾受加里森之邀请到华盛顿大学为地理计 量方法研讨班授课。他还组织了美国和瑞典地理学家与克里斯塔勒会面,交 流学术思想。哈氏的努力对于促进计量运动的发展和向全世界扩散起到了重 要作用。
  到了本世纪 60 年代,计量运动不胫而走,在短短几年时间里几乎传遍了 整个世界。世界各国地理学家纷纷响应,拥现出一大批著名的学者和学派。 如英国,由于受计量运动的影响,出现了以乔莱(R.J.Chorley)、哈格特
(P.Haggett)和哈威(D.Harvey)等为代表的剑桥学派,该学派以理论造诣高 深而著称。随着计量运动的发展,应运而生了各种组织与学术刊物。1964 年, 国际地理学联合会(IGU)设立了地理学计量方法委员会(Commi-ssion on

Quantitative Methods in Geography);1967 年,英国地理学会设立了地理 教学采用模型和计量技术委员会(Standing Committee on the Role of Modelsand Quantitative Technigues in Geographical Teaching);1968 年,日本成立了计量地理学研究委员会,1973 年又改称理论、计量地理学委 员会。1963 年,英国出版了《地理学计量资料杂志》,1969 年,美国出版了
《地理分析——国际理论地理学》杂志。我国,由于历史的原因,未能赶上 计量运动的“黄金时代”,地理学的定量化进程是从本世纪 70 年代末、80 年代初才开始的,但是其发展速度和势头却是十分喜人的。
二、现代地理学中的数学方法的发展阶段 现代地理学中的数学方法,作为一门新的方法论学科,其历史并不算长,
但是发展速度是十分惊人的。自 50 年代末期开始的计量运动以来,现代地理 学中的数学方法已经历了三个发展阶段。
  第一阶段,大致从 50 年代末到 60 年代末期,是现代地理学中的数学方 法发展的初期阶段。其主要特点是把统计学方法引入地理学研究领域,构造 一系列统计量来定量地描述地理要素的分布特征,比较普遍地应用各种概率 分布函数、平均值、方差、标准差、变异系数等统计特征参数以及简单的两 要素间的一元线性回归分析方法。从今天的观点来看,这些方法是比较浅易 的。但是,它却给长期以来只是定性描述的地理学带来了可喜的变化。许多 过去无法准确确定的概念,如分布中心、区域形状、地理要素分布的集中和 离散程度等都有了定量指标;许多地理要素之间的相关关系,可以定量地表 示了。这一时期,出现了许多专门探讨和介绍数学方法(主要是数理统计方 法)的地理专著,如东坎和仇佐里合著的《统计地理学》(1961)、加里森和 马布里合著的《计量地理学》(1967)、金(L.J.King)所著的《地理学统计 分析》(1969)等。
第二阶段,包括 60 年代末期到 70 年代末期的十年时间,属中期阶段。
该阶段的特征是多元统计方法和电子计算机技术在地理学研究中的广泛应 用。地理学研究对象的多因素、复杂结构和动态特征都使简单的统计方法无 能为力,为此就必须寻求解决复杂的地理问题的有效方法。正是在这一时期, 电子计算机的生产已经工业化,使用计算机的方法也从一般人很难掌握的机 器语言程序发展到高级算法语言程序。随着计算机科学的这种变化,多元统 计方法如雨后春笋般地发展起来,成为数理统计学中特别有生命力的分支之 一。过去用手算很难完成的复杂计算问题,运用计算机很快就可以得出结果。 以电子计算机技术为手段,许多地理学家熟练地掌握了多元统计方法,具备 了分析复杂的地理问题的能力。在自然地理学、经济地理学和人文地理学中, 以电子计算机为工具,运用多元统计方法使许多复杂问题得到了相当满意的 解决。
  第三阶段,从 70 年代末期开始,是现代地理学中的数学方法走向更加成 熟和更加完善的阶段。不但包括了概率论与数理统计方法,还包括了运筹学 中的规划方法、决策方法、网络分析方法,以及数学物理方法、模糊数学方 法、分维几何学方法、非线性分析方法等,而且也包括了计量经济学中的投 入产出分析方法等。更值得一提的是,在这一阶段,地理学中的数学方法的 发展与现代系统科学紧密地结合起来了。系统理论、系统分析方法、系统优 化方法、系统调控方法等被引进了地理学研究领域。系统科学原理和方法的 引入,促进了地理学向着具有更加严密的理论结构和现代化方法的方向发
  
展,从而使以发展地理学方法论为己任的现代地理学中的数学方法更加明显 地具有系统科学的性质与理论性的色彩。同时,电子计算机应用技术的发展, 特别是 GIS 技术的成熟,为数学方法在现代地理学中的应用提供了更加先进 的技术手段,从而使其应用的范围更加广阔。

第二节 现代地理学中的数学方法

——评价与应用

一、现代地理学中的数学方法的评价
  1963 年,鲍顿(I.Burton)用“计量革命”一词,对自本世纪 50 年代末 期开始的以数学方法在地理学研究中的应用为内涵的计量运动作了形容,认 为,此后将不再是革命了,因为它已经成为现代地理学研究的主流方向之一。 不过,这种认识,并未完全统一。因为现代地理学中的数学方法的引入,一 方面推动了传统地理学研究方法的变革,另一方面却产生了重数量分析,轻 区域、生态研究等问题。由此产生了一场波及整个地理学界的大辩论。以至 到了本世纪 70 年代后期,还有人提出要重新评价计量运动,重新认识地理学 中的数学方法。有人认为,数学方法只能用来研究地理要素之间的数量关系 及地理事物的分布形态,而不能揭示复杂的地理现象形成的机制。又有人认 为,地理学的定量化,其实质就是地理学的科学化、现代化。
  随着计量运动的发展,对于现代地理学中的数学方法,产生了三种观点。 第一是逆计量运动之潮流,反对地理学定量化研究,认为地理现象,尤其是 人文、社会经济地理现象十分复杂,不能用简单的数学方法来解释。持这种 观点的地理学者,对数学方法采取拒绝和否定态度。如英国地理学家史密斯
(David Smith)和奥格登(Philip Ogden),他们曾这样评价计量革命:“这
种所谓的革命,实际上是很保守的,因为它把‘空间’作为地理学研究的基 础和实质的化身,同时却忽视了一些社会、经济结构的变化,因而成了故弄 玄虚,并把现象当作本质”。有人还把计量运动说成是“数学癖的十年”。 甚至还有人大声疾呼:地理学有可能陷入“数学决定论”的危险。第二种观 点与前一种针锋相对,推崇地理学定量化,认为数学方法不仅是一种分析技 术,而且能够导出普遍性规律,能够解决地理学传统研究方法所不能解决的 理论问题。持这种观点的有德国地理学家克里斯塔勒(W.Christaller)、美 国地理学家帮吉(W.Bunge)、英国地理学家乔莱 (R.Chorley)、哈格特
(P.Haggett)等。代表性著作有帮吉的《理论地理学》(1962)、哈格特的《人
文地理学的区位分析》(1965)、乔莱和哈格特的《地理模型》(1967)等。 此外,在芬兰、日本、加拿大、新西兰、印度和前苏联等国家也出现了一批 推崇数学方法的地理学者及其代表性论著。第三种观点是介于“定量化”和 “反定量化”之间的“非定量化”的观点。这种观点认为,数学方法只是地 理学研究方法之一,它只能用来研究地理要素之间的数量关系及地理事物的 空间格局,但是不能用它来描述和解释地理规律,不能导出地理学理论。不 过,这种观点并不是固定不变的,它具有较大的摇摆性。当地理学定量化研 究取得较大进展时,它便宣扬数学方法,强调数学方法在地理学研究中的重 要性;当地理学定量化研究遇到困难,出现问题时,它便否定数学方法,贬 低数学方法。持这种观点的地理学者,中国有,外国也有。
  笔者认为,正确认识与公正合理地评价数学方法在地理学研究中的地位 与作用,不仅对于地理数学方法本身,而且对于整个地理学的健康发展都有 着十分重要的意义。
对于现代地理学中的数学方法的评价与认识,笔者提出以下几点看法。
(1)世界上的任何事物都可以用数值来度量。在地理学研究中,一切地

理要素,例如区域的规模、城市的位置、道路的长短、气温的高低、雨量的 多少、山高水深、人口增减、物产丰欠等等,均可以用数量来表示。对各种 地理要素的分布及其间的相互关系,均可以用数学方法进行定量分析与研 究。运用数学方法研究地理现象,可以作出确定性解释和精确预测与判断。 在现代地理学研究中运用数学方法,有着传统方法无法比拟的优点。
  (2)在现代地理学中,传统方法与数学方法之间并没有不可逾越的鸿 沟,传统方法是数学方法的基础,数学方法是传统方法发展的必然结果和重 要补充。传统方法与数学方法的区别在于:传统方法研究地理问题的程序为: 考察、收集资料→根据已有的概念体系条理化→归纳、概括→建立理论与法 则;而数学方法研究地理问题的程序为:观察实践→先期模式→提出假设→ 对资料进行筛选→建立模式→反复检验→建立理论和法则。传统方法所采用 的推理方式以综合归纳为主。而数学方法所采用的推理方式以理论演绎为 主,传统方法与数学方法的有机结合,是地理学研究现代化的必不可少的条 件。这两种方法在现代地理学中的作用不可相互替代
  (3)数学方法,不仅是人们进行数学运算和求解的工具,而且能以严密 的逻辑和简洁的形式描述复杂的问题,表达极为丰富的实质性思想。对于现 代地理学,数学方法不仅是应用地理学研究中的预测、决策、规划及优化设 计的工具,而且也是理论地理学研究中进行逻辑推理和理论演绎的手段。
(4)客观上讲,在地理学研究中,任何方法都有其局限性,数学方法当
然也不例外。一方面,对于某些地理问题,目前人们还不知道该用什么样的 数学方法去处理,这是外部局限性;另一方面,单纯地用数学方法去分析、 研究地理问题,究竟可以达到什么样的深度,这是内部局限性。只有正确地 认识这些局限性,并不断地寻求克服它们的途径与措施,才能使地理学中的 数学方法得到不断的发展和完善。
(5)现代地理学中的数学方法的形成和发展,离不开电子计算机,它与
电子计算机应用技术密切相关。一方面,电子计算机的产生和发展,是现代 地理学中的数学方法形成与发展的一个十分重要的条件。另一方面,现代地 理学中的数学方法的发展,又为电子计算机技术在地理学中的应用提供了更 加广阔的领域。被誉为地理学的第三代语言的现代地理学技术——地理信息 系统(GIS),就是数学方法与电子计算机应用技术在现代地理学研究领域内 相互结合、相互渗透的产物。这一技术,可以说是在现代地理学中综合运用 数学方法和电子计算机技术的一个成功的典范。
二、数学方法在现代地理学研究中的应用
(一)数学方法应用的一些方面 现代地理学,是一门研究地理环境及其与人类活动之间相互关系的综合
性、交叉性学科。它以分布、形态、类型、关系、结构、联系、过程、机制 等概念构筑其理论体系,注重的是地理事物的空间格局与地理现象的发生、 发展及变化规律,追求的目标是人地系统的优化——即人口、资源、环境与 社会经济协调发展。所采用的研究方法,是定性与定量方法相结合、综合归 纳与理论演绎方法并用、规范与实证研究方法并举。
  数学方法,不仅是现代地理学研究中的理论演绎与逻辑推理的工具,而 且也是定量分析、模拟运算、预测、决策、规划及优化设计的手段。在现代 地理学研究的各个分支领域中,它能被按照不同的要求与方式应用。其应用 的方面,主要包括:
  
  (1)分布型分析。这类研究,主要是对地理要素的分布特征及规律进行 定量分析。譬如,运用平均值、方差、标准差、变异系数、峰度、偏度等统 计量描述地理要素的分布特征;运用概率函数研究地理要素的分布规律;等 等。
  (2)相互关系分析。这类研究,主要是对地理要素、地理事物之间的相 互关系进行定量分析。譬如,运用统计相关分析方法定量地揭示地理要素之 间的相关程度;运用灰色关联分析方法揭示地理事物之间相互联系的密切程 度;运用回归分析方法给出地理要素之间相关关系的定量表达式;运用投入 产出分析方法定量分析区域经济系统中各个产业之间的相互联系;等等。
  (3)类型研究。主要是对地理事物的类型和各种地理区域进行定量划 分。譬如,运用模式识别方法、判别分析方法、聚类分析方法等定量地研究 土地类型、地带及自然区和经济区的划分问题等。
  (4)网络分析。主要是对水系、交通网络、行政区域、经济区域等的空 间结构进行定量分析。在地理网络分析中,几何学方法和图论方法是常用的 主要方法。譬如,交通网络中结点之间的接近度、可达性、最短路径,及最 大流与最小运费流,以及行政或经济区域中的城镇体系及其等级-规模等问题 的研究,均属于网络分析的范畴。
(5)趋势面分析。趋势面分析,就是运用适当的数学方法计算出一个空
间曲面,并以这个空间曲面去拟合地理要素分布的空间形态,展示其空间分 布规律。这种空间曲面就称之为趋势面。趋势面分析所采用的数学方法通常 是回归分析方法。其分析的步骤是:首先运用回归分析方法拟合出所要分析 的地理要素的趋势面方程,然后以趋势面方程计算出每一个地理测点上的该 地理要素的趋势值,并以一定的间隔画出趋势等值线图。这种趋势等值线图 就展示了所要分析的地理要素的空间分布规律。
(6)空间相互作用分析。主要是定量地分析各种“地理流”在不同区域
之间“流动”的方向与强度。譬如,运用线性规划方法研究某个大区域中各 个小区之间的货流问题;运用投入产出分析方法研究各个区域之间产品的流 动及分配与消费问题;运用一些已经建立的理论模式研究不同区域之间的人 口流动问题、商品购销问题;等等。
(7)系统仿真研究。就是针对复杂的地理问题——即对象系统,在对各
种系统要素之间的相互关系与反馈机制分析的基础上,构造系统结构,建立 描述系统的数学模型,并以适当的计算方法与算法语言将数学模型转化为计 算机可以识别与运行的工作模型,通过模型的运行,对真实系统进行模拟与 仿真,从而达到揭示系统的运行机制与规律的目的。实践证明,系统动力学 方法是地理系统仿真研究中可供借鉴的一种有效方法,它为许多复杂地理问 题的研究提供了一种可供尝试的途径。
  (8)过程模拟与预测研究。任何地理事物、地理现象,都随着时间在不 断地运动和变化着,即经历着特定的地理过程。这类研究,旨在通过对地理 过程的模拟与拟合,定量地揭示地理事物、地理现象随时间变化的规律,从 而对其未来发展趋势作出预测。在地球表层系统中,主要的地理过程包括气 候过程、水文过程、生物过程、地貌过程、生态-环境过程、经济过程、社会 过程、文化过程等。对于这些过程的模拟与预测研究,经常采用的数学方法 有回归分析法、马尔可夫方法、灰色建模方法、系统动力学方法等。
(9)空间扩散研究。这类研究,旨在定量地揭示各种地理现象,包括自

然现象、经济现象、社会现象、文化现象、技术现象在地理空间上的扩散规 律。譬如,坡面泥流运动、各种污染物在水体和大气中的扩散、各种经济现 象的集聚与扩散、文化与技术的传播等问题,都属于空间扩散研究的范畴。 这类研究,经常采用的方法有微分建模方法、数学物理方法、蒙卡罗模拟方 法等。
  (10)空间行为研究。主要是对人类活动的空间行为决策进行定量的研 究。譬如,资源利用与环境保护问题、经济活动的空间组织问题、产业布局 的区位问题、城乡区域规划问题等都属于空间行为研究的范畴。这类研究, 经常采用的数学方法有数学规划方法,如线性规划、多目标规划、多维灰色 规划方法等,以及决策分析方法,如 AHP 决策分析方法、风险型决策方法、 非确定型决策方法、模糊决策方法、灰色局势决策方法等。
  (11)地理系统优化调控研究。主要是运用系统控制论的有关原理与方 法,研究人-地相互作用的地理系统的优化调控问题,寻求人口、资源、环境 与社会经济协调发展的方法、途径与措施。这类研究,经常采用的是现代控 制论方法、大系统理论及灰色去余控制理论等。
(二)应用数学方法必须注意的一些问题 在现代地理学研究中,为了成功地运用数学方法,达到定量分析的目的,
必须注重如下几个方面的问题:
  (1)关于地理数据的筛选与质量检验问题。数学方法,在现代地理学研 究中的作用是重要的,它是建立模型和进行定量分析的基本工具与先决条 件。但是,地理数据却是定量地研究地理问题的基础,它在建模分析中的作 用有两个方面:一是确定模型中的参数与初值;二是检验模型的正确性、合 理性和有效性。没有地理数据,模型中的参数与初值将无法确定,模型的正 确性、合理性和有效性将无法检验。地理数据的质量,直接影响着由模型所 得出的研究结果的正确性。在地理问题的研究中,运用数学方法所建立的定 量分析模型,可以被形象地看作加工原料、制造产品的“机器”或“设备”, 这里的“原料”就是输入模型的原始地理数据,而“产品”便是由模型得出 的研究结果。显然,“产品”的质量不仅取决于“机器”的性能,而且还依 赖于“原料”的品质。如果输入的地理数据质量不高,则输入的结论就不会 可靠。由此可见,在地理问题研究中,地理数据的丰富性、完备性和准确性, 也是能否成功地运用数学方法的关键。所以,在运用数学方法研究地理问题 时,就必须首先注重对地理数据的筛选和质量检验工作。
(2)模型的建造问题。描述地理问题的数学模型,是对地理问题进行定
量地研究的依据。所以,描述地理问题的数学模型的建造,是对地理问题进 行定量研究的关键环节之一。英国著名地理学家威尔逊(A.Wilson),曾就如 何建造地理数学模型发表了自己的见解,这些见解可以归纳为如下几条:① 建造一个模型,首先必须明确建模的目标,即建模者必须回答所建模型将被 用来做什么?企图解决什么问题?②地理问题——即所研究的对象系统,其 构成要素是什么?这些要素之间的相互联系、相互作用及其动态变化应该由 什么形式的变量被模型所反映?其中哪些变量是以量化变量的形式出现的?
③在各类变量中,必须明确哪些变量是可控变量?即通过对哪些变量的调控 可以使系统的行为发生改变?④在模型中,如何处理时间概念?即认为被研 究的对象系统是无记忆系统还是记忆系统?是建立静态模型还是建立动态模 型?⑤所建模型将采用什么观点、解决哪些理论问题?与此问题有关的建立

模型的基本假设,以及所依据的理论,将要解决的问题等都将直接或间接地 体现在模型之中;⑥能用于建模的有关数据、资料是什么?其可靠性如何? 应采用什么样的建模技术?有现成的技术方法可供借鉴还是需要建造新模 型?采用什么方法确定模型的参数?⑦所建模型的精度,以及该模型的合理 性和有效性如何?采用什么方法和手段检验所建模型?威氏的这些见解道出 了建造地理数学模型所必须注意的各个环节,同时也为我们提供了一个一般 性的建模程序。
  (3)与 GIS 相结合的问题。地理信息系统(GIS),是本世纪 70 年代后期 发展起来的,对地理数据进行采集、输入、存储、更新、检索、管理及综合 分析与输出的计算机应用技术。它是以计算机为工具,综合利用定位观测数 据、统计调查数据、地图数据、遥感数据等,通过一系列空间操作与分析, 对地理学进行综合研究的现代化手段。数学方法,只有与 GIS 技术相结合, 才能不断地提高其应用层次与水平,不断地拓宽其应用领域,充分发挥它在 现代地理学研究中的作用。一方面,从数学方法的角度来看,对于一些复杂 地理问题的研究,采用任何单一的数学方法和单个数学模型都是很难奏效 的。解决这类问题,需要综合运用多种数学方法,建立一系列具有分析、模 拟、仿真、预测、规划、决策、调控等各种功能的众多模型组成的模型系统 才能完成。然而,这种模型系统的运行,不但需要大量地理数据构成的数据 库的支持,还需要强有力的计算方法与计算机程序的支持,而且由模型系统 运行所得到的研究结论也需要以简明扼要的形式——地图、统计图形或表格 方式被输出。显然,对于模型系统的这些支持,必须由 GIS 技术才能完成。 另一方面,从 GIS 的角度来看,它不仅需要运用数学方法为其建造空间分析 模型,如数字地形模型(DTM)、空间统计分析模型、叠加(Overlay)分析模 型、缓冲(Buffer)区分析模型等,以及其它应用分析模型,如综合评价模型、 预测模型、规划模型、决策分析模型等;而且就连 GIS 中的一些基本技术, 如空间数据的编码、数据格式的转换算法、遥感数据的几何校正、数据模型 与数据库的建造等都需要借助有关的数学方法来实现。近几年来所出现的一 种针对一些特定的领域的面向应用对象的、高层次的智能化的地理信息系统
——地理决策支持系统,就是数学方法、人工智能技术与 GIS 技术在应用地
理学研究领域中相互结合的成功典范。

第二章 统计分析方法


  地理系统,是由多种要素相复合而构成的复杂巨系统。在这个系统中, 一方面,各种要素之间存在着相互联系、相互影响和相互制约的关系;另一 方面,各种要素的复合作用又使各种地理事物和地理现象表现出强烈的地域 差异性。为了定量地揭示各种地理要素之间的相互关系,以及各种地理事物 和地理现象所表现出来的地域分异规律,就必须采用以概率论和数量统计知 识为基础的统计分析方法对地理系统进行深入的研究。本章,我们将介绍和 探讨统计相关分析、回归分析、系统聚类分析、主成分分析、马尔可夫预测 等统计分析方法在地理系统分析中的应用问题。

第一节 地理要素间的相关分析


  地理要素之间的相关分析的任务,是揭示地理要素之间相互关系的密切 程度。而地理要素之间相互关系的密切程度的测定,主要是通过对相关系数 的计算与检验来完成的。一、两要素间相关程度的测定
(一)相关系数的计算与检验
1.相关系数的计算
对于两个要素 x 与 y,如果它们的样本值分别为 xi 和 yi(i=1,2,?,
n),则它们之间的相关系数被定义为:
n
? ( xi ? x)(yi ? y)
i?1

rxy ?


n
? ( xi ? x) ·


n
? (y i ? y)

(1)

i?1

i ?1
1 n

在(1)式中,x和y分别表示两个要素样本值的平均值,即 x =

? x i ,
i ?1

n
y = ? y i ;rxy 为要素x与y之间的相关系数,它就是表示该两要素之间相
n i ?1
关程度的统计指标,其值在[-1,1]区间之内。rxy>0,表示正相关,即两
要素同向发展;rxy<0,表示负相关,即两要素异向发展。rxy 的绝对值越接
近于 1,表示两要素的关系越密切;越接近于 0,表示两要素的关系越不密切。 如果记:

n n 1 ? n

? ? n ?

L xy

? ? (xi ? x)(yi ? y) ? ? xi yi ?

? ? xi ? ?? yi ?


i?1


i?1

n ? i?1

? ? i?1 ?



n n 1 ? n ?

L xx

? ? (xi ? x)

? ? xi ?

? ? xi ?


i?1


i?1

x ? i?1 ?
2

n n 1 ? n ?

L yy

? ? (yi ? y)

? ? yi ?

? ? yi ?


i?1
则公式(1)式可以进一步简化为


i?1

n ? i ?1 ?


rxy

L xy
? (2)
L xx L yy

  例如,某地区 1981—1990 年期间的粮食总产量(x)和农业总产值(y) 数据如表 2-1 所示。试计算该地区粮食总产量与农业总产值之间的相关系数
表 2-1 某地区粮食总产量与农业产值数据
据表 2—1 计算可得:


L xy

n
? ?
i?1


xi yi ?

1 ? 10
?
10 ? i ?1

?? 10
xi ?? ?
?? i?1

?
yi ? ?
?


30.7000

10 ? 10 ?
? 2 ? ? ?


360.000

L xx ?

i?1

x ?
i 10 ?

i? 1

x i ? ?
2

10 1

? 10 ?

? 2 ? ? ?

3.0840

L yy ?

故:

yi
i?1

?
10 ?


i?1

yi ? ?

L xy

30.7000

rxy ? ? ? 0.9214

L xx L yy

360.0000 ×3.0840

即该地区粮食总产量与农业总产量之间的相关系数为 0.9214。
如果问题涉及到 x1,x2,?,xn 等 n 个要素,则对于其中任何两个要素
xi 和 xj,我们都可以按照公式(1)或(2)式计算它们之间的相关系数 rij,
这样就可得到多要素的相关系数矩阵:

? r11
?
?r21

r12 ?r1n ?
?
22 2 n ?

R ? ?
?


? ? ?? ?

(3)

? rn1

rn2 ?rnn ?

显然,由公式(1)或(2)式容易知道:
(1)rii=1(i=1,2,?,n),即每一个要素 xi 与它自己本身的相关程度
最大;
(2)rij=rji(i,j=1,2,?,n),即第 i 个要素(xi)对第 j 个要素(xj)
的相关程度,与第 j 个要素(xj)对第 i 个要素(xi)的相关程度相等。
2.相关系数的检验 当要素之间的相关系数求出之后,还需要对所求得的相关系数进行检
验。这是因为,这
表 2-2 检验相关系数ρ=0 的临界值(ra )表
p{|r|>ra}=α


α
f 0.10 0.05 0.02 0.01 0.0001 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
40
45
50
60
70
80
90 0.98769
0.90000
0.8054
0.7293
0.6694
0.6215
0.5822
0.5494
0.5214
0.4973
0.4762
0.4575
0.4409
0.4259
0.4124
0.4000
0.3887
0.3783
0.3687
0.3598
0.3233
0.2960
0.2573
0.2428
0.2306
0.2108
0.1954
0.1829
0.1726
0.1628 0.99692
0.95000
0.8783
0.8114
0.7545
0.7067
0.6664
0.6319
0.6021
0.5760
0.5529
0.5324
0.5139
0.4973
0.4821
0.4683
0.4555
0.4438
0.4329
0.4227
0.3809
0.3494
0.3044
0.2875
0.2732
0.2500
0.2319
0.2172
0.2050
0.1946 0.999507
0.9800
0.93433
0.8822
0.8329
0.7887
0.7493
0.7155
0.6851
0.6581
0.6339
0.6120
0.5923
0.5742
0.5577
0.5425
0.5285
0.5155
0.5034
0.4921
0.4451
0.4093
0.3578
0.3384
0.3218
0.2948
0.2737
0.2565
0.2422
0.2301 0.999877
0.99000
0.95873
0.91720
0.8745
0.8343
0.7977
0.7646
0.7348
0.7079
0.6835
0.6614
0.6411
0.6226
0.6055
0.5897
0.5751
0.5614
0.5487
0.5368
0.4869
0.4487
0.3932
0.3721
0.3541
0.3248
0.3017
0.2830
0.2673
0.2540 0.999998
0.999000
0.991160
0.97406
0.95047
0.92493
0.8982
0.8721
0.8471
0.8233
0.8010
0.7800
0.7603
0.7420
0.7246
0.7084
0.6932
0.6787
0.6652
0.6524
0.5794
0.5541
0.4896
0.4648
0.4433
0.4078
0.3799
0.3568
0.3375
0.3211


里的相关系数是根据要素之间的样本值计算出来的,它随着样本数的多
少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有通 过检验,才能知道它的可信度。
  一般情况下,相关系数的检验,是在给定的置信水平下,通过查相关系 数检验的临界值表来完成的。表 2-2 给出了相关系数真值ρ=0(即两要素不
相关)时样本相关系数的临界值 ra。
  在表 2-2 中,左边的 f 值称为自由度,其数值为 f=n-2,这里 n 为样本 数;上方的 a 代表不同的置信水平;表内的数值代表不同的置信水平下相关
  
系数ρ=0 的临界值,即 ra;公式 p={|r|>ra}=a 的意思是当所计算的相 关系数 r 的绝对值大于在 a 水平下的临界值 ra 时,两要素不相关(即ρ=0) 的可能性只有 a。在前例中,f=10-2=8,在不同的置信水平下的临界值 ra 可 以从表中查得:r0.1=0.5494,r0.05=0.6319,r0.02=0.7155,r0.01=0.7646, r0.001=0.8721。由于 rxy=0.9214>r0.001=0.8721,这说明该地区粮食总产量
(x)与农业总产值(y)不相关的概率只有 a=0.001,即 0.1%,换句话说,该 地区粮食总产量(x)与农业总产值(y)同向相关的概率达 0.999,即 99.9%。 一般而言,当|r|<r0.1 时,则认为两要素不相关,这时的样本相关系
数就不能反映两要素之间的关系。
(二)等级相关系数的计算与检验
1.等级相关系数的计算 等级相关系数,又称顺序相关系数,与前述相关系数一样,它也是描述
两要素之间相关程度的一种统计指标,不过在计算方法上,与前述相关系数 的计算有所不同。等级相关系数是将两要素的样本值按数值的大小顺序排列 位次,以各要素样本值的位次代替实际数据而求得的一种统计量。实际上, 它是位次分析方法的数量化。
设两个要素 x 和 y 有 n 对样本值,令 R1 代表要素 x 的序号(或位次),

R 代表要素y的序号(或位次),d2

= (R - R )2 代表要素x和y的同一

组样本位次差的平方,那么要素 x 与 y 之间的等级相关系数(r′xy)被定义
n
6? d i

为 r′ ? 1 ? i ?1

(4)

xy n(n2 ? 1)
  例如,我国 1985 年各省(市,区)的总人口(x)和社会总产值(y)及其 位次列于表 2-3。试计算总人口(x)与社会总产值(y)之间的等级相关系数。
29
由表2 - 3计算可知:n = 29 ,n(n 2 - 1) = 24360 ,? d 2 = 1134 ,故


29
6? d i ×

i?1

r′ ? 1 ? i?1? ? 1 ? 6 1134 ? 0.726

xy n(n2 ? 1)

24360

即:总人口(x)与社会总产值(y)的等级相关系数为 0.726
2.等级相关系数的检验 与相关系数一样,等级相关系数是否显著,也需要检验。表 2-4 给出了
等级相关系数检验的临界值。
  表 2-4 的内容与表 2-2 的内容相似,n 代表样本个数,a 代表不同的置信 水平,也称显著水
表 2-3 1985 年全国各省(市,区)总人口与社会总产值





i 1i 2 i




















































表 2-4 等级相关系数检验的临界值


n 显著水平 a n 显著水平 a 0.05 0.01 0.05 0.01 4
5
6
7
8
9
10
12
14 1.000
0.900
0.829
0.714
0.643
0.600
0.564
0.506
0.456
1.000
0.943
0.893
0.833
0.783
0.746
0.712
0.645 16
18
20
22
24
26
28
30 0.425
0.399
0.377
0.359
0.343
0.329
0.317
0.306 0.601
0.564
0.534
0.508
0.485
0.465
0.448
0.432


平,表中的数值为临界值 ra。在上例中,n=29,表中没有给出相应的样
本数下的临界值 ra,但我们发现,在同一显著水平下,随着样本数的增大,
临界值 ra 减少。在 n=28 时,查表可知:r0.05=0.317,r0.01=0.448,由于 r
′xy=0.726>r0.01=0.448,故 r′xy 在 a=0.01 的置信水平上是显著的。
二、多要素间相关程度的测定
(一)偏相关系数的计算与检验 地理系统是一种多要素的复杂巨系统,其中一个要素的变化必然影响到
其它各要素的变化。在多要素所构成的地理系统中,当我们研究某一个要素
对另一个要素的影响或相关程度时,把其它要素的影响视为常数(保持不 变),即暂不考虑其它要素的影响,而单独研究那两个要素之间的相互关系的 密切程度时,则称为偏相关。用以度量偏相关程度的统计量,称为偏相关系 数。
1.偏相关系数的计算
偏相关系数,可利用单相关系数来计算。假设有三个要素 x1,x2,x3,
其两两间单相关系数矩阵为

?r11
?


r12

r13 ? ?1
? ?


r12

r13 ?
?

R ? ?r21

r22

r23 ? ? ? r21

1 r23 ?

??r31

r32

r33

r31

r32 1

因为相关系数矩阵是对称的,故在实际计算时,只要计算出 r12,r13 和 r23
即可。在偏相关分析中,常称这些单相关系数为零级相关系数。对于上述三 个要素 x1,x2,x3,它们之间的偏相关系数共有三个,即 r12·3,r13·2,r23·1
(下标点后面的数字,代表在计算偏相关系数时,保持不变量,如 r12·3 即 表示 x3 保持不变),其计算公式分别如下:

r ? r r

r12 ·3

? 12 13 23
(1 ? r 2 )(r ? r 2 )

(5)



r13·2 ?

13 23
r13 ? r12 r23
2 2



(6)




r23·1 =

(1 ? r12 )(1 ? r23 )
r23 - r12 r13




(7)

2 2
(1- r12 )(1 - r13 )
式(5)—(7)表示三个偏相关系数,称为一级偏相关系数。
若有四个要素 X1,X2,X3,X4,则有六个偏相关系数,即 r12·34,r13·24,
r14·23,r23·14,r24 ·12,r34·12,它们称为二级偏相关系数,其计算公式分
别如下:

r12 ·3 ? r14· 3 r24 ·3
r ?


(8)

12 ·34

2
14·3

)(1 ? r 2 )


r13·24 ?

r13·2 ? r14 ·2 r34 ·2



(9)

2 2
(1 ? r14 ·2 )(1 ? r34· 2 )



r14 ·2 ? r13·2 r43·2
r ?


(10)

14 ·23

2
13·2

)(1 ? r 2 )


r23·14 ?

r23·1 ? r24·1T34·1


(11)

2 2

(1 ? r24·1 )(1 ? r34·1 )
r24 ·1 ? r23·1T43·1
r ?



(12)

24·13

2
23·1

)(1 ? r 2 )


r34·12 ?

r34·1 ? r32·1T42 ·1


(13)

2 2
(1 ? r32 ·1 )(1 ? r42 ·1 )


在式(8)中,r12·34 表示在 x3 和 x4 保持不变的条件,x1 和 x2 的偏相关
系数,其余式(9)—(13)依此类推。 应所考虑的要素多于四个时,则可以依次考虑,计算三级甚至更多级偏
相关系数。
假若,对于某四个地理要素 X1,X2,X3,X4 的 23 个样本数据,经过计算
得到了如下的单相关系数矩阵:

?r11

r12

r13

r14 ? ?

1 0.416 0.346 0.579 ?

?r r r r ?

?0.416 1

? 0.592 0.950?

? 21 22 23 24 ? ? ?

R ?
31 32 33 34

? ? ? ? 0.346


? 0.592 1


? 0.469 ?

?
?r41


r42


r43

?
44 ?

? 0.579 0.950

? 0.469 1 ?

  为了说明偏相关系数的计算方法,现以(14)式中的单相关系数为例,来 计算一级和二级偏相关系数。为了计算二级偏相关系数,需要先计算一级偏 相关系数,由(5)式可求得
  

r12 ·3 ?

r12 ? r13r23

0.416 ? 0.346×(?0.592)
?


? 0.821

(1 ?

r 2 )(1 ? 2

(1 ? 0.3462 )(1? 0.592 2 )

同理,依次可以计算出其它各一级偏相关系数,见表 2-5。
表 2-5 一级偏相关系数


r12 · 3 r13 · 2 r14 · 2 r14 · 3 r23 · 1 r24 · 1 r24 · 3 r34 · 1 r34 0.821 0.808 0.647 0.895 -0.863 0.956 0.945 -0.875 0.3


在一级偏相关系数求出以后,便可代入公式计算二级偏相关系数,如由
(8)式计算可得

r12 ·3 ? r14·3 r24 ·3

0.821 ? 0.895×0.945

r12 ·34 ?


(1 ?


2
14 ·3


)(1 ?


2
24 ·3

? ? 0.170
) (1 ? 0.8952 )(1 ? 0.9452 )

同理,依次可计算出其它各二级偏相关系数,见表 2-6。

表 2-6 二级偏相关系数



r12 · 34 r13 · 24 r14 · 23 r23 · 14 r24 · 13 r34 · 12 -0.170 0.802 0.635 -0.187 0.821 -0.337


容易看出,偏相关系数具有下述性质:
(1)偏相关系数分布的范围在-1 到 1 之间,譬如,固定 X3,则 X1 与 X2
间的偏相关系数满足-1≤r12·3≤1。当 r12·3 为正值时,表示在 X3 固定时,
X1 与 X2 之间为正相关;当 r12·3 为负值时,表示在 X3 固定时,X1 与 X2 之间为
负相关。
(2)偏相关系数的绝对值越大,表示其偏相关程度越大。例如,|r12·3|
=1,则表示当 X3 固定时,X1 与 X2 之间完全相关;当|r12·3|=0 时,表示当
X3 固定时,X1 与 X2 之间完全无关。
  (3)偏相关系数的绝对值必小于或最多等于由同一系列资料所求得的复 相关系数(详见后述),即 R1·23≥|r12·3|。
2.偏相关系数的显著性检验
偏相关系数的显著性检验,一般采用 t-检验法。其统计量计算公式为
r12· 34 ?m

t ?
2
12 ·34?m

n ? m ? 1

(15)

在(15)式中,r12·34?m 为偏相关系数,n 为样本数,m 为自变量个数。 譬如,对于前述计算得到的偏相关系数 r24·13=0.821,由于 n=23,m=3,


0.821
t ?
1 ? 0.8212


23 ? 3 ? 1 ? 6.268



查 t 分布表,可得出不同显著水平上的临界值 ta,若 t>t。则表示偏相关显
著;反之,t<ta ,则偏相关不显著。在自由度为 23-3-1=19 时,查表得
t0.001=3.883,所以 t>ta,这表明在置信度水平 a=0.001 上,偏相关系数 r24·13
是显著的。
(二)复相关系数的计算与检验 严格来说,以上的分析都是揭示两个要素(变量)间的相关关系,或者是
在其它要素(变量)固定的情况下来研究两要素间的相关关系的。但实际上, 一个要素的变化往往受多种要素的综合作用和影响,而单相关或偏相关分析 的方法都不能反映各要素的综合影响。要解决这一问题,就必须采用研究几 个要素同时与某一个要素之间的相关关系的复相关分析法。几个要素与某一 个要素之间的复相关程度,可用复相关系数来测定。
1.复相关系数的计算 复相关系数,可以利用单相关系数和偏相关系数求得。
设 Y 为因变量,X1,X2,?,Xk 为自变量,则将 Y 与 X1,X2,?,Xk 之
间的复相关系数记为 Ry·12?k。其计算公式如下
当有两个自变量时,


R y·12 ?


1 ? (1 ?


r 2 )(1 ?


2
y2 ·1


) (16)

当有三个自变量时,


R y·123 ?


1 ? (1 ?


r 2 )(1 ?


2
y2 ·1


)(1 ?


2
y3·12


) (17)

一般地,当有 k 个自变量时,


R y·12? k ?


1 ? (1 ?


r 2 )(1 ?


2
y2 ·1

)?[1 ?


2
yk·12 ?( k ?1)

(18)

  以(14)式所描述的四个地理要素之间的相互关系为例,若以 X4 为因变 量,X1,X2,X3 为自变量,则可以按下式计算 X4 与 X1,X2,X3 之间的复相关 系数
2 2 2

R 4 ·123 ?

?

1 ? (1 ? r41 )(1 ? r42 ·1 )(1 ? r43·12 )

1 ? (0.579 2 )(1 ? 0.956 2 )[1 ? (?0.337) 2 ] ? 0.974

关于复相关系数的性质,可以概括为如下几点:
(1)复相关系数介于 0 到 1 之间,即
0≤Ry·12?k≤1
  (1)复相关系数越大,则表明要素(变量)之间的相关程度越密切。复相 关系数为 1,表示完全相关;复相关系数为 0,表示完全无关。
(3)复相关系数必大于或至少等于单相关系数的绝对值。
2.复相关系数的显著性检验
对复相关系数的显著性检验,一般采用 F-检验法。其统计量计算公式为
2

R y·12 ?k
F ? 2
y·12?k

n ? k ?
×
k


(19)

在(19)式中,n 为样本数,k 为自变量个数。对于前述计算得出的复相关系
数 R4·123=0.974,由于 n=23,k=3,故

0.974
F ? ×
1 ? 0.974 2

23 ? 3 ? 1
3


? 120.1907

查 F-检验的临界值表(见本书附录Ⅱ),可以得出不同显著水平上的临界值
Fa,若 F>F0.01,则表示复相关在置信度水平 a=0.01 上显著,称为极显著;
若 F0.05<F≤F0.01,则表示复相关在置信度水平 a=0.05 上显著;若 F0.10≤F
≤F0.05,则表示复相关在置信度水平 a=0.10 上显著;若 F>F0.10,则表示复
相关不显著,即因变量 Y 与 K 个自变量之间的关系不密切。在上例中, F=120.190 7>F0.01=5.0103,故复相关达到了极显著水平。

第二节 地理要素间的回归分析


  地理要素间的相关分析揭示了诸地理要素之间相互关系的密切程度。然 而诸要素之间相互关系的进一步具体化,譬如某一地理要素与其它地理要素 之间的相互关系若能用一定的函数形式予以近似的表达,那么其实用意义将 会更大。在复杂地理系统中,某些要素的变化很难预测或控制,相反,另外 一些要素则容易被预测或控制。在这种复杂地理系统中,若能在某些难测难 控的要素与其它易测易控的要素之间建立一种近似的函数表达式,则就可以 比较容易地通过那些易测易控要素的变化情况去了解那些难测难控的要素的 变化情况。数理统计学为我们提供了回归分析方法,是研究要素之间具体的 数量关系的一种强有力的手段,借助于这种方法,可以建立地理要素之间的 相关关系模型——回归分析模型。
  现代地理科学研究的对象是多层次多要素的复杂系统,其要素之间的相 互关系,既有线性的,也有非线性的。因此,地理要素之间的回归分析模型, 既有线性回归模型,也有非线性回归模型。但是在回归分析研究中,许多非 线性模型都可以通过变量变换将其转化为线性模型来处理。下面我们首先来 介绍地理要素之间的线性回归模型。
一、一元线性回归模型
  一元线性回归模型描述的是两个要素(变量)之间的线性相关关系。假设 有两个地理要素(变量)x 和 y,x 为自变量,y 为因变量。则,一元线性回归 模型的基本结构形式为
ya=a+bxa+εa (1)
在(1)式中, a 和 b 为待定参数;a=1,2,?,n 为 n 组观测数据(x1,y1),
(x2,y2),?,(xn,yn)的下标;εa 为随机变量。如果记 a 和 b 分别为参
数 a 与 b 的拟合值,便得一元线性回归模型
?
(2)式代表x与y之间相关关系的拟合直线,常称为回归直线; y 是
y 的估计值,亦称回归值。
(一)参数 a、b 的最小二乘估计
? ? ?
实际观测值 y i 与回归值 y i 之差e i = y i - y i,刻画了 yi 与 yi 的偏
离程度,即表示实际观测值与回归估计值之间的误差大小。参数 a 与 b 的最
?

小二乘拟合原则要求y 与 y

的误差e 的平方和达到最小,即

i i i
n n ? 2

Q ? ? e i
i?1
n

? ? (y i ? y i )
i ?1
2

? ? (y i ? a ? bx i )
i? 1
根据取极值的必要条件,有

? min (3)

? ?Q
? ?a
? ?Q

n
? ?2? ( y
i?1
n


i ? a ? bx i


) ? 0

? ? ?2? ( y

? a ? bx )x ? 0

?? ?b



i?1

i i i

? n
?? (yi ? a ? bx i ) ? 0
? i?1
? n
? (yi ? a ? bx i )xi ? 0
?? i?1
上述方程组可以进一步写成
? ? n ? n
na ? ? x i b ? ? y i

? ?
? i ?1
?
?? ?

?
i?1
? n ? n



(4)

?? ? x i ? a ? ? ? x i ? b ? ? x i y i

? ?
? i ?1

? 2 ?
i?1


i ?1

方程组(4)式通常被称为正规方程组,它又可以被写成矩阵形式

? n ?

? n ?

? n ? xi ??a?

? ? y i ?


i ?1
n n

?? ? ? ?
2 ? ? ?


i?1
?

(4)

?? xi

? xi ? b

?? xi yi ?

? i ?1

i ?1 ?

? i ?1 ?

  解上述正规方程组(4)式或(4′)式,就可以得到关于参数 a 与 b 的拟 合值:
  




L xy

? ? ? ?
a ? y ? b x
n
? (x i ? x )(y i ? y )
i ?1


(5)

b ? ?
Lx x


n
? (x i
i ?1


? x )2

n 1 ? n

? ? n ?

? x y ?

? ? x ? ? ? y ?

i i
? i?1

n ? i?1

i ? ?

i
i ?1
2


(6)

n 1 ? n ?

? x 2 ?

?? x ?

i
i?1

n ? i?1 ?

在(5)式和(6 )式中,x和 y分别为x i 和y i (i = 1,2 ,?, n) 的平均值 ,


n
x = ? x i , y ?

n
? y i 。

n i?1

n i?1

建立一元线性回归模型的过程,就是用变量 xi 和 yi 的实际观测数据确
? ?
定参数a和b的最小二乘估计值 a 和 b 的过程。现在,我们用表2 - 1中的数据,
建立某地区农业总产值(y)与粮食总产量(x)之间的一元线性回归模型。 回归系数 a 和 b 的拟合值分别为



? L xy

10
?
i?1

1 ? 10
x y ? ?
? i? 1

? ? 10
x i ? ? ?
? ? i ?1

?
yi ?
?

b ? ?
L xx


10 10
? 2 ? ? ?

x i
i?1
1

?
10 ?


i?1

xi ?

837.1 ?

×240×33.6

? 10 ? 0.085278
1

6120 ?

? ? ? ?
a ? y ? b x
1

×(240) 2
10



1

? ×33.6 ? 0.085278× ×240 ? 1.313328
10 10
故该地区农业总产值(y)与粮食总产量(x)之间的回归方程为
?

y = 1.313328 + 0.085278x
(二)一元线性回归模型显著性检验

(7)

  回归模型建立之后,需要对模型的可信度进行检验,以鉴定模型的质量。 线性回归方程的显著性检验是借助于 F 检验来完成的。
在回归分析中,y 的 n 次观测值 y1,y2?,yn 之间的差异,可用观测
值y i 与其平均值y的离差平方和来表示,它被称为总的离差平方和,记为




可以证明

n 2
S 总 ? L yy ? ? ( yi ? y)
i?1


(8)

n
S 总 ? L yy ? ? ( yi ? y)

i?1
n ?


n ? 2

? ? (yi ? yi )

? ? (yi ? y)

i? 1
? Q ? U
n

i?1


?


(9)

(9 )式中,Q = ? (y i ? y i )

称为误差平方和,或剩余平方和,而

i ?1
N ? n

U ? ? (y i ? yi)

? ? (a ? bx i ? a ? b x)

i? 1

? b


n
? (x i ? x)

i?1

? b Lxx ? bL xy

2 2 2


称为回归平方和。


i?1

由(9)式可以看出,当 U 对 Lyy 的贡献越大时,Q 的影响就越小,回归模型的


效果就越好。这样,就可以由统计量 F ? U /

Q
n ? 2


(10)

衡量回归模型的效果,显然 F 越大,就意味着模型的效果越佳。事实上,统
计量 F—F(1,n-2)。在显著水平 a 下,若 F>Fa(1,n-2),则认为回归方程
效果在此水平下显著。一般地,当 F<F0.10(1,n-2)时,则认为方程效果不
明显。对于回归方程(7)式,我们有

10
S 总 ? L yy ? ? ( y i ? y)


? 3.0840

i?1
U=bLxy=0.085278×30.7000=2.6180346
Q=S 总-U=3.0840-2.6180346-0.4659654
所以

Q
F ? U / n ? 2 ?

2.6180346

0.4659654×


1 ? 44.948137
8

在置信水平 a=0.01 下查 F 分布表得:F0.0(1

1,8)=11.6。由于 F=44.948137

>F0.01(1,8)=11.6,所以回归方程(7)式在置信水平 a=0.01 下是显著的。
二、多元线性回归模型 在多要素的地理系统中,除了在某两个要素之间存在着相互作用和影响
而发生某种相关外,在若干个(多于两个)要素之间也存在着相关影响、相互 关联的情况。因此,多元地理回归模型更带有普遍性的意义。
(一)多元线性回归模型的建立
假设某一因变量 y 受 k 个自变量 x1,x2,?,xk 的影响,其 n 组观测值
为(ya,xa1,xa2,?,xak),a=1,2,?,n。那么,多元线性回归模型的
结构形式为:
ya=β0+β1xa1+β2xa2+?+βkxak+εa (11)
在(11)式中,β0,β1,?,βk 为待定参数,εa 为随机变量。如果 b0,
b1,?bk 分别为β0,β1,β2,?,βk 的拟合值,则得回归方程
?

y = b0 + b1x1 + b2 x 2 + ? + b k x k

(12)

在(12)式中,b0 为常数,b1,b2,?,bk 被称为偏回归系数。偏回归系
数 bi(i=1,2,?,k)的意义是,当其它自变量 xj(j≠i)都固定时,自变量 xi
每变化一个单元而使因变量 y 平均改变的数值。 根据最小二乘法原理,βi(i=0,1,2,?,k)的估计值 bi(i=0,1,2,?,k)要使
n ?
Q ? ? ( y a ? y a )

a ?1
n
? ?[y a ? ( b 0 ? b 1x a



? b 2 x a


? ? ? b k x a



)]2

1 2 k
a ?1
? min
由求极值的必要条件得

? ?Q
? ?b

n
? ?2? (y


?
a ? ya


) ? 0

? 0 a ?1
?
? ? ?


?b j

? ?2? ( ya ? y a ) xaj
a ?1

? 0( j ? 1 , 2

, ? , k)

方程组(14)式经展开整理后得

? ? n ?

? n ?

? n ? n

? ? ?

? ? ??

? ? ? ? ??

? ? ?

nb0 ?
?


a ?1

xa ? b1

x b2
? a ?1 2 ?


? a ?1

xak ? b k

ya
a?1

?? n ?

? n ? ? n ?

? n ? ? n ?

???

? ? ? ?

2 ? ? ??

? ? ? ? ? ?

? b ? ? ? x y ?


?? a?1

xa1 ? b0


? a ?1

xa 1? b1


? a ?1

xa1xa 2 ? b2


? a ?1

xa 1xa2 ? k


? a ?1


a a ?

? n ? ? n ?

? n ? n

??? xa2 ? b0 ? ?? xa1xa 2 ? b1 ? ?(xa 2 )b2 ? ? ? ?? xa1xak ? bk ? ? xa 2 ya

(15)

?? a?1 ?

? a?1

? a?1

? a?1

? a ?1

?????????????????????????????
?

?? n ? ? n

? ? n ?

? n ? n

??? xa

? b0 ? ?? xa xa

? b1 ? ? ?xa xa

? b2 ? ? ? ?? a

? bk ? ?xa ya

?? k ?
??

? a?1

k ? ? a ?1

2 k ?

? a?1 k ?

k
a ?1



方程组(15)式称为正规方程组。如果引入以下矩阵:

? 1
? ?1
X ? ?1
?

x11
x21
x 31

x12
x22
x32

? x1k ?
?
? x2 k ?
? x3k ?
?

? ???????????

?
? 1 xn1

x2 ?

?
nk ?

? 1 1 1
?

? 1 ?
?

? 1 x11
?

x12

? x1k ?
?

? x11

x21

x31

? xn1 ?

?1 x21

x22

? x 2k ?

A ? X T X ? ? x x x

? x ? ·?1 x x

? x ?

? 12 22 32

n2 ? ?

31 32 3k ?

? ????????????

? ???????????

?
? x1k
?

x2 k
n

x3k

? nk ?
n

?
?1 x n1
n

x n2 ?
?

?
nk ?

? n ? x a
? a ?1
n n
2

? xa 2
a ?1
n

? ? xa ?
a ?1 ?
n ?

? ? xa 2
a ? 1
n

? xa 1
a ?1
n

? xa1 xan 2
a ?1
n

? ? x a1 xak ?
a ?1
N

? ? ? x
? a ?1 2

? x a xa 2
a ?1


2
a 2
a ? 1

? ? xa 2 x
A ?1

?
ak ?

? ????????????????????

? n
? ? xak
a ? 1

n
? xa xak
a ?1

n
? xa 2 xak
a ?1

n ?
? x2 ?
a ? 1 ?
? b 0 ?

? y 1 ? ? ?
? ? ? b 1 ?
? y 2 ?

Y ? ? ?

b ? ? b 2 ?

? ? ?
? ? ? ??

? y n ?

? ?
? b n ?



? 1 1 1 ?
?




1 ? ? y1 ?
? ? ?

n
? ? y a ?
? a ?1 ?
? n ?

? x 11

x 21

x 31

? x n1 ? ? y 2 ?

? ? x a y a ?
a ?1

B ? XT Y ? ? x x x

? x ? ? y ? ? ? n ?

? ? ? ?
???????????

? ? x a

y a ?

12 22 32
?
?

n2
? ? ??
? ? ?

? a ? 1 ?
? ? ?

? x 1k

x 2 k

x 3k

? x nk ? ? y n ? ? n ?

? ? x ak y a ?



则正规方程组(15)式可以进一步写成矩阵形式

? ?
a ?1

     Ab=B (15′) 求解(15′)式可得
b=A-1B=(XTX)-1XTY (16) 如果引入记号

n
Lij ? L ji ? ? ( xa
a ?1
现代地理学中的数学方法的下一页
成为本站VIP会员VIP会员登录, 若未注册,请点击免费注册VIP 成为本站会员.
版权声明:本站所有电子书均来自互联网。如果您发现有任何侵犯您权益的情况,请立即和我们联系,我们会及时作相关处理。


其它广告
联系我们     广告合作     网站声明     关于我们     推荐PDF     全部分类     最近更新     宝宝博客
蓝田玉PDF文档网致力于建设中国最大的PDF格式电子书的收集和下载服务!