原标题:空间数据、权重矩阵、空间统计、空间模型等简介

资料来源:计量服务中心编辑,请联系

1

序言

空间分析源于地理学、空间经济学和相关学科。迄今为止,它被认为是一个专业领域,因此不是大多数统计软件的标准部分。

就stata而言,许多用户编写的工具可以从ssc服务器或其他来源下载。例如

shp2dta

Sppack,使用ssc下载,包括spmat、spreg和spivreg

使用searchspatwmat下载spantmat

使用搜索……...下载spatgsa、spatlsa和spatcorr。

使用搜索…下载spatdiag和spatreg

请注意,这里没有描述其他一些包。

2

空间数据

空间数据有什么特别之处?空间数据可以有许多含义,但是它们都有一个共同点,那就是它们都是关于实体的,可以通过它们在空间中的位置来描述。大多数社会学家考虑区域数据,即关于区域、社区和地区的数据。但事实上,空间数据也可能是关于单个点的(事件或对象的位置——点当然是抽象的)。对于此类数据文件,ArcGiS软件有一个全球事实标准。

该软件提供了一个所谓的形状文件,可以通过shp2dta过程读入斯塔塔·。另一种格式是MapInfo交换格式,并且有一个mif2dta进程来帮助您处理这些数据。

在下面的文章中,我将描述shapefile更常见的情况。

开始之前,请注意shapefile实际上由多个文件组成,通常具有相同的名称,但扩展名不同。需要三个文件:我的数据。其中mydata.shp包含坐标。带索引的Dbf描述对象和mydata.dbf对象。此外,我的数据。prj代表所使用的投影(或空间参考)系统。

为什么我们需要这么多的文件可以用面积数据来解释:一个区域,比如一个区域,可以用它的边界来描述,几何上,这些边界形成一个多边形。多边形可以是简单的,如矩形,也可以是复杂的。与美国的一些州(如科罗拉多州或怀俄明州)相比,它们的边界形成一个简单的直角,而其他州(如西弗吉尼亚)的边界形成一个非常不规则的实体。因此,需要不同数量的空间坐标来描述这种异质多边形。

3

展开全文

空间数据读取

所需的命令有:

shp2dta使用形状名称文件、数据库(db-new-name)坐标(co-new-name) genid(id-var)

该命令读取一个名为形状文件名称的形状文件,并将它的内容写入两个Stata文件(扩展名。dta),我将在这里命名为(数据库新名称)和(共同新名称)。显然,前者包含对象的描述(主要是在不同位置测量的变量),而后者包含坐标。Id-var是要创建的Id变量的名称。请注意,两个Stata文件都将保存到当前工作目录中的磁盘上。这些新文件可以像任何其他Stata文件一样进行处理;您可以重命名变量、删除变量或用例、转换变量或将其与其他文件合并。当然,除非你确定你能做什么和应该做什么,否则你会对这些活动小心谨慎。带有坐标的文件通常最好保持原样!

4

空间权重矩阵

斯帕茨马特·

Spatwmat是Maurizio Pisati编写的一个程序,用于创建Stata矩阵。它以两种方式创建邻接矩阵(或空间权重):它可以读取包含权重的外部文件,或者它可以从当前数据集中指定纬度和经度的变量(列)创建权重。

通常,后一种信息来自数据库文件,因为该文件的每种情况都包含一行。请注意纬度和经度将指示该地区的中心;因此,在这种情况下,只能计算基于距离的权重(但不能计算基于邻居的权重)。

1,语法格式:

spatmat使用“myweights.dta”,名称(矩阵名称)特征值(矩阵名称)代表

Dta。并将它存储为标准化矩阵,即矩阵名称中的行标准化矩阵;此外,特征值向量存储在名称-e矩阵中。

2、从纬度和经度创建权重矩阵

spatwmat,stand name(矩阵名称)xcoord(lat)y cord(long)band(0 10)

这将根据存储在变量中的坐标创建(标准化的)矩阵名称。选项范围(0-10)表示对象将仅被视为指定范围内的邻居。

请注意,如帮助文件中所述,“x和y坐标必须以投影单位表示,如米、公里、英里或任何数字单位”。

5

空间权重矩阵

Spmat

Spmat创建矩阵

Spmat允许创建基于邻近和距离的矩阵。据我所知,它们是特殊的物体,不能交互观看。但是,它们可以保存或导出到磁盘

使用mycoord,id(id-var)范数(行)的矩阵邻接名称

它使用坐标文件mycoord创建行规范化的邻居矩阵名称。还有另外两种命名方法。

sp mat id instance-of-matrix LON LAT,id(id) norm(row)

它使用带有变量LON(经度)和纬度(纬度)的当前工作文件来创建矩阵的逆距离矩阵名称。

6

空间数据可视化:[地图/s2/]

地图为可视化空间数据提供了丰富的可能性。目前,本节仅讨论简单的等高线图

使用我的坐标、id(id-var)和颜色(蓝色)映射一些变量

这将绘制变量somevariable的choropleth映射(它是数据库文件的一列;该文件是当前工作文件)使用坐标文件my-coord (id变量id-var)。几种蓝色用来表示变量的不同程度。不出所料,有许多选项可以根据您的意愿调整地图。

7

空间自相关统计

有全球和地方统计数据。最常见的是莫兰的《我》(全球版和本地版),但也可以计算其他统计数据。

订单是:

spatgsa y,权重(w矩阵)moran

将计算Y的全球莫兰指数。该变量是(空间)数据库文件的一部分(该文件应该是您当前的工作文件或主文件),并计算使用spatwmat创建的权重矩阵w-矩阵

如果调查变量中有任何缺失值,将不会计算统计数据(没有给出原因!)

spalsa y,权重(w矩阵)moran id(id-var)

将计算y的局部莫兰指数。该变量是(空间)数据库文件的一部分(该文件应该是您当前的工作文件或主文件),并计算使用spatwmat创建的权重矩阵w矩阵。变量id-var是观察的唯一特征,用于识别输出中的观察值。选项moran将输出限制在Moran的。我看到了其他统计信息的帮助函数(或者省略此选项,在这种情况下,您将获得几个统计信息)。请注意,如果变量中缺少值,将不会计算统计数据。

8

[空间建模/S2/]

空间计量经济模型

这个内容主要是关于两种类型的模型:一种是由Maurizio Pisati的spatreg提供的,另一种是由大卫·德鲁克(David Drukker)和他与spreg的合作者提供的。接下来,我们将从比萨提提供的空间诊断开始。

9

空间诊断学

空间诊断主要用于检查OLS回归分析的数据是否存在空间相关性。换句话说,假设你只估计一个线性回归模型。订单是:

spatdiag,重量(my-wmatrix)

统计数据将被用来调查残差之间的空间相关性,并帮助您判断空间滞后或空间误差模型是否更合适。

10

斯佩雷格·

spatreg过程需要空间权重矩阵加上与该矩阵相关的特征值向量;如果你的数据允许,两者都可以通过比萨尼的空间计算。Spatreg可以估计空间滞后和空间误差模型。基本命令是:

spatreg depvar indepvars,权重(w矩阵)特征值(e向量)模型(滞后)

spatreg depvar indepvars,权重(w矩阵)特征值(e向量)模型(误差)

11

Spreg

spreg程序使用空间自回归扰动来估计空间自回归模型,并提供了两种估计方法。它需要spmat创建两个矩阵,一个用于空间自回归项,另一个用于空间误差项。这两个矩阵可以(通常也将)相同,但两个矩阵必须同时表示。

对于最大似然估计

spreg ml depvar indepvars,id(id-var) dlmat(w矩阵)elmat(w矩阵)

广义空间中的两阶段最小二乘估计

spreg gs2sls depvar indepvars,id(id-var) dlmat(w矩阵)elmat(w矩阵)

其间

标识变量是由spmat创建的标识变量。dlmat和elmat提供的矩阵分别代表空间自回归项和误差项的权重。

计量经济学服务中心(Econometrics Service Center),一个专注于计量经济学的专业计量经济学服务平台。该中心专注于计量经济学、Eviews、Stata、SPSS、Matlab、Geoda、Python、ArcGIS、R等相关方法和软件操作,旨在分享管理、人文和社会科学领域的相关知识,希望能帮助大家更好地学习计量。请在后台留言以便重印。

软件操作:EODAATLAB | |简介|Stata 16

返回搜狐查看更多信息

负责任的编辑:

发表评论:

导航

站点地图广东e彩票 2m彩票是不是黑 626彩票 绝算彩票 乐大彩票 运盛彩票 rjdd.netfuyoudl.comchunshanyuan.com0598xy.comdlywxx.comwoaimeizi.comnimaboke.comlw-sh.commailhub.41aocaipiao.cnte.caizhucehera.cn12.79docaipiao.cnantivirus.32dwcaipiao.cnsx.caisocrates.cn