统计分析利器——SPSS7.0
SPSS(Statistical Package for the Social Science)——社会科学用软件包是世界上著名的统计分析软件之一。它和SAS(Statistical Analysis System,统计分析系统)、BMDP(Biomedical Programs,生物医学程序)并称为国际上最有影响的三大统计软件。SPSS名为社会学统计软件包,这是为了强调其社会科学应用的一面(因为社会科学研究中的许多现象都是随机的,要使用统计学和概率论的定理来进行研究),而实际上它在社会科学、自然科学的各个领域都能发挥巨大作用,并已经应用于经济学、生物学、教育学、心理学、医学以及体育、工业、农业、林业、商业和金融等各个领域。
1995年12月,SPSS7.0横空出世,这是一个真正面向Windows95的版本,它充分发挥了Windows95的性能。较以前的版本SPSS7.0有了许多改进:新的结果输出显示、Pivot表(类似于表模板)使你能够以不同方式查看结果,容易访问上下文菜单。它改进了在线帮助,拖拽特性,多文档界面,结果摘要和一般线性模式(GLM)程序。
它对机器内存的要求是12MB,对硬盘容量的要求与选择安装不同的模块有关,一般安装后需要占用30MB硬盘空间。需要注意的是,在装配了软件后,硬盘应至少有30MB的自由空间,否则存取速度会有较明显的下降。
以下,我们来介绍SPSS7.0的功能。
在开始\程序菜单中双击“Spss for Windows”,就进入了SPSS。SPSS有两个窗口,一个是SPSS数据编辑窗口,另一个是SPSS输出航海家窗口,与Netscape的Navigator同名。如^191501a^1、^191501b^2所示。以下分别加以介绍。
#1 一、SPSS数据编辑窗口
这个窗口与微软的Excel有些相似,一些功能也相同。实际上Excel也提供了一些基本的统计功能,但这些功能与SPSS相比,可能会让比尔·盖茨脸红。整个数据编辑窗口分为标题栏、菜单栏、工具栏、编辑栏、内容区和状态栏。SPSS程序很大,命令和功能也很多,我们主要介绍菜单栏上的10个菜单命令。
#1 1.File(文件)菜单
文件菜单提供了对数据文件进行打开、保存、调用、打印、退出等12条命令。值得一提的是:SPSS不仅能调用SPSS不同版本生成的数据文件,还能调用Excel、Lotus、Dbase、SYLK、Tab-delimited、Syntax等生成的各类文件,也可以使用ODBC的文件数据源,能够调用ASCⅡ的数据。“吃所能吃,胃口极好”。当然,也可以直接在内容区中输入数据,但要注意先定义变量。
#1 2.Edit(编辑)菜单
编辑菜单提供了剪切、复制、粘贴、删除、查找、后悔、功能7条命令。其中功能项类似于WORD中的选项命令,可以对系统的各方面设置进行调节,如果用户不理解其中的一些命令,请尽量选择系统的默认值。
#1 3.View(视图)菜单
视图菜单提供了开关状态栏、工具栏、内容区网格线等5条命令。
#1 4.Data(数据)菜单
数据菜单提供了定义变量、定义数据、模板、插入变量、插入个案、查找个案、个案排序、增加个案、增加变量等13条命令,其性质类似于数据库的编辑与管理。
#1 5.Transform(转换)菜单
转化菜单提供了个案排序、随机测定、替换缺省值等9项实用功能。
#1 6.Statistics(统计)菜单
这才是SPSS的精华所在,它提供了强大、完备的统计方法。
1Summaries基本统计分析 包括:Frequencies一维频数分布表;Descriptives求描述统计量的过程;Case Report个案报告;Report Summaries in Rows行形式输出报告;Report Summaries in Columns列形式输出报告。这一部分主要是对原始数据作整理和初步分析。
2Custom Tables定义表 包括:Basi_Tables基本表、General Tables总表、Tables of Frequencies频数表。它们以表的形式将功能反映出来。
3Compare Means比较平均数 包括:Means分组计算指定变量的描述统计量;One-Sample T Test单样本T检验;Independent-Samples T Test独立样本T检验;Paired-Samples T Test配对样本T检验;One-Way ANOVA一元方差分析。这是数据比较、求平均数、标准差、做T检验和简单方差分析等。
4General Linear Model一般线性模式 包括单因素、多因素、重复测量的GLM和MANOVA,分类非常细,也可以作协方差分析(ANCNOVA),这些统计方法是做实验经常用到的,你若想证明节食确实比运动更容易减肥,就用它来做吧。
5Correlate相关分析 Bivariate项计算两个变量间的相关系数并进行检验;Partial项计算两个变量在控制了其它变量的影响下的相关系数;Distance项对变量或观测量进行相似性或不相似性测量。相关分析实际上就是想证明人也长与树也长之间存在一定的关系。
6Regression回归分析 包括:Linear线性回归、Curve Estimation曲线回归、Logistic逻辑分析、Probit概率分析、Weight Estimation权重分析、@-Stage Least Square最小二乘法、Nonlinear非线性回归。你可以通过你的年龄、受教育程度、工作年限及能力专长来推测你在事业上可能达到的成就水平。
7Loglinear逻辑线性分析 包括:General项、Logist项和Model Selection项。
8CLASIFY聚类和判别分析 包括K-Means Cluster项执行快速聚类过程、Hierarchical Cluster执行分层聚类过程、Discriminent执行判别分析过程。“马家军”中的屡破世界记录者估计就是用聚类和判别分析所做的选材模型挑选出来的。
9此外,统计菜单中还包括:Factor因子分析、Nonparametric Test非参数检验、Time Series时间序列、Scale比例、Multiple Response多元反应项等,可谓应有尽有。
#1 7.Graphs(图形)菜单
这是SPSS成名的又一法宝,与Excel的制图功能相比,无论是功能还是在效果上都要强得多,堪称其它软件无法逾越的巅峰。用SPSS图形菜单制作图形可分为三步:建立数据文件,在数据窗口中录入数据,或是从其它数据文件中调用数据;生成图形;修饰生成的图形。只要看看SPSS能做出什么图形,你就会知道我对它的赞誉绝非夸张。
Bar选项可以生成简单条形图、分组条形图和分段条形图。
Line选项可以生成单线图、多线图和垂线图。
Area选项可以生成简单面积图和堆栈面积图。
Pie选项可以生成单圆图。
High-Low选项可以生成高-低-收盘图、极差图和距限图。
Pareto选项可以生成排列图或Pareto帕雷托图。
Control选项可以生成最常见的工序控制图。
Boxplot选项可以生成探查数据的箱线图。
Error Bar选项可以生成探查数据的误差条图。
Scatter选项可以生成简单散点图、重叠散点图、矩阵散点图和三维散点图。
Histogram选项可以生成直方图。
Normal P-P选项可以生成变量分布的分位数对正态分布的分位数的图形。
Normal Q-Q选项可以生成变量分布的分位数对正态分布的分位数的图形。
Sequence选项可以生成变量分布分位数对正态分布分位数的图形。
Time Series选项可以生成自相关图、偏相关图和互相关图。
#1 8.Utility(实用程序)菜单
实用程序菜单提供了变量信息、文件信息、定义设置、用户设置和自动增加新个案5个命令。
#1 9.Windows(窗口)菜单
窗口菜单提供了SPSS最小化、SPSS数据编辑窗口和SPSS输出窗口的切换功能。
#1 10.Help(帮助)菜单
帮助菜单提供了帮助主题、SPSS教程、SPSS语句指南、SPSS漫游、关于SPSS等5个功能。
#1 二、SPSS输出航海家窗口
SPSS输出窗口是用于展示SPSS的统计分析结果。其菜单命令与数据编辑窗口相似,只是减少了几个菜单项,而增加了一个INSERT菜单项,其中提供了插入新标题、插入新文本、插入图表、插入文本文件、插入对象等,所以需要用这些菜单命令进行调整修饰,在图形编辑窗口中,可以作图形转换,加入图形要素,展示图列和做图属性的修改(包括对图形颜色、标记符号、图线样式、标签、字体字号的选择和立体图形旋转、分离圆图等),功能超级强大。
SPSS7.0的窗口化和点取操作大大方便了我们的统计分析过程,而且它在Pentium机上计算速度极快。要注意的是有些统计程序仍然需要你编写语句。此外,切记SPSS只是提供了强大的统计分析程序,至于选取哪种统计方法处理你的数据,还得劳你费心,最好以统计学权威书刊为主,如果选错了,小则闹笑话,大则就出事故!
最后,让我始终耿耿于怀的是,我们这样一个堂堂的数学古国、数学大国,至今仍然没有编制出一个像SPSS这样的统计分析软件。