入门介绍
抛开复杂的统计分析学原理,将 IBM SPSS Statistics 作为一个统计分析工具,结合实际工作中的实例,一步一步从而成为这个工具的应用专家。了解与熟悉这个工具最为基本的功能,做好准备,开始学习吧!
引言
1. SPSS 的历史
2. IBM SPSS Statistics 特点
简便的操作
便捷的区域语言切换
丰富的统计算法
多样的结果展示
全面的数据接口
强大的扩展能力
有效的帮助系统
3. IBM SPSS Statistics 的未来
迄今 IBM SPSS Statistics 软件已有 40 余年的成长历史,世界上许多有影响的报刊、
杂志都对 IBM SPSS Statistics 进行了深入的报道和高度的评价。全球约有 25 万家产品用户,
分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业, 对于该软件的特长都给予了充分肯定,如使用方法简单方便、能够自动统计绘图、统计算法丰富,
数据分析深入等。在国际学术界有条不成文的规定,即在国际学术交流中, 凡是用 IBM SPSS Statistics
软件完成的计算和统计分析,可以不必说明算法, 由此可见该软件影响之大和信誉之高,其已成为世界上应用最广泛、最权威的专业统计软件。
SPSS 的历史
IBM SPSS Statistics 软件原名 SPSS(Statistical
Package for the Social Sciences), 是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生于
20 世纪 60 年代末开发成功, 同时成立了 SPSS 公司,1975 年 SPSS 总部在芝加哥组建。1984
年,SPSS 公司首先推出了世界上 第一个统计分析软件微机版本 SPSS/PC+,开创了 SPSS 微机系列产品的开发方向,极大地扩充了它的应用范围。
图 1 SPSS 的历史
到 2000 年,随着 SPSS 公司对产品服务领域的扩大和服务深度的增加,于是将整个产品线都进行了调整和重新定义,SPSS
全称变更为“统计产品与服务解决方案”(Statistical Product and Service Solutions),这也使得
SPSS 这个名称所代表的含义从单一工具软件变成一个由系列产品组成的软件集合,其中包括:Data Collection,Modeler、Statistics、CDS。这些产品也正好对应了统计分析工作的几个领域:统计设计,数据收集,数据整理,统计分析,信息反馈,从而构成了一套完整的统计分析工具集合。
2009 年 7 月 28 日,IBM 以 12 亿美元现金收购了 SPSS
公司之后,将该软件集合整合到信息管理(Information Management)软件产品中,使得 SPSS
获得了一个更为广阔的应用平台。
IBM SPSS Statistics 特点
对比其他统计分析软件,如 SAS,Statistics 软件具有很多鲜明的特点,如操作简便、多区域语言支持、功能强大、结果输出多样化、扩展性强等。
简便的操作
Statistics 的操作界面非常友好,操作也很简单,大部分操作可以通过鼠标拖拽、点击“菜单”、“按钮”和“对话框”完成,使得初学者易于上手。
图 2 数据编辑器
表格化的数据编辑器符合统计数据的结构要求。“数据视图”中可以直接编辑数据,“变量视图”中可以定义每一列数据的属性。
图 3 图表构建程序对话框
图表构建对话框非常直观、明了,用户很容易理解各种图表的使用场景和目的,简单的拖拽就可以创建符合需要的图表。Statistics
对于用户拖拽的变量会结合所选择图表进行简单的分析,如果不适合对应的图表,则“确定”按钮为不可用状态,用户无法创建该图表。例如用户想创建一个时间曲线图,但是没有选择属性为日期的变量,则无法创建这个曲线图。
便捷的区域语言切换
Statistics 目前已经支持 20 多种语言的即时切换,切换后不仅用户界面和显示结果会显示为对应的语言文字,包括帮助文件也会显示为对应的语言版本。
区域语言设置步骤非常简单:
步骤 1:在编辑(Edit)菜单中选择选项(Options)子菜单;
步骤 2:在选项卡中选择常规(General)页,并分别设置输出(Output)和用户界面(User
Interface)区域中设置语言(Language)为简体中文(Simplified Chinese)。
图 4 区域语言设定
表格化的数据编辑器符合统计数据的结构要求。“数据视图”中可以直接编辑数据,“变量视图”中可以定义每一列数据的属性。
丰富的统计算法
统计分析的核心就是统计算法。Statistics 提供了大量的统计算法,从简单的统计描述到复杂的多因素统计分析方法,满足各种统计工作的需要,当然随着统计分析学科的进步,一些新的统计算法也在不断的完善与实现,并添加到
Statistics 中。
表 1 Statistics 中提供统计算法
多样的结果展示
纯数学的统计结果是很难于理解和应用,在 Statistics 中提供了多样化的结果展示,如简单的文本描述。使用二维表、多维表来对比统计分析结果。使用高分别率、色彩丰富的饼图、条形图、直方图、散点图、三维图等图形来显示各种统计比例、趋势等。在新的版本中还将一些统计算法与地图信息进行结合,使得其统计结果更加的清晰、明了,便于理解,例如各种行业的营销在地域层面上的分析应用。
另外,为了更好的将这些结果能够展示给其他用户,大部分的展示结果,如表格、图形等,都可以直接复制到
Office 等办公软件中,非常简单、便捷。
图 5 结果查看窗口
全面的数据接口
全面的数据接口,如各种格式的文件支持,多种数据导入导出的方式。这使得 Statistics
可以应用在非常广泛的环境中,用户不需要进行更多的投入,就可以简单的配合其他工具完成相应的统计工作。
支持多种文件格式
兼容早前 Statistics 文件版本格式,用户不用担心以前的版本的数据无法使用。
兼容办公系统软件的文件格式,在 Statistics 中可以非常简单的打开
Excel,Lotus 等格式文件、用户可以利用这些办公软件的特点,快速收集、整理需要统计的数据,然后通过
Statistics 进行统计分析,而不需要在 Statistics 中再次手工逐条录入数据,极大的提高了工作效率。
兼容同类软件文件格式,如 SAS 软件保存的文件。使得用户可以在较为便利的与其他统计软件进行交互。
数据访问
Statistics 可以通过 ODBC 的配置直接访问数据库来获取需要统计的数据,这一点非常有效的解决了信息孤岛问题,使得用户现有的信息管理系统可以非常容易的与
Statistics 进行集成,现有的信息管理系统将继续承担原始数据的收集工作,Statistics 则直接对这些原始数据进行统计分析,而不需要进行任何数据迁移和转换的工作。
强大的扩展能力
语法编程(Syntax)
Statistics 提供了一套完整的语法命令集合,通过这些语法命令代码才能运行统计模块和执行数据转换功能。用户在
Statistics 画面上进行的数据准备以及统计活动都是由 Statistics 自动转换为特定的语法命令,并提交给后台完成的。这些自动解析的语法命令可以在结果查看窗口中看到,用户也可以将这些语法保存为单独语法文件,将这些语法文件直接在语法编辑器中运行即可以得到相应的结果。因此,用户在熟练掌握这些语法命令后就可以自己来进行语法编程,从而可以针对实际的数据完成一些较为复杂的操作,并节省大量重复工作的时间。
例如,用户可以将读取指定文件,将文件中的数据进行格式化,进行指定的统计分析运算,然后生成特定的报告等一系列动作保存为一个语法文件,以后只要打开这个文件并运行就可以得到结果,而不需要在用户画面上逐步的进行上述的操作。
图 6 语法编辑器
具体命令以及含义可以参考帮助系统中的“指令语法参考”。
脚本编程(Script)
脚本文件可以让用户调入 Statistics 的输出结果和运行一系列的自动化任务,如所执行的菜单和对话框的图形界面。脚本文件中也可以编写语法命令,在程序的后台直接运行统计预算和数据转换工作。
图 7 脚本编辑器
其他语言编程(Plug-In)
目前,Statistics 支持三种编程语言或程序的扩展编程能力,包括
Python、Microsoft.NET 和 R。安装对应的扩展包后,用户可以开发自己的应用程序直接与
Statistics 进行交互,这样就可以把用户的一些复杂的操作进行封装,使其简单化、透明化,并且易于在多地部署
例如,用户所在公司的各级经理需要了解一些销售统计信息,而这些经理分布在不同的工作地点,要对他们进行统一的培训来掌握如何应用
Statistics 进行相应的统计是有一定难度的,因此用户开发了一个 .NET 应用程序,这个应用程序从现有数据库中选取特定的数据,然后通过
.NET Plug-In 接口函数调用 Statistics 接口,并提交对应的语法命令来完成这个统计工作,最后获取返回的结果展示给用户。随后只需要将这个应用程序可以发布给这些经理,他们只需要运行这个应用程序就可以得到完成相应的工作,并得到需要的结果,因此极大的简化了复杂操作,提高了工作效率。
具体如何开发扩展编程以及部署结果,用户可以参考相应扩展包中的说明文档。
有效的帮助系统
Statistics 提供了非常实用的帮助文档,从多种视角来帮助用户学习和理解
Statistics 的使用,熟练掌握这些帮助文档将极大的提高学习和工作效率。如前面所述,Statistics
的大部分帮助文档是多语言版本的,根据当前的区域语言设定显示对应语言版本的帮助内容。
图 8 帮助菜单一览
如果用户希望系统的学习 Statistics 软件,可以从各窗口界面的帮助菜单打开帮助系统进行学习。
主题帮助(Topics)
主题帮助实际就是帮助内容的全部合集,当用户遇到问题的时候,可以通过关键字快速找到对应的帮助内容。
在多数用户交互界面上都有一个帮助按钮,如果用户对这个功能有疑问,可以点击这个“帮助”按钮,帮助系统就会使用已经定义好的关键字会快速查找到该功能的帮助内容,节省了用户的查找时间。如点击“打开文件“对话框上的帮助按钮后,系统自动打开的帮助内容如图
9 所示。
图 9 “帮助”按钮主题示例
教程帮助(Tutorial)
主题帮助更多提供的是一种问答方式的帮助,有什么具体的问题,查询该问题的答案。但是对于一些功能的使用,这种方式不够连贯和具体,用户不能得到系统的参考,因此
Statistics 提供了教程帮助。教程帮助使用众多基本功能的分步图解,逐步进行说明,从而帮助用户进行系统的学习,当然用户可以跳过已经熟悉的主题而不必通读整个教程来加快学习进度。
个案研究帮助(Case Studies)
个案研究以一些具体实例讲解了如何创建各种类型的统计分析以及如何解释最后得到的统计分析结果。这些实例有从功能角度来讲解的,如缺失值(Missing
Value)功能的应用;有从应用领域来讲解的,如直销分析(Direct Marketing)。用户参照这些实例就能快速的掌握这些功能并进行应用。唯一稍有遗憾的是,个案研究帮助部分只有英文版本,没有其他语言版本的。
统计辅导(Statistics Coach)
Statistics 帮助系统同时考虑到在实际学习和使用过程中,会涉及到大量的统计知识,因此又提供了一些常用统计知识的说明,通过类似于向导的方法,指导使用者如何选择所需的统计、报告和绘图的功能以及具体的操作步骤。
IBM SPSS Statistics 的未来
2011 年 3 月 23 日,IBM 全球企业咨询服务部公布了其最新的《新智能企业全球高管调研与研究项目白皮书》,其中明确强调了未来企业的分析能力就是竞争力,在全球化、互联网、风险加剧以及信息爆炸等状况下,依赖于直觉和经验制定业务决策的传统方式将面临着严峻挑战,更具预测性的信息战略才能让企业制定更明智的决策。IBM
SPSS Statistics 作为业务分析与优化领域的核心预测分析软件,将会更加密切的与其他软件产品进行集成,逐步展现其强大的统计分析及预测能力,从而为更多更广的用户提供优质服务。
|