SpssClient是用python实现spss操作的必定要引入的一个模块,我们今天就来看一下该模块下有哪些子模块,然后简单说一下我们按照什么顺序来写这一系列教程,重点讲什么,看看你自己是否需要看这篇教程。
声明一下,我这里写的教程并不是严格按照难易等级或者学习者应有的顺序来安排的,当然我会尽量依照这种顺序,但是我是做数据分析工作的,我会将工作中用到的一些方法写在这里,作为后来者的经验,这样读者看起来就很乱了,等以后有时间我会对教程进行整理,但不是现在。先来看看SpssClient模块下有哪些类我们可以在python中使用。主要的大类有五个:DataDocList,SyntaxDocsList,OutputDocsList,SpssServerConfList,SpssScriptContext,我们下面分别介绍这五个类别
DataDocList,就是spss的数据文件列表。用它来读取、修改、操作数据,数据文件的后缀名是sav
SyntaxDocsList,就是spss的syntax文件列表,里面都是syntax代码,或者可能掺杂有python代码,它用于读取、修改、操作syntax代码,syntax文件的后缀名是sps
OutputDocsList,就是spss的统计结果输出文件列表,里面存放着spss的统计结果,我们可以在python中使用该类来修改、操作结果数据,结果输出文件的后缀名比较熟悉,就是spv
SpssServerConfList,该类用于spssserver,由于在我的工作中并没有用到过spss服务器,所以我的教程里不包括spssserver的相关内容
SpssScriptContext,该类用于返回脚本文件的环境,现在还不涉及,以后用可能用到,但不是现在。
重点部分
教程的重点是对spss的结果输出文档的操作、数据文件的操作。所以DataDocList,OutputDocsList就会成为以后介绍的重点。这两个类非常重要,对结果输出文档进行操作可以编写一些脚本,帮助我们自动整理spss的结果,节省大量时间。对data文件的操作可以实现一些spss不具有的功能,比如数据中心化。