10.1 Linear过程 10.1.1 简单操作入门 10.1.1.1 界面详解 10.1.1.2 输出结果解释 10.1.2 复杂实例操作 10.1.2.1 分析实例 10.1.2.2 结果解释 10.2 Curve Estimation过程 10.2.1 界面详解 10.2.2 实例操作 10.3 Binary Logistic过程 10.3.1 界面详解与实例 10.3.2 结果解释 10.3.3 模型的进一步优化与简单诊断 10.3.3.1 模型的进一步优化 10.3.3.2 模型的简单诊断 在很久很久以前,地球上还是一个阴森恐怖的黑暗时代,大地上恐龙横行,我们的老祖先--类人猿惊恐的睁大了双眼,围坐在仅剩的火堆旁,担心着无边的黑暗中不知何时会出现的妖魔鬼怪,没有电视可看,没有网可上... 我是疯了,还是在说梦话?都不是,类人猿自然不会有机会和恐龙同时代,只不过是我开机准备写这一部分的时候,心里忽然想到,在10年前,国内的统计学应用上还是卡方检验横行,分层的M-H卡方简直就是超级武器,在流行病学中称王称霸,更有那些1:M的配对卡方,N:M的配对卡方,含失访数据的N:M配对卡方之类的,简直象恐龙一般,搞得我头都大了。其实恐龙我还能讲出十多种来,可上面这些东西我现在还没彻底弄明白,好在社会进步迅速,没等这些恐龙完全统制地球,Logistic模型就已经飞速进化到了现代人的阶段,各种各样的Logistic模型不断地在蚕食着恐龙爷爷们的领地,也许还象贪吃的人类一样贪婪的享用着恐龙的身体。好,这是好事,这里不能讲动物保护,现在我们就远离那些恐龙,来看看现代白领的生活方式。
2021-07-24 18:03:43 360KB 教程 教材 数据挖掘 数据分析
12.1 概论 12.2 One-Sample Kolmogorov-Smirnov Test 12.3 Two-Independent-Samples Tests   §12.1 概论 作为二十一世纪统计理论的三大发展方向之一,非参数统计是统计分析的重要组成部分。可是与之很不相称的是他针对一般性统计分析的理论发展远远不及参数检验完善,因而比较完善的可供使用的方法也不多。比如多组均数间的两两比较,虽然已有好几种方法可资利用,但由于在理论上仍存在争议,几种权威的统计软件(如SAS和SPSS)均没有提供这方面的方法。 虽然这些洋统计软件没有提供两两比较的非参数方法,但国产的统计软件大都是提供了的(国情不同嘛),因此建议大家:如果真的要做这方面的非参数分析,不如直接用PEMS、SPLMWIN、NOSA等国产软件,免得用SPSS等只能做一半。 在SPSS中,几乎所有的非参数分析方法都被放入了Nonparametric Tests菜单中,具体来讲有以下几种: • Chi-square test:用卡方检验来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%,我随便写的)。请注意该检验和我们一般所用的卡方不太一样,我们一般左的卡方要用crosstable菜单来完成,而不是这里。 • Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一刀两断。 • Runs Test:用于检验某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。 • One-Sample Kolmogorov-Smirnov Test:采用柯尔莫诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。 • Two-Independent-Samples Tests:即成组设计的两样本均数比较的非参数检验。 • Tests for Several Independent Samples:成组设计的多个样本均数比较的非参数检验,此处不提供两两比较方法。 • Two-Related-Samples Tests:配对设计两样本均数的非参数检验。 Tests for Several Related Samples:配伍设计多个样本均数的非参数检验,此处同样不提供两两比较。
2021-07-24 18:03:42 211KB 教程 教材 SPSS 数据挖掘
13.1 Life Tables过程 13.1.1 界面说明 13.1.2 结果解释 13.2 Kaplan-Meier过程 13.2.1 界面说明 13.2.2 结果解释 13.3 Cox Regression过程 13.3.1 界面说明 13.3.2 结果解释 13.4 Cox w/Time-Dep Cov过程 13.4.1 界面说明 13.4.2 结果解释 对于急性病的疗效考核,一般可以用治愈率、病死率等指标来评价,但对于肿瘤、结核及其他慢性疾病,其预后不是短期内所能明确判断的,这时可以对病人进行长期随访,统计一定期限后的生存和死亡情况以判断疗效,这就是生存分析。 生存分析是用于以处理生存时间(survival time)为反应变量、含有删失数据一类资料的统计方法。所谓生存时间,狭义地讲是从某个标准时点起至死亡止,即患者的存活时间。例如,患有某病的病人从发病到死亡或从确诊到死亡所经历的时间。广义地说,“死亡”可定义为某研究目的“结果”的发生,如宫内节育器的失落,疾病的痊愈,女孩月经初潮的到来等(生存分析中往往统指各“死亡”为失效)。此类资料的生存时间变量多不符从正态分布,且常含有删失值,故不适于用传统的数据分析方法如t检验或线性回归进行分析。根据不同的研究目的和资料类型,可采用不同的分析方法,如寿命表、Kaplan-Meier法、Cox回归模型等分析方法进行分析。而这正是下面我将要给大家介绍的主要内容。
2021-07-24 18:03:42 394KB 教程 教材 SPSS 数据挖掘
13.1 Life Tables过程 13.1.1 界面说明 13.1.2 结果解释 13.2 Kaplan-Meier过程 13.2.1 界面说明 13.2.2 结果解释 13.3 Cox Regression过程 13.3.1 界面说明 13.3.2 结果解释 13.4 Cox w/Time-Dep Cov过程 13.4.1 界面说明 13.4.2 结果解释 §13.3 Cox Regression过程 上面给大家介绍的是两种生存分析方法,但它们只能研究一至两个因素对生存时间的影响,当对生存时间的影响因素有多个时,它们就无能为力了,下面我给大家介绍Cox Regression过程,这是一种专门用于生存时间的多变量分析的统计方法。
2021-07-24 18:03:41 482KB 教程 教材 SPSS 数据挖掘
1.1 数据的输入和保存 1.1.1 SPSS的界面 1.1.2 定义变量 1.1.3 输入数据 1.1.4 保存数据 1.2 数据的预分析 1.2.1 数据的简单描述 1.2.2 绘制直方图 1.3 按题目要求进行统计分析 1.4 保存和导出分析结果 1.4.1 保存文件 1.4.2 导出分析结果 欢迎加入SPSS使用者的行列,首先祝贺你选择了权威统计软件中界面最为友好,使用最为方便的SPSS来完成自己的工作。由于该软件极为易学易用(当然还至少要有不太高的英语水平),我们准备在课程安排上做一个新的尝试,即不急于介绍它的界面,而是先从一个数据分析实例入手:当你将这个例题做完,SPSS的基本使用方法也就已经被你掌握了。从下一章开始,我们再详细介绍SPSS各个模块的精确用法。 我们教学时是以SPSS 22版为蓝本讲述的--什么?你还在用7.0版!那好,由于10.0版在数据管理的界面操作上和以前版本有较大区别,本章我们将特别照顾一下老版本,在数据管理界面操作上将按9.0及以前版本的情况讲述,但具体的统计分析功能则按10.0版本讲述。没关系,基本操作是完全一样的。好,说了这么多废话,等急了吧,就让我们开始吧! 例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例4.8)? 患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87  11例克山病患者的血磷值  13名健康人的血磷值  该地急性克山病患者与健康人的血磷值是否不同 让我们把要做的事情理理顺:首先要做的肯定是打开计算机(废话),然后进入win98或win2000(还是废话,以下省去废话2万字),在进入SPSS后,具体工作流程如下: 1. 将数据输入SPSS,并存盘以防断电。 2. 进行必要的预分析(分布图、均数标准差的描述等),以确定应采用的检验方法。 3. 按题目要求进行统计分析。 4. 保存和导出分析结果。 下面就按这几步依次讲解。
2021-07-24 18:03:39 516KB 数据挖掘 数据分析 SPSS 教材
2.1 建立与保存数据文件-File菜单 2.1.1 新建数据文件 2.1.2.1 直接打开 2.1.2.2 使用数据库查询打开 2.1.2.3 使用文本导入向导读入文本文件 2.1.2 打开其他格式的数据文件 2.1.3 保存数据文件 2.1.4 File菜单中的其他条目 2.2 编辑数据文件 2.2.1 定义新变量 2.2.1.1 直接定义新变量 2.2.1.2 从原有变量计算新变量-Transform菜单 2.2.2 数据的录入 2.2.2.1 直接录入 2.2.2.2 数据录入技巧 2.3 进一步整理数据文件-Data菜单   不言而喻,一切统计分析都是以数据为基础的,因此统计软件的数据管理能力非常重要。SPSS以其豪华的界面为依托,为用户提供的便捷的数据管理功能,下面我们就来具体看一下。
2021-07-24 18:03:38 280KB 教材 SPSS 数据挖掘 数据分析
2.1 建立与保存数据文件-File菜单 2.1.1 新建数据文件 2.1.2.1 直接打开 2.1.2.2 使用数据库查询打开 2.1.2.3 使用文本导入向导读入文本文件 2.1.2 打开其他格式的数据文件 2.1.3 保存数据文件 2.1.4 File菜单中的其他条目 2.2 编辑数据文件 2.2.1 定义新变量 2.2.1.1 直接定义新变量 2.2.1.2 从原有变量计算新变量-Transform菜单 2.2.2 数据的录入 2.2.2.1 直接录入 2.2.2.2 数据录入技巧 2.3 进一步整理数据文件-Data菜单 2.3.1 用于数据管理的菜单项 2.3.2 正交设计菜单项 2.2.1.2 从原有变量计算新变量 从头定义变量的情况多数在建立数据集时出现。但是,当数据集已经建立,需要整理、转换变量时,碰到的更多情况是需要根据某种条件从原有变量计算新变量。下面我们将按菜单条目的顺序依次讲解他们的功能。但是,首先我们需要了解一下所用的对话框界面的情况。
2021-07-24 18:03:37 353KB 文件管理 SPSS 数据挖掘 数据分析
3.0.1 程序编辑窗口界面 3.0.2 邂逅Paste按钮 3.0.3 用程序编辑窗口加快我们的工作 3.0.4 用程序编辑窗口完成对话框无法完成的工作 3.0.5 再罗嗦几句 在某年某月的某一天,你和你的另一半正在街上为地球表面的平整而贡献自己的绵薄之力。突然(也许是必然),你觉得有些饿了。这是一个问题,当然,不用说大家也知道解决问题的方法就是--吃。不过就是吃也有讲究,可以随便找个面馆简单的填饱肚子;要求高的话还可以去几星级的地方享受一下;当然还有的人觉得自己回去做口味也合适,花费也不多;更有些超级美食家,星级水准也不满意,需要亲自给一级厨师露一手,指点他们一下,才会吃的满意。 好,使用SPSS进行统计分析的方式就象上面填饱肚子的方法一样有几种选择,如果你烹饪工夫还欠火候,或者习惯了享受星级服务,那么直接使用SPSS为你提供的对话框进行操作就是了;而如果你习惯了DIY,甚或对话框也无法满足你的统计分析要求(别瞪眼,下面你就会看到了),就请你在本章学习一下如何写SPSS程序吧。 什么?SPSS还有程序?!是的,如果大家以前用过SPSS/PC+ 4.0,就一定不会对SPSS的程序感到陌生:在那个非常遥远的DOS时代(大约15年前),学习SPSS程序的语法,掌握如何编写SPSS程序是熟练使用SPSS的必要条件(但还不充分)。随着Windows旋风的登陆,软件的易操作性被推进到了前所未有的高度,而SPSS显然是统计软件中做的最成功的一个。他的操作界面是如此的成功,让使用者可以完全无须了解SPSS的语法而使用其99%的功能,使得SPSS程序被人逐渐忘记。其实,适当的使用SPSS程序可以大大提高我们的工作效率,并且SPSS在设计时也充分注意到了编程功能和使用界面的结合--还记得Paste按钮吗?下面我们就结合几个实例来学习如何使用程序编辑窗口。
2021-07-24 18:03:37 573KB 文件管理 教材 数据挖掘 数据分析
4.1 结果窗口元素介绍 4.1.1 结果浏览窗口(Viewer) 4.1.2 结果草稿浏览窗口(Draft Viewer) 4.1.3 如何美化你的输出结果--SPSS选项设置 4.2 驾驭结果浏览窗口 4.2.1 结果窗口的的一般操作 4.2.2 结果的导出 4.2.3 如何在WORD等软件中使用输出结果 4.3 文本输出结果的编辑 4.4 表格编辑方法详解 4.4.1 基本操作 4.4.2 特色菜单内容详解 4.5 图片编辑方法详解 4.5.1 基本操作 4.5.2 特色菜单内容详解 §4.1 结果窗口元素介绍 SPSS实际上提供了两个结果窗口--结果浏览窗口和结果草稿浏览窗口。前者最为常用,显示美观,但非常消耗系统资源;后者实际上是一个RTF格式文档,显示简单朴素,但节省资源。我们可以根据所用计算机的情况选择使用哪一种窗口。 结果草稿浏览窗口的内容虽然是RTF格式,但由于中、英文兼容性的问题,其中的表格读入WORD以后会变的面目全非,因此对我们不是很适用
2021-07-24 18:03:36 373KB 教材 数据挖掘 数据分析 SPSS
5.1 常用统计图 5.1.1 操作界面介绍(条图) 5.1.1.1 条图的通用界面 5.1.1.2 复式条图与分段条图的界面 5.1.2 其他常用统计图 5.1.2.1 散点图 5.1.2.2 线图 5.1.2.3 饼图 5.1.2.4 面积图 5.1.2.5 直方图 5.1.2.6 其他 5.1.3 常用统计图编辑方法详解 5.2 交互式统计图 5.3 统计地图 在常用的统计软件中,SAS绘制的统计图不太美观;而SPSS绘制的统计图较为美观,可以满足大多数情况下的要求;STATA绘制的统计图形最为精美,但由于它采用命令行方式操作,美观的图形需要添加大量选项,普通人不易掌握;而S-PLUS、MATHLAB等偏数理统计的软件虽然绘图能力也非常强,但由于自身的定位问题,并不为大多数人所熟悉。因此,在各种统计软件中,以SPSS制作的统计图应用最为广泛。 EXECL的统计绘图功能非常的强,我们还有必要学习SPSS的绘图功能吗? 这个问题我的看法是:EXCEL由于它的纯中文界面和简单而强大的绘图功能,使得可以用它来直接绘制各种简单的统计图,但是,EXCEL可以直接绘制的统计图种类有限,象误差条图、自回归图等它就无能为力,即是它支持的线图、条图等,如果过于复杂,如叠式条图、累计条图等也无法作出,而这些图在统计中是经常会碰到的,此时就只有采用统计软件来绘制,SPSS就是其中的佼佼者
2021-07-24 18:03:36 391KB 教程 教材 SPSS 数据挖掘