如何使用Lakens的完美t检验代码

引子:在最近心理学研究中的重复危机之下,原本分散在各个领域的研究者开始集中起来探讨方法学上的问题,比如R-index这个博客的博主Uli Schimmack,原先是研究主观幸福感的;Dan Lakens主要的兴趣点似乎是在心理距离相关的问题上;而组织起了大规模重复实验的Nosek则做内隐态度研究的。他们集中地批判NHST的问题中,并且试图整理出一些方便易用的小工具来帮助研究者更好使用原本就应该使用的统计方法,比如效应量及其置信区间。

在这个背景之下,Lakens同学写了一段R代码,把t检验非常完整地整合起来。在这个代码中,包括了剔除极端值、正态检验、方差齐性检验、三种t检验的取向(Frequentis, Bayesian, & Robust),以及相应的图(QQplot,直方图,带有置信区间的结果图)。这段代码可能是目前比较方便而全面地进行t检验的小工具,而且其输出是word文档,可以直接放到实验的结果部分去。

这么好的代码,你该如何使用呢?
首先你需要有一个下载R软件以及R-studio(可以自行搜索下载安装);
其次你需要先去下载Lakens的代码及相关文件:https://github.com/Lakens/perfect-t-test。
下载完成之后应该是perfect-t-test-master.zip的压缩包,里面包括了7个文件:两个demo数据(.txt),两个R的markdown文件(.Rmd)、两个PDF文件和一个README文件。

其中,两个Rmd文件分别对应的是独立样本t检验和配对样本t检验。

在R-studio中打开任何一个Rmd文件之后,可以从开始的几行代码中看到一些需要做的准备工作,即安装一些相应的R工具包。基本上只需要按照这段代码前的说明进行操作就行。但是有两个外部的工具需要自己安装:Rtools和JAGS。其中JAGS安装3.0的版本,不要贪图最新的4.0版,这个无法使用。分别下载安装了Rtools和JAGS之后,就可以把Rmd文件中的前几行安装工具包的代码前的#去掉、运行,大约需要一小段时间来安装各种工具包。

安装好了之后,可以直接使用R-studio里面的“Knit Word”来运行这个Rmd文件,试试效果。

点击了knit Word之后,R就开始执行这Rmd文件。如果工具包安装全了的话,最后会出现一个word文档,内包含了前面提到的各种检验。

就我们最常用的Frequentist统计来说,它报告了目前APA第六版中要求的一些统计量:每种条件下的均值、标准差以及两种条件下的相关系数、带原始单位的差异量的均值和标准差、t检验结果、效应及其95%的置信区间(Cohen’s dz、Hedges’ g)。

如果需要对自己的数据进行分析,也并不难,只需在 “Define variables names below” 下面,将变量名进行重新定义即可。主要包括读取自己的数据、定义两种实验条件下的名字。

按照这个Rmd文件给的demo数据,数据的组织也非常直观:

第一列:被试编号;

第二列:条件1下的数据;

第三列:条件2下的数据;

其他列可以忽略,因为在处理的过程中都会被代码忽略掉的。

 

把自己的数据组织好了之后,保存为tab delimited的文本格式(.txt/.dat),如果你喜欢使用csv文件,只需要把读取数据的行代码使用read.csv()替代即可。

定义完变量之后,再按”Knit Word”,输出的就是对你自己数据的t检验了。可以根据自己的需要,取用里面的结果。