HDDM的安装与使用

HDDM(Hierarchical Drift Diffusion Model),是一个用来估计drift diffusion model参数的python工具包,具体的介绍见官网:http://ski.clps.brown.edu/hddm_docs/。
当然,这个网站上也写了如何安装,但对于不太了解python的人来说,可能会有点周折。以下是我在window上安装的过程。

1 下载和安装Anaconda,这个软件是集合了python以及一些其他工具包的软件,Anaconda与python的关系,有点像Rstudio与R的关系。安装好Anaconda之后,会有不少可以打开的窗口,包括spyder, iPython, anaconda prompt, Jupter Notebook等,个个都可以打开,可以输入命令。但是主要用两个就可以anaconda prompt(这个是shell)和spyder(这个是集合了代码与iPython)。与R不同的是,R安装工具包与输入命令是一个地方,python却是要分开。

2 找到shell (开始–> 程序–> Anaconda –> anaconda command prompt) ,输入
conda install -c pymc hddm

当然,你有可能会失败,如果你把Anaconda安装在系统盘的话,win7以上的系统都会要求你有管理员的权限才能安装,所以你必须使用管理员模式运行Anaconda command prompt才行。

还有一点需要说明的是,python 有一个2.7的版本和3.5的版本,两个的区别不大,但是有些小细节上有明显差别,比如使用function是否要加括号。2.7里是不用加括号的,一般开始的第一行代码总是

print “Hello, World”

但是在3.4版本里,要让python输出 Hello, world, 你就得输入

print (“Hello, world”)

看别人代码的时候碰到错误时,可以先检查是不是由于版本的差异带来的错误。
OK,安装起来很简单,接下来就可以按照教程来跑一跑他们的教学数据了。

#心理学的可重复危机 (replication crisis) # 是如何形成的

2016.04.09修订:更正了OSF最初形成的时间。此外,关于心理学可重复的问题,有一个网站非常好以时间线的方式展现了一些重要的事件,有兴趣可以围观:Replication in Psychology: A Historical Perspective

记得前一段时间,物理学的引力波刷爆朋友圈和微博的时候,一位师兄如此感叹:

0

对的,上个大新闻就是心理学的研究,遇到了重复危机;没想到的是,下一个大新闻,就是另一些心理学家在science发表文章说,心理学的研究没有重复危机。不管到底有没有重复危机,反正英文的可重复危机(replication crisis)已经成为了wiki peida的词条

当然,即使facebook和twitter上关于可重复危机的讨论在心理学家之间已经吵翻了天,在国内也很见到讨论。作为一个万年酱油党,对这个领域的“热点”还是一直在关注。大约四五年前,也曾与人争论,心理学的研究到底是否可靠,也曾以问答的形式,介绍了当时刚刚“兴起”的可重复危机。几年之后,再来看这个问题,发现这个问题不仅没有解决,反而引起了一波又一波更大的争议和骚动。在心理学家之间,甚至引起了人身的攻击(言语上的)。这是我作为一个想要进入心理学学术界的年轻人所没有想到的。

即然有问题,或者说很大一部分人觉得有问题,那么,这个问题到底是什么,如何解决这个问题,就成为了这个领域的必须去面对的。诚然,如许多人所提到的,可重复危机不是心理学一个领域的问题,许多其他领域也存在。但是,记得某位心理学家(忘记了出处和原话):心理学是我们(心理学家)所唯一拥有的。所以,知道其他领域同样存在可重复的问题,并不能是我们忽视这个问题的原因。

可重复性问题到底是从何时开始的?作为一个喜欢追踪文献的博士狗,“有幸”在这个危机开始的时候,围观了一系列在science和nature上被报道而引起广泛关注的事件,在这里把个人所了解的相关事件作一个回顾。

事件1:Bem (2011)的预见未来的实验。在这个标题为“Feeling the future”的文章中,已经是知名社会心理学教授的Bem在人格与社会心理学的顶级期刊Journal of Personality and Social Psychology上指出:通过9个实验,包括了1000多名被试,他发现了未来发生的事件,可能会影响到被试当前行为反应。在这个颇具有预见性的讨论中,他讨论了统计方法、可重复性和这种预见未来现象的问题。当然,心理学界的人很快提出了质疑,两个研究小组采用贝叶斯统计对他的数据进行了分析,表明无法从数据中得到这个推断。更加晚一些重复实验也没有发现Bem的这个结果。此时,人们还无法预知,这个事件将成为心理学可重复危机的一部分。science此时也只是用相当平淡的口吻给了一个评论:ESP paper rekindles discussion about statistics

事件2:到2011年年末,另一重磅事件,彻底让人们开始反思心理学中方法的严谨性了。这就是Stapel的论文造假事件。Stapel本人是荷兰Tilburg University社会心理学的教授,刻板印象方面的专家。2011年4月8号,也就是五年前的今天,他在science上发表一篇题为 “Coping with Chaos: How Disordered Contexts Promote Stereotyping and Discrimination”的论文。这对于当时的我来说,实在是太有趣了:凌乱的环境居然会加重人们的刻板印象,太神奇了!对于这种有趣的研究,我很快在心理学与脑科学的论坛52brain.com上进行了传播。但是到了2011年11月01日,Nature报道,Stapel的这篇论文涉嫌造假,标题是“Report finds massive fraud at Dutch universities”,而Science也撤回了此论文(2011.12.02)。此后,nature 和science都对这个事件进行了持续的关注。Stapel之所以能够被发现是数据造假,是因为他的研究生举报(想想如果没有研究生举报,他会继续作假到什么时候?)。而Tilburg于2012年12月的调查报告显示,在他职业生涯中发表的137篇论文中,有55篇数据完全是捏造的。此外,还包括他指导的10个博士生博士毕业论文中的数据。在另外10篇论文中,当时还无法断定是否有造假行为。Science在报道这个最终报告的时,提出一个事实:整个心理学领域都有无法推脱的责任(Final Report on Stapel Also Blames Field As a Whole),因为Stapel的55篇数据造假的论文中,审稿过程中完全没有发现问题。而这并不是说审稿的过程是无法发现问题的,因为在2012年,宾大沃顿商学院的Uri Simonsohn通过对Smeesters已经发表的两篇论文结果进行了仔细的检查之后,怀疑作者的数据有问题,随后Smeesters所在的大学对其进行了调查,Smeesters声称自己由于某些客观原因,原始数据丢失,但是其所在大学无法接受他的这个理由,接受了其辞职(见science的报道)。

事件3:还是回到2011年,Simmons, Nelson, & Simonsohn 在psychological science上发表了一篇名为False-Positive Psychology的论文,在这个论文中,指出了心理学研究中,有一些比较常见的做法会让整个领域的假阳性过高。不过这个文章仅在学术界引起了一些关注,媒体的报道相对较少。也是这一年,Virginia University的Brian Nosek在google group里成立了一个叫做open science framework的讨论组,11月7日发起一个倡议,建议对20008年发表的研究进行大规模的重复,这应该就是后来的Open Science Framework的萌芽。

事件4:2012年1月,无法重复的启动研究。在中国的农历尚未到2012年之时,社会心理学的社交网络圈爆发了一个新闻:著名的老年启动效应无法重复出来。记得在哈佛的幸福课(positive psychology)中,讲课的老师就引用过这个研究,让我印象深刻:当大学生看到一系列老年相关的词汇之后,他们走出实验室的速度会变慢,也就是说,变得更像老年人…….。当时我并没有特别在意这个研究。但是2012年1月,开源杂志Plos One发表了Doyen等人一个研究,声称无法重复出这个著名的效应。他们做了两个实验,第一个实验完全重复Bargh等人的实验,第二个则对参与实验的人进行了某种暗示,再现了这个效应。对于这个结果,科普作者Ed Yong进行了报道,并且开头引用了心理学教科书中著名的历史安全“聪明的汉斯”的故事,暗示原作者们Bargh等在方法上的严谨性。正常情况下,这种无法重复的原因多种多样,对于批评可能也无需太在意。但是Bargh作为自动化加工(automatic process)方面的权威,面对这个研究和报道,表示非常愤怒,在自己的博客上进行了激烈的反击,对重复实验的作者、发表重复实验的杂志以及报道这个重复实验的科普作者进行抨击,语言比较激烈,后来删除了该博客(可以从这里这里找到当时其他博客上的一些引用)。正如其他信息的传播一样,客观理性的内容往往很难引起注意,但是充满情绪的内容总是非常广泛地传播,于是Bargh的博客在社会心理学家之间传播开来。

Bargh这个博客引起广泛争议的同时,应该说是再次让社会心理学家们感受到了可重复问题的压力。于是一个原本不太受到关注的网站进入了大家的视野,这就是http://psychfiledrawer.org/。这个网站的目的是让心理学家把自己未发表的数据上传,以减少在论文发表中对阳性结果偏爱而阴性结果无法发表的这个问题。原本没有人多少人关注这个网站,但是Bargh事件之后,许多人纷纷把自己重复过的数据上传。更有意思的是,诺贝尔经济学奖得主卡尼曼也站出来说话了。在题为“A proposal to deal with questions about priming effects”的邮件中,他老人家让社会心理学家解决自己领域的问题。这个邮件内容也有不少的阅读者。

事情发展到2012年,越来越多的重复失败结果被曝光,要么是在一些网站上公开数据,要么是在一些学术期刊上发表。而对于Bem预见未来的实验,也有重复实验的报告在plos one上发表出来。Michigan大学Lawrence Sanna辞职,原因是Simonsohn怀疑他的数据有问题,nature进行了报道。心理学家也开始讨论怎样的重复才能算是一个合格的重复实验。于是有了预先注册(pre-register)、然后按照注册的方法进行实验,最后来报告结果。perspectives on psychological science上,也有专刊来讨论可重复性的问题,这一次非常集中地讨论了与可重复性相关的问题。同样重要的是,2012年,John等人关于可疑研究操作(Questionable Research Practices)的调查报告发表,心理学家们承认,自己在研究的实践中,一些通常的做法其实是大大地增加了假阳性的概率的。

同样是2012年,科普作者Ed Yong回顾了一系列事件之后,认为在社会心理学领域存在着可重复危机,这一报道在nature上以Replication studies: Bad copy为题,作为新闻发表。

直到2013年1月,Center for Open Science(COS)正式在Virginia University成立,成为心理学家组成的非正组织来应对这次可重复危机。COS整合了在此之前已经搭建的开放科学框架的平台(open science framework: osf.io/),开始组织全世界的心理学家进行联合的大规模重复实验。这一年,perspectives on psychological science再次组织特刊讨论了可重复性以及一些实验方法上的问题。这一期中,Lebel将PsychDisclosure.org推出,提出了研究者要完整报告自己研究的方法部分的要求。

2014年,关于重复实验应该如何做,研究者们基本上有一些共识,许多杂志开始鼓励提前注册的重复实验或者提前注册。osf进一步完整,成为一个可以公开注册研究和分享数据的平台。Journal of Experimental Social Psychology上,发表了题为The Replication Recipe: What makes for a convincing replication?的文章。这一年,在social psychology这个杂志5月的一期中,也发表了一系列经过提前注册过的重复研究,能够重复原先实验结果的并不多。不过一个比较积极的消息是,由Klein等人发表的多实验室项目(ManyLab)中,对心理学中经典研究的重复,大部分是有结果的。Cumming 也在psychological science上发表了题为The New Statistics: Why and How的文章,指出需要在统计方法上进行变革。Psychological science也改变了其审稿的政策,对方法部分不再有字数的限制,开始启用一些强制政策来加强方法部分的严谨性,如要求像Lebel指出的那样报告方法部分四个方面的内容,使用效应量和置信区间等。其他的杂志也有一些相应的调整。

不过值得注意的是,2014年5月,剑桥心理学家Schnall在其博客上表达了Social psychology上发表的对她2008年重复研究的不满,认为做重复研究的人是Bully,Dan Gilbert也在Twitter上表达了对进行重复研究的人的愤怒。平心而论,热衷于做重复实验的人,确实在对原研究的态度上不太好,在facebook和twiiter上有许多嘲讽。

2015年,最大的事件就是COS于2013年组织的大规模重复实验的结果得以发表,许多人期待的结果在Science上发表,其结论是对100项研究的重复,大约39%能够重复出来(根据对重复的标准不同,这个比例有一点变化)。这个研究的结果有大量的数据在osf.io上共享,供研究者去挖掘,而确实也有不少研究者利用这些数据进行了后续的分析。还有一些其他的重复报告也发现先前的一些效应无法重复,如孤独会让人洗热水澡的重复权力姿势(power pose 。许多人以为,可重复危机基本上就已经确定了,心理学要开始进行艰苦卓绝的方法变革,来提高本领域研究的可重复性了。但是

2016年3月,Science上的一个评论再次引起争议,Gilbert等人分析了COS大规模重复实验的数据,认为三个方面的错误使得他们的不足以得到心理学研究的可重复率只有39%的结论。这一评论再次激起了Nosek等人的回应、博客上的论战以及媒体的报道。然而,这些评论与争议,也无法改变另一个非常著名的心理学效应在重复实验前的倒下:自我损耗(ego-depletion)的重复实验也未能重复出其效应,而元分析也显示了相似的结果。这个失败让笼罩在心理学家头上的乌云更加密布,因为这个理论非常符合直觉,大量的心理学家投入时间和精力研究这个问题,大量的研究经费投入在这个问题的研究之中。不是一个人的问题,而是一群人的问题!

self_depletion

 

 

 

 

 

 

 

 

心理学研究领域到底有没有可重复危机?目睹了从2011年Bem事件到现在的自我损耗实验的重复失败,我本人对目前心理学论文中的结果和结论非常没有底气,对于原本不该质疑的,也开始质疑了。最近,Journal of Experimental Social Psychology在准备一期特刊,讨论如何去应对这些问题,其中自我损耗理论的提出都Baumeister发表一个评论,也引起了广泛的讨论。

看到这些已经在学术界有一定地位人相互之间的争论,对于刚入门的年轻研究者来说是最痛苦的。应该如何做研究?这是一个问题。

 

参考文献

Bem, D. J. (2011). Feeling the future: Experimental evidence for anomalous retroactive influences on cognition and affect. Journal of Personality and Social Psychology, 100(3), 407-425. doi: 10.1037/a0021524

Brandt, M. J., Ijzerman, H., Dijksterhuis, A., Farach, F. J., Geller, J., Giner-Sorolla, R., . . . van ‘t Veer, A. (2014). The Replication Recipe: What makes for a convincing replication? Journal of Experimental Social Psychology, 50(0), 217-224. doi: http://dx.doi.org/10.1016/j.jesp.2013.10.005

Doyen, S., Klein, O., Pichon, C.-L., & Cleeremans, A. (2012). Behavioral Priming: It’s All in the Mind, but Whose Mind? PLoS One, 7(1), e29081. doi: 10.1371/journal.pone.0029081

John, L. K., Loewenstein, G., & Prelec, D. (2012). Measuring the Prevalence of Questionable Research Practices With Incentives for Truth Telling. Psychological Science, 23(5), 524-532. doi: 10.1177/0956797611430953

Miller, G. (2011). ESP Paper Rekindles Discussion About Statistics. Science, 331(6015), 272-273. doi: 10.1126/science.331.6015.272

Simmons, J. P., Nelson, L. D., & Simonsohn, U. (2011). False-Positive Psychology. Psychological Science, 22(11), 1359-1366. doi: 10.1177/0956797611417632

以一种什么样的心态来对待可重复危机?

最近心理学中的可重复危机反正是非常严重了,越来越多重复实验发现,之前认为很稳定或者很有趣的效应可能没法重复出来。面对这个可能影响心理学名声的危机,心理学家的反应各不相同,有人积极进行批判,提出了各种各样的方法,进行了分析等等,最后对目前心理学研究的结果表示非常悲观。也有否认目前的可重复危机,认为当前的危机都是扯谈的,就是搞重复实验的那帮人在捣乱。

 

作为心理学领域的年青人(研究生或者年轻的研究者),以一种什么样的心态来对待这个问题?说实话,我本人之前是非常忧心忡忡的,总是担心自己所研究的这些东西都是没有意义的。相当于把自己这么些年的时间折腾进去,原以为会能够做点有意义的事情,却发现都不靠谱。

 

但是最近的一个研究者的心态就比较好,以一种更理性的角度来看待这个问题。也就是说承认心理学对重复危机的正视本身就是一种进步,毕竟人类的心理过程如此复杂,先前我们喜欢那种看起来非常好的story,现在发现这种搞法不行了。虽然令自己人非常难堪,便毕竟我们还是继续批判和发展。这本身就是一种进步。说不定会有一些人搞出一些新的方法出来,让心理学作为一个整体去受益呢。具体见:http://sometimesimwrong.typepad.com/wrong/2016/02/end-of-the-world.html。

2015年读的书

All knowledge is, in final analysis, history.

All sciences are, in the abstract, mathematics.

All judgements are, in their rationale, statistics.

                                            ——Statistics and Truth  by C. R. Rao

以自己尚未阅读完的<statistics and truth>的开篇作为开头,感觉自己似乎也更加厉害了一点。这几话我深深地认同,感觉这些观点在未来一段时间里也将主导着我对科学的看法。

按照阅读的顺序,农历的2015年阅读了如下书籍:

《冰与火之歌:一》

《冰与火之歌:二》

《冰与火之歌:三》

《名利场》

《冰与火之歌:四》

Guns, Germs, and Steel : The Fates of Human Societies

《娱乐至死》

《人类简史:从动物到上帝》

《解忧杂货店》

《明朝的那些事儿》

《中国近代史》(徐中约)

50 years of data science, by David Donoho (以下称 50 years,是一本小册子)

The Lady Tasting Tea : How Statistics Revolutionized Science in the Twentieth Century,  by David Salsburg (以下称 the lady)

今年的阅读内容,并不是非常均衡,历史类的书籍较多。《人类简史》和Guns, Germs and Steel是与人类社会相关的宏观的历史;《明朝的那些事儿》、《中国近代史》是中国的历史;《The lady tasting tea》、50 years of data science是关于统计的历史。《娱乐至死》也可以算作为是历史,只不是一个聚焦于电视出现前后这一段。其他都是小说,都挺有意思的。关于《名利场》、《冰与火之歌:1~4》和《Guns, Germs, and Steel : The Fates of Human Societies》之前写过总结。《人类简史》、《娱乐至死》和《解忧杂货店》也写过总结。所以现在主要说后面的几个。

《中国近代史》应该算是我阅读的第二本关于中国近代的非官方的历史书(第一本是高华的《红太阳》),也许是一个受过教育的应该阅读的书籍,至少相对客观地讲述了不少事实。换了一个视角,少了一些煽动和夸张、多一些事实与评估。不管是对于太平天国运动,还是义和团运动,在这本书中的解读,与我在高中历史中所要记忆的内容,似乎是有一些差别的。对于历史教科书中努力所包装和掩盖的历史事实,这本书里并没有明显的避讳。非常重要的一点是,作者从中国人的角度,讲述中国人这段比较受屈辱的历史,这种情感本身还是能够体会到的。如果说一个民族或者文化确实有集体意识的话,那么作为中国人,了解近代中国这段并不辉煌的历史之后,可能会对中国人的自卑感、努力寻求“国际面子”以及崇洋媚外的现象有更多的理解和同情。对于执政党而言,从革命到目前这种角色与功能的变化,其实是很自然的转换,因此不必抱有太多的奢望。另外一点,就是对于利益既得集团是否会真正地“带动后富”持有非常强烈的怀疑态度,因为人往往很害怕失去利益,这是Tversky 和Kahneman的研究早已经发现的。

《明朝的那些事儿》写法比较有趣,掺杂的个人观点和推测过多,有一种半历史半小说的感觉,但总体还是不错的。作者个人的观点算是非常鲜明,具有明显的自由和理想主义的成分在其中,其结尾以徐霞客的事迹。不过作者还是相对客观地转述了比较残酷的历史,在这个历史之中,没有能力的理想主义者(如海瑞)是无法办成大事的,最终成为政治斗争中一个杀伤力比较大的棋子。真正能够部分实现理想主义的,比如朱元璋、朱棣、张居正等,都是复杂的、心狠手辣的但同时有一些理想主义的人。记得之前听易中天讲三国中的曹操,也是一个非常复杂的人物。不知道这是否是中国文化下的一特色,还是人类政治中的正常现象。记得在看某本书的时候,提到了近代美国历史学家们对美国国父们的重新评估,也发现他们起草《人权宣言》和《宪法》时,也是在争夺自己的经济利益。从这个角度来讲,政治家(有理想的)和政客(没有理想的)从表面上看起来区别确实很小,尤其是从当代的角度来讲。也说明确实要多去了解历史,因为历史中体现的,是真实的人性。从理解人性这个角度而言,历史与心理学其实是有着共同的理想的。难怪在《基地》系统中,最高级的科学是心理史学,用数学来预测人类社会的群体行为。

回到统计史。已经读过的the lady和50 years,和正在读的<statistics and truth>,都是几乎不涉及到公式。这些书可能对于作者来说比较难受,因为学过数学的人好像都喜欢简洁的数学公式来进行思维。the lady这本书的副标题还是非常准确的:How Statistics Revolutionized Science in the Twentieth Century。主要的内容,就是在统计学应用于其他科学之中时,许多大牛们的故事。这些大牛们的事迹也再次让我看到,搞数学或者相关专业真是需要天分的:不少为统计学做出贡献的人,出身非常低微,甚至小时候没有怎么受过正式的教育就对数学非常感兴趣,然后一旦有机会获得学习数学的机会,立刻展现出他们惊人的天赋。这一点上,真是不得不服。

the lady和50 years这两本书的共同之处,指出数理统计(mathematic statistics)比较尴尬的一点:随着统计在其他学科的应用,以至于其他学科中的研究者开始相对独立地发展自己的统计方法,不再从数理统计中寻找帮助。在the lady中提到的是,在数理统计中已经被证明或者发现的方法,在其他领域再一次被发现,然后再冠以另一个不同的名字。而在50 years这书里,提到是许多大学被大数据冲昏头脑之际要搞所谓的大数据研究时,往往完全把原有的统计学系或者应用数学系抛一边,好像统计学跟数据科学没有关系似的。这个问题一方面与数理统计学家沉迷于抽象的数学证明而不屑于做实际的数据分析问题有关,另一方面也是在实际数据分析问题本身变得越来越复杂,并不是将一些数据原理简单地套用,因此在长期进行数据分析的人可能反而更有发言权。此外,从the lady这本上来看,许多统计方法实际就是为解决某一类数据的特点而发展出来的,所以进行抽象数学分析似乎很可能被人所遗忘。

the lady这本书的特点是每一章与相对的独立,每一章或者第几章集中于某一个统计学家,讲TA们的成长与贡献,可读性比较强,尤其是早期Fisher,老Pearson,以及小Peason和Neyman之间的恩怨,非常有意思。另外这一本书比较推荐心理学背景的人读一读,因为从这本书上,我们可以了解一下本科时期在《心理统计学》以及《实验心理学》学习到许多内容的历史。至于对于我而言,认识到了这样一个事实:我们学习到的实验设计,实际上背后是有严格的数理证明。这些实验设计的方法,可以最早追溯到Fisher在农业研究站中的工作。实际上,也正是他早期几本减少数学推理,侧重原理和应用解释的书,推动了其实验设计的方法在各个学科中普及开来(后果就是大家都不再重视数学推理过程,甚至直接忽略!)。至于《心理统计学》,那更是从许多统计学家的成果中沿袭过来的,当然其实包括了将Fisher与小Pearson-Neyman两个传统强行放在一起这样行为(这一点不止在心理学中如此,在许多使用NHST的学科中都这么强行使用)。

the lady一书中,还提到了我在另一本书(The Emperor of All Maladies : A Biography of Cancer)中见过的一个内容:关于吸烟与肺癌的关系。Fisher作为一个吸烟爱好者,觉得政府禁烟是对公民吸烟自由的干涉,也写过文章来批判过一些支持吸烟与肺癌关系的研究(他的批评是很在理的,因为有些研究中确实存在着数据挑选和出版偏见等问题)。但是1959年,一个叫玉米地的人(Cornfield, J. )用30多页的文章,对多个实证数据进行评估之后指出,吸烟与肺癌的关系不可否认,他用的方法,现在在医学里面可以被称为meta-analyiss / systematic review,我一般称为元分析。Salsburg 在 <the lady>在讲述这个问题的时候,解释说这个问题触及到统计学的一个核心问题:我们如何能够从数据中进行因果推断?严格地讲,现在我们在心理学研究中所进行的实验能够进行因果推断其实还是很值得商榷的,不过我们自己就这么说而已。因果推断这个问题,也许现在仍然无法非常完美地解决。

Salsburg 在最后一章中,也提出一些非常深刻的问题,包括概率在真实生活中到底意味什么,人们到底能否理解概率这个概念等。这些问题相当具有哲学的意味,因为我们似乎对这些问题形成了某种不清的共识,说起来好像每人人都知道概率是什么,但却无法进行严格地定义。包括我们在自己的研究中也是如此,连p < 0.001意味什么,也是好像知道但并不准确知道的。这种我们所默认的共识,其实在心理学中似乎专门有人研究吧,类似于数学心理学之类,研究人们如何理解数字之类的概念,但我并不太了解。关于这个默认的共识,Salsburg提到了科学范式的转变:从经典力学的机械决定论到一切都是概率分布(C. R. Rao的statistics and truth基本上就是在讲这个),是一次巨大的变革。这一点与《量子力学史话》中提到了是一致的,这个转变在物理学中是最为明显的。但是问题在于,现在以概率分布为基础的这种思维方式,似乎也碰到了许多问题,至少它在很多领域很难提供有用的提导(或者是这些领域的统计还没有学好?)。Salsburg指出,如果我们再一次变换思维方式,从以概率为基础的方式,跳到另一种更好范式中去,也许会给科学带来另一次革命。对于这一次革命,拭目以待。

这本书里,当然提到了贝叶斯与频率主义之间分歧,不过内容并不多。此外,我还注意到一个非常有趣的事实:即使在早期的科学研究中,科学家们就存在着只报告部分数据结果的传统,对于不符合自己理论模型的数据,科学家们的做法是直接无视。这些科学家包括孟德尔,也包括开普勒。这种做法现在在心理学中被称为可疑的研究操作(questionable research practices),它正是心理学研究不可重复的一个原因。想想现在心理学家受到的批判,突然感觉有点不公平了。

52 years这个小册子,跨度相对短一些,问题也更加集中一些。其侧重点便是数据分析中问题。里面提到了许多包括我们心理学/神经成像数据分析中碰到的问题:reproducibility,这个问题已经不用吐槽了,以后专门说吧。另一个有趣的问题是两种不同取向:model fitting vs. prediction,心理学中做的比较多的,还是model fitting,甚至已经到了一种病态的地步了。有人将心理学称为“ 僵尸理论的坟场 (graveyard of undead theories )”( Ferguson & Heene, 2012 ),因为我们一直在发表有部分证据支持但是却没有否定证据(由于出版偏见的存在,否定证据几乎无法发表)的理论,由于没有否定的证据,所以这些理论就处于不死,但是却没有活力(即没有用)的状态。当然,这个小册子中还提到怎样才算是data science,是非常值得一读的。

算一算,今年居然还读完了10多本书,这个速度,应该还算是可以的了。

无法避免的参考文献:

Ferguson, C. J., & Heene, M. (2012). A Vast Graveyard of Undead Theories: Publication Bias and Psychological Science’s Aversion to the Null. Perspectives on Psychological Science, 7(6), 555-561. doi: 10.1177/1745691612459059

John, L. K., Loewenstein, G., & Prelec, D. (2012). Measuring the Prevalence of Questionable Research Practices With Incentives for Truth Telling. Psychological Science, 23(5), 524-532. doi: 10.1177/0956797611430953

2015年写过的科普短文和自己的想法

在果壳的:

“逆袭”之路:家庭条件不足,认知能力来补

做决策,“从众”还是“从善”?

为什么看你那么疼,我也觉得疼?

他有没有在说谎?跟小伙伴讨论一下吧

天才和疯子,真的只有一线之隔吗?

瞎编的东西,怎么也有人说自己懂?

在百度知道的:

科学家谈大脑时,大多在谈“柯林”的大脑?

强制戒断时,大脑里在发生什么?

坏男孩长大后更强壮?

高海拔如何影响我们的心理功能?

立秋后,为什么容易情绪低落?

诚实一定比欺骗更道德吗?

脑子“不完整”会让人变傻吗?

两个网站的科普都有自己感兴趣的东西,也有编辑命题的作文。总体上感觉,自己写的东西缺乏技巧,很难让读者满意,在这个信息流的时代,很难有较大的受众吧。而自己平时也慢慢更喜欢在博客上自说自话,写写自己的学习笔记,分享自己看到的文章或者研究中的经验,可能与科普还有很大差距。“柯林”的大脑这一篇,实际上是自己对当前fMRI研究中大脑模板相关的知识的一个简单回顾,自己觉得很有用,别人看起来可能没有多少意思。高海拔如何影响心理功能这个,一直是我想写的一个主题,因为自己喜欢户外运动,所以也想知道高海拔的攀登对大脑和心理的影响。

“逆袭”之路这个,写得感触非常深,因为当时为了贴近主题,实际上对原文中比较现实的一部分有所保留:家庭背景对收入、工作和教育的影响,远远地大过了人格的因素,仅在受教育程度上可能会为认知能力所补偿,不得不说,对于以后还在“后富起来”路上的家庭来说,是一个非常可怕的消息。近年来,社会经济地位相关的话题,总是能够引起不少人在网络上的关注,比如《返乡笔记:一个农村儿媳眼中的乡村图景》,又比如上海女青年陪男友回江西老家过年 吃了一顿团圆饭就分手事件。对于这些事件,我基本上是冷眼但热心地旁观。因为总觉得自己说出的话,绝不可能是上帝视角的,而是带着自己所认识到或者没有认识到的无数的偏见的话,还不如少说一些。

在这个社会中,自己还是喜欢做一个后排的观众,看清楚在前排的和在舞台上的人如何反应,去学习人类行为的模式以及认识自己,毕竟自己现在还认识太不清楚。对于许多我赞同的和不赞同的,总想知道背后的原因是什么?为什么他们会做出他们认为自然而然的结论,而认为与他们观点相左的人是SB。在我们自然而然地接受的这些价值观里,哪些是我们经过认真检验,哪些是我们从来没意识到就接受了(比如在认识能力还有限的时候被输入的唯一的价值观)。

一个例子,是最近朋友圈里又在转知乎关于“女性年纪大了就不好嫁人了吗”。点赞最多的答案,可以说是有理有据,而且我也不会反驳(只是不喜欢最后那种优越感),因为我所受到的教育,也是强调这些的。不过我仍然是持有同样的疑问:我们这种认为结婚就是一起玩儿,两人必须相互独立等自由的思想是从哪儿来的?总感觉跟万恶的资本主义有着非常强的联系。似乎在某些书上看到过类似的观点:从农业社会转向工业社会/资本社会之后,需要人力、资本等一切的自由流动,于是传统上把人绑到一起的制度,都成了万恶,婚姻和家庭首当其冲,成为这种革命所需要的祭品了。从这个角度来看,我们不是又被利用了?这个问题我的考虑还不有欠缺,可能还要进一步补充相关的知识。

关于写科普,自己现在反而有点胆怯了,主要的原因在于近年来心理学研究中的可重复性确实太不尽人意了。也许我们可以拿生物制药方面的研究来安慰自己,说我们不是最差的。但是问题在于,作为心理学的研究者,其实心理学就是我们所唯一所拥有的,把它做好做得靠谱,是我们自己的责任,别人可能只是点评一下,嘲笑一下就可以转身离开,但除非我们转行,否则烂摊子还是得自己人来收拾。由于这个摊子还没有收拾好,有点羞于拿出去宣传了都。

对于写科普,还有一点需要补充的就是,稿费还是太低了。