References for beginners on skin conductance response (SCR)

Skin conductance response (SCR) is a widely used psychophysiological measurement in psychology, especially emotion studies. Even it is a relatively old method used in psychology, it seems that there is no explicit standard you can use, more or less the tips are told by your colleagues instead of from an explicit guidebook.

Here I record the articles, books, and manuals that helped me to know more about SCR, which I will be used in a fear extinction study.

The workflow of the SCR is not complex, only three steps:

Recording. The most or lest important thing you need to care, depending on your lab’s experience. It is the most important thing because data quality is always the most important aspect of research. “garbage in, garbage out”. It is the lest important thing because usually you just follow the way your lab’s done before. The question in this step is: which part of the body will you stick the electrode, how can you get good signals.

Preprocessing. surprising! With a cognitive psychology background, I’ve thought that only EER & MRI data need a preprocess, but actually, SCR data need that too (actually all kinds of data need a preprocess, the only difference is how much time it cost and how complicated it is).

The preprocess of SCR data usually include a low-pass filtering or down-sampling. After that, you begin to deal with the real data.

The question at this stage is: first, the time point of the onset of SCR (Levinson and Edelberg 1985 reported that 1000 ms ~ 4 000ms after the onset of stimuli were used most frequently, from Boucsein, 2013; we use 900 ms ~ 4 000 ms).

Second, after knowing the onset, the next step is how to calculate the magnitude (Important Note: amplitude and magnitude are different things in SCR, sum non-zero amplitudes / number of non-zero responses = mean amplitude; mean magnitude = mean value computed across all stimulus presentations including those without a measurable response). which threshold used to judge one trial has SCR or not (zero-response)? There is also no standard way for this. Braithwaite et al. (2015) mentioned that historically the most common threshold is 0.05 µS, but now the common threshold is range from 0.01 to 0.04 µS. In our study, we used 0.02 µS.

After extract the SCR amplitude value, the data need to be normalized and standardized. Braithwaite et al. (2015) make a good distinction between the two: Normalization is to make data of each participant more like parametric data (therefore can subject to parametric data analysis), which is necessary; standardized is between participants, to make each participants’ data comparable to each other, which is not always necessary. There are many different ways to do the normalization and standardization, Braithwaite et al. (2015) give many typical approaches, please check the document (p10 ~ p11).

In our lab, we used magnitude, which is the normalized log transformation (log(S+1), S =  raw magnititude); for standardization, we used the range-correction ( (SCL – SCLmin) / (SCLmax – SCLmin: Dawson et al., 2001)).

Analyzing: after preprocessing, do whatever statistic you like.

Of course, my understanding might be wrong, cause I am also a beginner in this field. So here are the references and what I learned from each:

First of all, EDA or SCR is not as simple as it appears to be. At least there are books about it. Here are two examples:

Boucsein (2012), Electrodermal Activity (2nd). Springer

Greco, et al., (2016), Advances in Electrodermal Activity Processing with Applications for Mental Health. Springer.

Second of all, check the guideline from the Society of Psychophysiology, the have a Publication recommendation for electrodermal measurements. In section 3.1, there is one paragraph about the latency of SCR, which is a good rule of thumb about how you shall decide which part of your data is SCR. This section also mentioned different index of SCR: amplitude, area under the EDR curve etc.

Then, there are some terms that you might want to know before jump into all the mess, and Boucsein (2012) have made a table to make life easier:

Braithwaite et al. from Birmingham have a very clearly explained online guide. If you only want to read one document, this one is recommended. The link is here.

Braithwaite, Watson, Jones, & Rowe, A Guide for Analysing Electrodermal Activity (EDA) & Skin Conductance Responses (SCRs) for Psychological Experiments.

For a practical and brief introduction, please see:

B. Cowley, M. Filetti, K. Lukander, J. Torniainen, A. Henelius, L. Ahonen, O. Barral, I. Kosunen, T. Valtonen, M. Huotilainen, N. Ravaja, G. Jacucci, The Psychophysiology Primer: A Guide to Methods and a Broad Review with a Focus on Human–Computer Interaction DOI: 10.1561/1100000065. 

Another often-mentioned book chapter (of which book the founder of social neuroscience John Cacioppo is the editor):

Dawson, M. E, et al. (2000). The electrodermal system. In Cacioppo, J. T, Tassinary, L. G. & Berntson, G. (ed), Handbook of Psychophysiology. Cambridge University Press, Cambridge UK, 2nd edition, 2000. 

读《晚清三部曲》

唐浩明的《晚清三部曲》以三个为主线:曾国藩、张之洞和杨度。这几本书原是梦迪先开始阅读,经常听她说起之后,我觉得非常不错,于是也决定看看。但最终我下载的是唐浩明的版本,而非梦迪所阅读的那一版,但仍然非常值得一读。

首先,这三本书是历史小说。既然是小说,所以无法全信,而又是历史,所以人物的主要事实都是基于可信的资料。但哪些可信那些是臆造,可能还需要以后进一步阅读相关的书籍来进行区分。不过总体而言,这三部书的可读性很强,叙事上都非常流畅、引人入胜。所以时间在阅读期间不知不觉就流逝,有经常凌晨两三点才不得已而中止阅读。另外,在故事之中引用了许多诗词篇章,感觉比单独阅读一首诗更加有感染力。虽然自己没能静下来细细地口味这几本书中的每一首诗,但是看到这些优美的古文时还是非常享受。尤其是在长期阅读学术论文以及网络上粗糙/直白的文字后,更是感觉中国古代的诗句确实值得回味。“两情若时久长时,又岂在朝朝暮暮”,短短的十四个字,就能够表达出无数的意境来。

甚至,阅读这些诗词,还可以引发一些非常独特的情绪,比如对于书中提到的许多地点:北京的西山、鄱阳湖、衡阳、汉阳、汉口、南京等,所谓怀古,大概就是这样吧。可惜我辈大部分在历史和文学方面的教育很少,也许自己有空应该花一些时间来抄写一些诗句。

这三部曲写的人物非常具有代表性:曾国藩对中国近代的影响,远远地超过了普通人的印象;张之洞作为晚清最后一个有权且有能力的人,其所做所为,让人感到世事的复杂;杨度作为从晚清到新中国的奇人,游走于各个政治党派之间,其求学、从政令人唏嘘,其具有书生之气的爱国之心,也令人敬佩。阅读这三部书,了解了不少近代人物的故事,包括辜鸿铭、曾国荃、袁世凯、王闿运、王梁启超、汪精卫、谭嗣同等。

曾活着的时候位极人臣同时又功成身退,虽然晚年与洋人打交道时被骂成卖国贼,但是他的影响力即绝不止于他活着的时期。在看这本书之前,我对书店里各种版本的《曾国藩家训》基本上是不屑的,觉得那只是中国版的成功学。但是看到这本书里的描述之后,发现他本人虽然活在世俗之中,追求高官、学会如何在官场上求胜,但他在品行上确实在同辈中属于少有;而他知人善用这一特点,应该是少有人能够做到。这说明他的家训也许是有很大价值的。

他对清朝的忠诚,应该是那个时代文人独有的吧,这一点上,后来的张之洞与他是一样的。但是正如在《杨度》一书中所王闿运所言,曾可能成为了中国近代军阀割据的起源:由于湘军是他一手招募、筹饷、调度,湘军就成为了曾家军,后来攻下太平天国之后,曾国荃把胜利当作是私人的战争,任由湘军对南京进行洗劫。曾手下的将领们,在他的保举之下,大部分成为了高官,以至18省的抚都有13个出自湘军。这些人后来又建立了自己的军队,其中最著名的是曾的学生李鸿章,建立了淮军。而淮军的私人化程度,比湘军有过之而无不及。这一点后来被袁世凯学习到,建立了新式陆军,即后来的北洋军。湘军另外一个特点就是大头头带小头头,曾国藩自己是湘军的老大,但是下面的各个军团又都有自己的老大,相互之间相对独立,一旦大头目去世,则小头目相互之间就独立了。后来袁的手下各个将领之间,成为了北洋军下的各个军阀,相互争利,让中国近代一直处于动荡之中,而不是合作起来让国家强大。这些可能都是曾没有想到的吧。当然,能不能怪曾呢?也很难说,他自己当时也是不得已而为之吧。

曾对三湘大地的影响也许相对更加积极。一方面,曾以及其他湖南人成功,成为了后代们的楷模,让三湘子弟受到激励,抱负远大。另一方面,曾把湘军解散之后,大量的湖南人回到家乡,他们的财富、见识均大大增长,又为他们的后代成长为人才提供了很好的基础。这种影响,可能延续到了民国以及新中国:民国时间不少人才来自湖南,而新中国的成立,湖南人的功劳也不小。

曾的另一个非常值得称道的地方,是他对家族的贡献,他对自己的兄弟、子孙都进行了很好地教育,让他们能够超出一般水平,成为优秀的人。这也许是《曾国藩家训》或者类似书籍为人们所重视的原因。这一点也令我非常好奇:曾现在的后代们,还过的好吗?

张之洞,湖广总督是他标志性的身份。虽然他也当过两广总督并且在广西取得了谅山大捷,成为了清政府唯一一次与外国人交战中的胜利,但是他的主要功绩还是在湖广。汉阳铁厂,号称当时全世界最大的钢铁厂,不知道是否与后来的武钢有关系。除了汉阳铁厂之外,还有一系列的其他厂房,让湖北表面上拥有了近代的工业体系。

但遗憾的是,他要采用官办的方法,让这些企业腐败严重,管理落后,无法与外企进行竞争。张办近代企业的这种情况,也当前中国的国企也是有相似之处:当官僚化的制度在企业中占统治地位之后,基本上就废了,腐败、低效随之而来,企业也不行了。

当然,张之洞对中国近代影响更大的也许在于他对“洋务人才”的培养。由于他本人看重洋务,所以花了不少政府的经费,向海外送出了大量的年青人,这些人后来许多成为近代努力复兴的人才,黄兴就是其中的代表。这一点,也是张没有想到的。正是由于张的对新式人才的需求和大量资助青年才俊去海外留学,才有了湖北湖南两省在海外留学的比例上大大多于其他省份的情况。加之汉口是众多外国使馆所在地,近代的革命也因此率先在湖北意外地发生了,成为了国民革命的先锋。这一点非常巧合地与“楚虽三户,亡秦必楚”对应起来,似乎说明楚人还是挺反叛的。作为荆楚大地上长大的人,头一次对自己这个(广义上)家乡的历史有了更加深刻的认识。也正是这种认识,才知道为什么在历史上湖北人与湖南人如此亲近:大家都是楚国的后人。

杨度,一个爱国的知识分子,也是一个充满了权力欲的知识分子。非常年轻即想入阁为相,辅佐明君来让国家强大,后来又拜王壬秋为师,学习帝王之术。在他的求学及求权的过程中,他接触到了许多人:袁世凯、孙中山、蔡锷、梁启超、汪精卫等在近代人物。他自己的经历非常丰富,不乏浪漫甚至是非常神奇的爱情,感觉不太真实,充满中国文人的幻想,虽然是不聊斋,但是却有聊斋的影子。但是看维基百科上的介绍,他的如夫人(妾)确实是戏班出身。从杨度这个奇人的一生中,进一步看到中国近代的可怜之处在于,这么大的一个国家,却为一帮自私自利且没有能力的人掌控着,如何不亡国。“百日维新”的失败,与当时皇帝的个人能力关系非常大,试想如果光绪帝有能力有魄力,是否中国现在就是君主立宪制了呢?可惜他能力太差,而慈禧又是一个只有个人利益没有国家利益的人,清朝王室中的那些王爷们,也没有一个扶得上墙的。当时的有识之士,能做的就是到处奔走,宣传。比如梁启超、孙中山。但是他们却未能了解到枪杆子的重要性;掌握军队的,如袁世凯等北洋系,却没有政治上的远见与大志,完全是小聪明。可能后来的蒋也是如此吧。这可能是后来毛成功的背景吧。

读历史总是让人平生许多感慨。自己现在身在外国,想像一下100多年前,中国的读书人们,为了摆脱为当时的强国英、法、德、俄、日的欺侮,真是各尽其才,自己甚至觉得有点失真。又想到中国当今的社会,虽然名义是是采用一种先进的社会制度,但是中国历史上的这些糟粕,仍然随时可见。我们现在确实比之前进步,但是我们这一代人,又会有怎么的历史被后人所阅读到呢?

可重复危机更新:Methodological Terrorism

关于“可重复的危机”事态的发展,有些超出纯粹学术的讨论,带有许多网络争议中常有的戾气,这种戾气随着最近Susan Fiske在APS官方在线杂志Observer上一篇文章的流出而引起了(西方)心理学家集体刷屏。不过虽然说各个参与讨论的人内心可能各种涌动,但是讨论起来,还是挺有分寸的。至少主流是那些比较折衷同时兼顾各方的人。

Fiske写了一篇题为Mob Rule or Wisdom of Crowds?文章,在这个文章中,她作为社会心理学的老前辈(Handbook of Social Psychology的编辑之一),批评了当前许多人在网络媒体(博客、facebook、twitter等)上对同行的研究进行批评与讽刺的行为,并且这种“方法恐怖主义”引起了不少人离开学术界。(点击这里下载:fiske-presidential-guest-column_aps-observer_copy-edited

“…. all because of methodological terrorism.”

此文迅速在学术界的社交媒体上传播开来。引来了非常多的评论,有非常大胆的公开信(见下图,来自英国Cardiff大学的Chris Chambers,Pre-register的推广者),也有各种各样在博客上的反驳,我列出目前几个比较有影响的博客文章。

哥大统计学家和政治学家的评论:What has happened down here is the winds have changed。主要的观点是时代变了。顺便一说,他后面一篇关于为什么可重复性在心理学领域特别成为问题的博客也值得一读:Why is the scientific replication crisis centered on psychology?。

Johns Hopkins大学的统计学家Jeff Leek的评论Statistical vitriol。这里提到了一个有趣的观点是,现在许多学术界的老前辈是在数据相对少的年代成长的,他们的统计训练很少,在现在数据多、数据开放的时代有点不适应。另一个观点是:统计学家在各个学科都不太爱重视,虽然各个学科都在用统计。

我非常喜欢的一个博客[citation needed](博主Tal Yarkoni, UT-Austin心理学系的助理教授)写了一篇非常长的博客:There is no “tone” problem in psychology。作为年轻人,他也知道大家不愿意看太长的博客,所以在开头列出了他的观点:

1. There is nothing wrong with the general tone of our discourse in psychology at the moment.

2. Even if there was something wrong with the tone of our discourse, it would be deeply counterproductive to waste our time talking about it in vague general terms.

3. Fear of having one’s scientific findings torn apart by others is not unusual or pathological; it’s actually a completely normal–and healthy–feeling for a scientist.

4. Appeals to fairness are not worth taking seriously unless the argument is pitched at the level of the entire scientific community, rather than just the sub-community one happens to belong to.

5. When other scientists do things we don’t like, it’s pointless and counterproductive to question their motives.

还有一个经常对已经发表的文章提出批评与质疑的博客Neuroskeptic,也写了一篇评论:Terrorist Fiske Jab: On “Destructo-Criticism”。配图是这样的:

当然,Fiske写完这个文章之后,知道自己可能会惹火上身,她也接受了采访,进行了一些回应:We talked to the scientist at the center of a brutal firestorm in the field of psychology.

然后Chambers写了一个针对这个采访的反驳:“Methodological terrorism” and other myths“。这个里面提到了之前写的一些非常好的博客。感受一下配图:

还有一个叫Error Statistic Philosophy的博客,也写了一篇博客对此事进行评论:A new front in the statistics wars? Peaceful negotiation in the face of so-called ‘methodological terrorism’。在这篇博客中,也有统计学出身的人留言,表示统计学在各个领域中其实不受重视,地位低下。

总之,最近关于methodological terrorism这个词,心理学家们已经开始讨论(撕)得非常厉害了。当然,在公开讨论的人中间,基本上都是拿到了tenure的人,再怎么说话也不用担心自己的饭碗问题,而年轻的博士或者博后们,好像没有什么人站出来发言。

另外,从这一点上,感觉互联网对于传统的peer-review式的学术期刊也产生了冲击,新的科学论文出版方式可能会是以后的趋势。

 

当我们谈“可重复性”的时候我们在谈什么?

此文是我在自己的微信公众号上的一篇文章,本意是在记录一下自己对于可重复性(reproducibility)的理解。原文见这里。欢迎关注本人公众号Brainclimber:

qrcode

 

最近看到了讨论科研中可重复性问题的视频(不仅是心理学),其中Brian Nosek提到了可重复性(reproducibility)的几层含义(23:45’到25:30′)。我觉得非常有意思,这也是我们在讨论可重复性时因为篇幅的限制而未讨论的问题[见引文],所以正好在展开说一下。

这个视频是一次关于可重复危机的讨论。在这个视频中,Brian谈到了四层不同的reproducibility,以下是我自己对这四层的可重复性的理解,建议看原视频(点击原文链接可观看):

第一层:再现原论文中的结果。即使用相同的数据,相同的分析方法,是否能够得到相同的结果。这一层是最容易实现的,基本上只要公开数据和分布方法,我们就可以得到跟原论文一样的结果。但从目前科研界的主流做法来看,这一点并没有那么容易实现,因为大家基本上只是发表论文,并不公开原始数据,也不公开分析数据的过程。也正是由于不需要公开数据分析的过程,不少研究者靠GUI,手动点击完成数据分析(比如SPSS和Excel)。这样造成的后果就是,论文发表之后,作者本人也不一定记得自己当时是如何分析的了。所以从这个角度来,目前许多关于可重复性问题的解决方案,是在试图解决这个问题,比如Rmarkdown的使用;

第二层:再现原论文中的结论。也就是说,仍然使用原论文的数据,告诉你研究的问题和假设,让你去分析,看看你是否能够得到相同的结果和结论。这一点上就比较有意思了。理论上讲,各种方法应该得到相同的结果,但实际上,Brian他们目前正在做的一个研究显示并非如此:招募世界范围内不同的研究者,给他们一批数据和研究假设,让他们采用自己擅长的方法去分析。结果不同研究小组分析的结果差异很大,因此结论也不尽相同。从这个角度来讲,研究者在数据分析的过程中,自由度还是太大,可操作的空间太大,于是数据最终可能是朝着符合研究者预期的方向得到结果;

第三层:使用与原论文相同的方法和材料,看看是否能够得到原论文的结果。前段时间Replication Project: Psychology所做的工作是这一层的重复。这种重复也叫做直接重复(direct replication)。当然,直接重复面临着不少的批评,因为直接重复的过程中,可能会忽略不少的细节,有可能这些细节才是关键的,而原研究者甚至都没有意识到。所以不少研究者发现自己对其他人的研究进行直接重复时,即使失败,也会不立刻怀疑原研究,而是首先从自己的研究过程找问题。但是仅仅看论文确实是很难精确复制原实验的过程,这个问题Brian在视频中也说了;

第四层:使用与原论文不同的材料和方法,仍然得到原论文的结论。我理解的这个就是心理学中常用的概念重复(conceptual replication)。比如为了证明刻板印象启动是有效的,第一个实验启动老年的刻板印象,第二个启动婴儿的刻板印象,第三个启动嬉皮士的刻板印象,都发现了与刻板印象一致的行为表现,于是证明了刻板印象启动是有效的(婴儿和嬉皮士是我瞎编的)。这种方法在过去的研究中经常出现,Stapel也说他的结论被conceptual replicated。这个意义上的重复也是重复,但可能没有直接重复那么能力有力地证明原研究的效应确实是存在的。

这四层可重复性还只是一种观点,还可以讲方法可重复性、结果可重复性、推论可重复性等,可以参考 Goodman, S. N., Fanelli, D., & Ioannidis, J. P. A. (2016)在Science Translational Medicine上对这个问题的讨论。

此外,关于reproducibility,这个概念最早是由做计算和统计这一块的人提出的,由于他们的工作涉及到海量的运算,可能有大量的代码和脚本,一个人是否能用使用代码完全再现另一个分析,就是最原始的reproducibility的意思。这是我对Roger Peng在Coursera上关于reproducible research一课上讲到内容的理解(如果有误,那得怪我)。对这个问题感兴趣的话,可以上coursera上免费注册和学习这个课程:https://www.coursera.org/learn/reproducible-research。

最后的最后,reproducibility并不是心理学这个领域特有的问题,比如Science在2011年讨论reproducibility的时候,完全跟心理学没有关系:http://science.sciencemag.org/content/334/6060。

参考文献:

Goodman, S. N., Fanelli, D., & Ioannidis, J. P. A. (2016). What does research reproducibility mean? Science Translational Medicine, 8(341), 341ps312-341ps312. doi:10.1126/scitranslmed.aaf5027

胡传鹏, 王非, 过继成思, 宋梦迪, 隋洁, 彭凯平. (2016). 心理学研究的可重复性问题:从危机到契机. 心理科学进展, 24(9), 1504–1518 doi:10.3724/SP.J.1042.2016.01504

如何安装与使用statcheck工具包

2016.09.23更新:statcheck的作者发布了一个manual:http://rpubs.com/michelenuijten/202816

2016.10.21更新:statcheck发布了在线版:http://statcheck.io/

7月23号,psych sci的主编在自己的twitter上发推说目前psych. sci.正在测试使用statcheck工具包。

1136305613@chatroom_1469402433752_40

对于不少人来说这可能并不奇怪,因为这个工具包早就已经公布出来,能够快速地检查一篇论文中统计量是否有错误,比如F值与后面的p值是对应。这个软件的好处在于它可以检查出由于手动输入造成的错误。一经发布,得到了广大的好评。

statcheck的官网:https://mbnuijten.com/statcheck/;这个页面有教大家如何安装,当然还有另一个教大家如何使用的博客(需要翻墙)

以下是我在window 10下面进行安装和测试的结果。

第一:下载R和Rstudio,并且安装好;

第二:下载 Xpdf 并且解压(下载地址:http://www.foolabs.com/xpdf/download.html),可以选择把这个解压后的文件移动到一个存放软件程序的路径(比如我就是C:/Programfiles/xpdf)。

第三:将Xpdf添加到系统的environmental variable里,右击 this pc (此电脑) –> Properties  –> Advanced system settings –> environmental variable. 在User variable 里编辑Path,如果没有Path, 自己新建一个,把Xpdf的路径放进去。

(第二步和第三步就是安装Xpdf,其功能是将pdf转化为txt进行读取,具体安装可以看这个pdf

安装好了之后,打开Rstudio,安装statcheck这个工具包(>>后面接的是代码,如果复制的话,不要把>>也复制到R里去了):

>> # install and load statcheck

>> if(!require(statcheck)){install.packages(‘statcheck’)}

 

然后打开这个工作,使用它来检查:

>> library(statcheck)

>> checkPDF(“C:/Users/Daniel/statcheck/Zhang2015.pdf”)

如何一切正确的话,你的Rstudio里就出输出检查出来的结果,比如:

5D28.tm

值得一提的是,并不是所有的pdf都能够读出统计值 ,至少我看了两篇APA的文档可能就无法进行检查。

如果对statcheck本身有兴趣,可以查看一下原文

为了避免麻烦,我直接把Xpdf的winow版本和Lakens提供安装英文手册使用云盘共享,链接:http://pan.baidu.com/s/1kVrpWzX 密码:rpe4;下载statcheck压缩包即可。