人生论

首页 » 常识 » 诊断 » 数据挖掘心理学研究方法从选题到论文发
TUhjnbcbe - 2021/3/19 16:58:00
本书以三名热爱科研的心理学本科生(小白,乔乔和小星)的学术成长经历为线索,通过讲述踏入科研之门的难点、痛点与增长点,力争让读者在亲切共情的氛围中,学会如何探索研究兴趣,凝练研究问题,明确研究假设,申请科研项目,最终,撰写与发表学术论文。

第七章发表英文论文

进入大学四年级的小白顺利地保送了学校的研究生。在品尝三年努力终有所成快乐的同时,他遗憾地注意到,身边几位保研成功的同学开始变得迷茫甚至懈怠,不但丧志了学习的热情,还会沉迷于网络或娱乐,把当初他们对学术科研的热爱远远抛在脑后。小白看在眼里,想在心上,他深知保研成功只是人生特定阶段的短暂胜利,他的理想在远方,他还要用加倍的努力去追求更高的目标。那么,如何才能寻找到更有意义的研究方向,从而为学术理想,远大前程奠定扎实的基础呢?小白在自己的心里一边勾画着未来美好的蓝图,一边寻找机会提升自己的科研能力。

年初的一场新冠肺炎疫情打乱了几乎所有人的生活,作为一名年轻的心理学家,小白很快就意识到可以从自己的学术专长入手,基于心理学研究的角度寻找到缓解人们疫情焦虑的方法。恰好,小白和导师在疫情发生之前的一个月便测量了一批心理量表数据,所以,小白和导师商量可以继续追踪这批被试,进而揭示这批人的焦虑水平是否以及如何随疫情变化,探究一下究竟什么样的人更容易为疫情感到焦虑,又有哪些方法可以帮助这些敏感人群降低焦虑。

初衷是美好的,但道路是曲折的,当小白真正着手开始分析数据时,他才发现这项工作远远没有他想得那么简单,主要原因是虽然他们收集了很多数据,但一个研究不可能能囊括所有变量,还需要了解研究背景与高级统计技术,为了从海量数据中发现最有意义的研究结果,小白废寝忘食地投入到数据挖掘的工作之中。

数据挖掘(DataMining)是指从大量的、不完全的、有噪声的、模糊的、随机的数据中发现隐含在数据中的关系,建立模型,提取具有潜在价值、可信、新颖、有效并能被人所理解的信息和知识的过程。用数据挖掘方法分析数据,挖掘隐藏在数据中的知识可以实现对数据更高层次的处理,将大量看似无序的数据转变为有用的、系统化的知识(张哲,)。

对心理研究而言,数据挖掘技术是一种新的思维方式和研究方法。尤其是随着大数据时代来临和数据挖掘技术的发展,使得心理学研究中传统的“样本推断总体”和实验研究所存在的问题有了新的解决思路。数据挖掘技术有望成为重要的心理学研究方法之一(成芳妍,李家玲,于炜烨,张敏强,)。

目前,数据挖掘技术在心理学研究中的主要应用场景包括以下几个方面:

传统心理学研究方法收集到的观察数据、实验数据、测量数据和访谈资料等;

社交网络数据,如微博、Twitter等;

社会、生活的其他场景数据,如网购数据、投资数据、面试数据等。

利用数据挖掘进行心理学研究的过程可以分为以下五个步骤:

1数据收集

这是一个利用量表和问卷等收集所有与心理学研究对象有关的内部和外部数据信息的过程。比如,小白想要研究影响疫情焦虑的因素,寻找到降低疫情焦虑的途径,所以,他们首先寻找到靠谱的测量疫情焦虑的工具,并加以施测;其次,他们还收集了可能影响疫情焦虑的数据,比如心理弹性,孤独等;最后,他们还收集了可能的中介或调节变量,比如社会支持,大五人格,感恩等。当然,他们也没忘了收集混淆变量的数据,比如被试的社会经济地位,职业,是否感染新冠肺炎,健康状况等数据。

2数据的预处理

这是一个确保数据质量的过程。即通过一定的策略尽可能消除数据的不完整性和不一致性,以降低数据挖掘所需要的时间,提高数据挖掘算法的效率、精度和有效性,提高数据挖掘模式的质量。数据预处理的方法主要有数据清理、数据集成和变换、数据归约等。具体可以从以下几个方面入手:

检查是否错误的数据并对其进行处理;

检查是否有冗余的数据并剔除;

检查是否有缺失的数据并按照一定的统计方法进行填补;

对数据的表述方式进行转换;

对数据进行压缩以简化数据的表达和处理。

尽管上面的各种处理都有相应的工具来帮助人们实现,但这些工具毕竟不具备人类的智能,有时反而会将正确的数据当作错误的数据进行处理,增加了数据的噪声。因此,心理学专家的参与是不可缺少的。

3数据挖掘

这一步骤的目的是明确心理问题各因素之间的相互关系。这种复杂的关系不可能一步确立,需要反复试探,仔细观察。在此过程中,心理学专业知识有助于进行系统的观察。但是,也不要让专业知识限制了观察数据特征的敏锐性。如果数据真实可靠,那么不要轻易否定数据呈现的新关系。这可能会引导后续的分析,发现比原有的认知更加符合实际的新认知。

当拿到了一个样本数据集后,它是否达到原来设想的要求,其中有没有什么明显的规律和趋势,有没有出现从未设想过的数据状态,因素之间有什么相关性,它们可区分成怎样一些类别……这都是要首先探索的内容。利用现有的数据挖掘软件(如SAS中的EnterpriseMiner模块等)进行数据特征的探索、分析,进行可视化的操作。最终达到的目的是要弄清所测量的诸因素之间的相互关系。

但是,这种复杂的关系不可能一下子建立起来,一开始,可以先观察众多因素之间的相关性,再按其相关的程度,了解它们之间的相互作用。这些探索、分析,并没有一成不变的操作规律性,相反,需要耐心的反复试探,仔细观察。在此过程中,心理学专业技术知识是非常有用的,它会有助于进行有效的观察。但是,应当注意,不要让专业知识束缚了对数据特征观察的敏锐性。假如数据是真实可靠的话,那么绝对不要轻易地否定数据呈现的新关系。很可能这就是发现的新知识!有了它,也许会导引此后的分析,得出比原有的认识更加符合实际的规律性知识(郝丽,刘乐平,)。

4结果输出

对所得到的心理学数据进行挖掘,获得数据中隐藏的重要信息或关联,其相应输出结果的方式可以有很多,这根据研究者的需要而定。它可以是一个统计报表,也可以是对未来趋势的图形描述等。

5结果评估

数据挖掘的结果是否满足心理学问题研究的要求,要通过结果评估阶段来判断。从上述过程中得出一系列的分析结果,需要利用心理学专业知识进行综合评估。数据挖掘阶段所发现的信息模式,经过评估,可能存在冗余或无关的模式,这些需要剔除;也有可能模式不满足问题研究要求,这时需要退回到发现过程前面的阶段,如重新选择数据、采用新的数据变换方法、设定新的参数值,甚至换一种挖掘算法等,重新进行挖掘。

以上仅为数据挖掘的皮毛,最后,推荐两本中国人民大学出版社出版的关于数据挖掘的专业书籍。“纸上得来终觉浅,绝知此事要躬行。”研究者还需要不断地在与数据真枪实弹地斗争中,才能不断提升自我数据挖掘的直觉与能力。

通过将文献阅读和数据挖掘相结合,小白提出假设认为,孤独感会影响人们的疫情焦虑,而社会支持则会缓解孤独水平高的人的疫情焦虑。因此小白围绕特质性孤独感,疫情爆发前的特质焦虑,疫情高峰期与下降期的疫情焦虑水平,以及感知到的社会支持四个变量间的关系进入深入分析。研究结果表明,人们的社会支持从肺炎疫情前到高峰期急剧增加,并在疫情下降期间保持稳定。相比之下,人们的疫情焦虑则从高峰到下降阶段有所降低。此外,人们感知到的社会支持不但能调节孤独感与特质焦虑之间的关系,还能调节孤独感和疫情焦虑之间的关系。

总之,他们的研究发现,感知到的社会支持可以在日常生活中以及意外灾害中为孤独者提供保护,这将有助于寻找到减轻孤独者在这场全球健康危机中焦虑的方法。

最终,他们的研究成果于年11月发表在FrontiersinPsychology上面。而关于如何写作英文文章,选择目标期刊,如何写作英文回复信的内容请听下回分解。

写在最后,编者的话愿我们都能守住这份热爱学术的初心不断学习,用心领悟,收获成功和喜悦!

参考文献

成芳妍,李家玲,于炜烨,张敏强.().数据挖掘技术在心理学领域的应用和展望.第二十一届全国心理学学术会议摘要集(pp.-).

郝丽,刘乐平.().健康心理学研究与数据挖掘.健康心理学杂志,10(3),-.

张哲.().浅议数据挖掘在心理学研究领域的应用.教育教学论坛,2(15),-.

预览时标签不可点收录于话题#个上一篇下一篇
1
查看完整版本: 数据挖掘心理学研究方法从选题到论文发