当前位置 > 资讯 > 社科动态 > 文章详情
大数据促进社会科学研究创新
2022-03-11 作者:王悠然 来源:中国社会科学网-中国社会科学报

  大数据分析虽源于自然科学研究,但近年来已在社会科学和人文科学研究中发挥了重要作用。3月8日,澳大利亚新南威尔士大学官网刊发了该校兼职教授保罗·X. 麦卡锡(Paul X. McCarthy)和澳大利亚联邦科学与工业研究组织(CSIRO)战略与商业发展专家科林·格里菲斯(Colin Griffith)合著的文章。两位学者在该文中举例介绍了近年来社会科学家采用新一代数据分析工具探索“我们是谁”“我们如何交流”“我们给什么事物赋予价值”等问题得到的收获。

  2009年,美国《科学》杂志刊发了美国东北大学政治学与计算机科学教授大卫·拉泽尔(David Lazer)、美国耶鲁大学社会科学与自然科学教授尼古拉斯·A. 克里斯塔基斯(Nicholas A. Christakis)等15名学者共同撰写的文章《计算社会科学》,探讨了运用大数据分析揭示个体和群体行为模式的潜力。自此,大数据分析被越来越多地应用于社会意义上的“人”的研究。

  麦卡锡和格里菲斯两位学者在研究中发现,人们正在快速地遗忘过去。美国哈佛大学、麻省理工学院等机构的研究人员对1800—2000年出版的519万余本英语图书进行分析后发现,社会对历史事件的注意力持续时间在缩短。以1883年、1910年、1950年这三年为例,1875—2000年出版的英语图书提到这三个年份的频率在降低,每个年份的“半衰期”(受到关注的程度降至最高水平一半所需的时间)越来越短。

  人类文化多样性的地理分布与生物多样性呈正相关性。美国得克萨斯大学圣安东尼奥分校等机构的学者在2020年发表的一项研究显示,人类语言的多样性与生物多样性具有相似的地理分布。距离赤道越近的地方,语言和生物种类越丰富。这可能是因为热带气候造就了更高的生产率和更长的植物寿命,进而为人类和动物提供了更复杂、更具互动性的环境,形成了“多样性带来更多多样性”的良性循环。

  19—21世纪,社会性的语言使用两度出现明显转变。荷兰瓦格宁根大学学者分析了1850—2019年出版的数百万本图书后发现,1850年后,富含情感的词语在书中出现的频率呈系统性下降,基于事实展开论证涉及的词语使用稳步上升。这一趋势在20世纪80年代出现逆转,到2007年左右这一趋势加速:多种语言的图书中,与理性、事实有关的词语使用减少,富含情感的词语激增。这种转向在一定程度上佐证了“后真相”的流行。

  文章还提到,大数据分析有力地推动了网络科学和行为经济学的发展,相关研究成果可作为参考依据,用来提升就业、税收、教育等政策措施的有效性。

  有人认为数据科学催生了“后理论科学”的兴起,对传统的科学研究方法构成挑战。因为相较于传统的假设、预测、测试方法,大数据分析更有助于理解数据与现实之间的关系。麦卡锡和格里菲斯并不认同这种看法。在他们看来,科学理论的稀有性可能被夸大了,而且数据也并非完美无缺。如果数据不完整或存有偏误,在此基础上开展的研究可能会忽略或错误解读重要的人类活动模式,因此必须运用批判性思维和理论加以引导和校准。


友情链接