【文献阅读】仇恨的道德语言
来自:Fan
Kennedy, B., Golazizian, P., Trager, J., Atari, M., Hoover, J., Mostafazadeh Davani, A., & Dehghani, M. (2023). The (moral) language of hate. PNAS Nexus, 2(7), pgad210. https://doi.org/10.1093/pnasnexus/pgad210
摘要:🔤人类使用语言达到仇恨的目的,煽动暴力和种族灭绝,根据他人的身份恐吓和诽谤他人。尽管人们努力更好地解决公共领域的仇恨语言,但仇恨语言所涉及的心理过程仍不清楚。在这项工作中,我们假设道德和仇恨在语言中是相伴的。在一系列研究中,我们发现使用来自不同背景的语言来支持这一假设的证据,包括在宣传中使用仇恨语言来激发种族灭绝(研究 1)、在跨领域的大型文本语料库中出现的仇恨诽谤。多种语言(研究 2),以及社交媒体平台上的仇恨言论(研究 3)。在针对特定道德问题的事后分析中,我们发现仇恨言论所引发的道德内容类型因语境而异,仇恨宣传和网络仇恨言论中的纯洁语言尤为突出,而跨语言的仇恨诽谤中则引用了忠诚语言。我们的研究结果为理解仇恨语言提供了新的心理学视角,并指出了对道德与仇恨交叉点的进一步研究,对减少网上仇恨言论具有实际意义。🔤
概述
本文指出,人类使用语言来表达仇恨,煽动暴力和种族灭绝,基于身份恐吓和贬低他人。尽管公共领域对仇恨语言的应对有所努力,但仇恨语言背后的心理过程仍不清楚。研究假设道德和仇恨在语言中是共存的。通过一系列研究,作者使用来自不同语境的语言证据来支持这一假设,包括宣传中用于激发种族灭绝的仇恨语言(研究1)、多种语言中的仇恨性俚语(研究2)以及社交媒体平台上的仇恨言论(研究3)。研究发现,通过仇恨言论引发的道德内容类型因语境而异,纯洁性语言在仇恨宣传和网络仇恨言论中较为突出,而忠诚性语言则在跨语言的仇恨性俚语中被唤起。
研究主要探讨了仇恨语言和道德语言之间的关系,特别是在不同语境下这种关系的表现形式。 研究设计包括三个独立的研究,每个研究都聚焦于仇恨语言的不同方面。研究1通过历史文本分析纳粹宣传中的仇恨语言;研究2使用多语言词嵌入分析25种语言中的身份基础性语言;研究3通过大规模分析社交媒体平台上的仇恨言论。研究假设仇恨语言和道德语言在语境中是共存的,并且这种共存性在不同的道德基础上有所不同。
研究使用了自然语言处理(NLP)技术来量化仇恨和道德基础在语言中的表达。研究1分析了纳粹党领导人在1933至1945年间的演讲和文本;研究2使用了多语言词嵌入来分析仇恨性词汇的道德负载;研究3利用机器学习模型预测来自社交媒体平台Gab的仇恨言论和道德基础标签。
研究发现,仇恨语言和道德语言在语言中是共存的,特别是纯洁性和忠诚性语言与仇恨语言有较强的关联。这些发现为理解仇恨语言提供了新的心理学视角,并指出了道德和仇恨之间交叉点的进一步研究方向,对在线减轻仇恨言论具有实际意义。
实验1:历史分析
- 设计与方法:这个研究聚焦于纳粹宣传中的仇恨语言,特别是1933至1945年间纳粹领导人的演讲和文本。研究者收集了英文翻译的纳粹演讲和其他宣传材料,并对这些文本进行了预处理,包括分割句子、清除标点符号,并排除了少于五个词的句子。然后,研究者根据是否包含对内群体(例如“德国人”)或外群体(例如“犹太人”)的引用来分类句子,并排除了同时包含内外群体引用的句子。
- 分析工具:为了量化语言中的道德内容,研究者使用了道德基础词典(Moral Foundations Dictionary, MFD)和分布式字典表示(Distributed Dictionary Representations, DDR)技术。通过计算句子与MFD词表中单词的平均嵌入向量的余弦相似度,来评估每个句子的道德内容。

实验2:跨语言分析
- 设计与方法:这个研究旨在通过分析多种语言中的仇恨性词汇(如侮辱性词汇或绰号),来探究仇恨语言与道德维度的关系。研究者使用了“Weaponized Word”网站的歧视性词汇词典,该词典包含了超过130种语言的7540个仇恨性词汇。
- 分析工具:研究者使用了多语言词嵌入来捕捉和表示单词的语义含义,并通过计算仇恨性词汇与道德术语之间的余弦相似度来量化仇恨性词汇的道德负载。为了进行跨语言比较,研究者使用了由Grave等人训练的多语言词嵌入,这些词嵌入是通过在大量文本语料库(包括维基百科和Common Crawl数据)上训练得到的。

实验3:在线仇恨言论的道德维度
- 设计与方法:这个研究关注社交媒体平台上的仇恨言论,特别是Gab网站上的极端右翼用户的言论。研究者使用了之前研究中生成的专家标注的仇恨言论标签,以及为本研究生成的道德基础标签,来训练机器学习模型,预测Gab网站上的仇恨言论和道德基础标签。
- 分析工具:研究者使用了BERT(Bidirectional Encoder Representations from Transformers)模型进行微调,以适应特定的文本分类任务。此外,还使用了支持向量机(SVM)作为基线方法,与BERT模型的性能进行比较。通过层次逻辑回归分析,研究者评估了仇恨言论与道德标签之间的依赖关系,同时考虑了用户之间的变异性。
这三个实验共同构成了论文的研究框架,旨在从不同角度和不同语境中探索仇恨语言与道德语言的共存性。

实验1的结论:
纳粹文本在总体上具有强烈的道德色彩,并且在提及内群体(如德国人)时特别强调公平性(Fairness)、忠诚性(Loyalty)和权威性(Authority)的道德概念,而在提及外群体(如犹太人)时,则更多地使用与纯洁性(Purity)相关的语言。这一发现表明,历史上的宣传运动中存在道德与仇恨语言的联系,并且通过对内群体的忠诚性和权威性的强调,以及对外群体的纯洁性贬低,来动员和巩固仇恨情绪。
实验2的结论:
跨语言分析显示,仇恨性词汇在不同语言中普遍与忠诚性(Loyalty)道德维度有较高的关联。此外,当仇恨性词汇针对的是种族、国籍、宗教和性取向等特定社会群体时,这种与忠诚性语言的关联更为显著。这一发现与实验1中纳粹宣传中纯洁性语言与仇恨言论的强烈关联形成了对比,表明仇恨语言在不同文化和语境中可能与不同的道德基础相关联。
实验3的结论:
在线仇恨言论分析发现,当帖子中出现纯洁性(Purity)相关的语言时,该帖子包含攻击人类尊严(Human Degradation)的可能性增加了14倍。而当帖子中出现关爱(Care)违反的语言时,呼吁暴力(Calls for Violence)的可能性显著增加。这表明,社交媒体上的仇恨言论与道德语言紧密相关,尤其是纯洁性和关爱违反的语言与仇恨言论的表达有很强的联系。这些结果支持了道德和仇恨在语言中共存的更广泛假设,并指出了纯洁性和忠诚性语言在仇恨言论中的核心作用。
主要作者
Brendan Kennedy

I earned my PhD in Computer Science in May, 2022 from the University of Southern California, where I developed and applied expertise in Natural Language Processing (NLP), Machine Learning (ML), and statistics to projects in Computational Social Science, interpretability, and bias research in NLP. Most recently, I was employed as a ML engineer in Applied Research at Twitter, within the Content Understanding Research team, before I was laid off in November 2022.
Experienced researcher in applied Natural Language Processing (NLP), Machine Learning (ML), and data science, with recent work experience in ML engineering. Skilled with: Python and Python ML frameworks including Tensorflow, Keras, PyTorch, and scikit-learn, as well as Python libraries for data manipulation, modeling, and visualization. Experienced with R and associated statistical and visualization tools. Skilled communicator, writer, and public speaker.