社会关系的离散度与情侣关系——对Facebook上人际关系状态的网络分析[译]
摘要(Abstract)
在分析在线社会网络时,一个重要的工作就是识别那些在单个个体的邻居网络中有着强社交关系的关键人物。在本文中,我们从情侣这一强关系入手研究这个问题。我们的研究仅仅围绕着这个问题展开:给定一个人与他所有的朋友之间的关系网络,是否可以仅从网络的结构角度,从这些朋友中识别出谁和他是情侣关系?利用Facebook用户产生的大量样本数据,我们发现这个想法可以实现,且识别精度较高。这其中的关键在于,我们引入了一个新的概念:离散度(dispersion),它表征了两个人的共同好友之间缺乏相连关系的程度。实验结果为识别在线应用中那些结构重要性高的人群提供了方法,也给出了现有社交关系强度理论的一个拓展的思路。
简介(Introduction)
在社会网络中,由某个个体及与其相连的邻居节点构成的邻居网络中包含的信息在很多领域的应用中得以展现,例如社会支持(social support)和就业机会(professional opportunities)。现在,人们越来越依赖于社交网络去经营其生活的方方面面,因此他们的线上社交网所包含的信息越来越多,复杂性也随之增强。
宏观上来说,一个人社交网络中的邻居包含了多种多样的关系,包括家庭关系、同事关系、长期的朋友关系,一面之交,情侣关系等等。因此分析这样的社会网络关系的关键就在于利用现有的数据去认知这丰富多样的社交关系。如果掌握了这样一套行之有效的方法,可以在处理线上人际关系上有诸多应用,如个性化的内容推荐,提高线上社交关系的凝聚力等等。
关系强度(Tie Strength)
关系强度是描述一个人与其他人的社交关系的一个重要维度。关系强度非正式地反映了一个人与他人的亲密程度。它上至与亲密朋友之间的强关系,下到与更多一面之交的弱关系。之前在社会学领域已经有对关系强度和他们在社会网络中的结构属性的研究。强关系通常“嵌入”在网络中,与之相关的大量节点之间都是朋友关系,并且经常同时出现大量分享等互动行为。相反的,弱关系通常出现在少量的朋友关系之间,它往往在网络中两个不同部分之间搭起“桥梁”。
与理解强关系相连的一个基本问题就是,通过一个人的社交网络中的潜在结构来认识他的社交网络中最重要的那些人。那么在一个人的强关系中如何定义其结构特征,我们又该如何认识它们呢?解决好这个问题,将大大地帮助个人组织好其线上关系,同时帮助我们以更广阔的视角观察亲密关系的社交网络中的结构。
近来,基于E-mail、手机通话以及社交媒体等数据,已经有一些研究开发了一些分析和估计在线社交关系强度的方法。在这些研究中,最核心的结构性特征是“嵌入度”(embeddedness),它是两个人之间共同好友的数量,通常随着关系强度的增长而增长。事实上,嵌入度和关系强度如此紧密的联系在一起,这使得我们反思,除了嵌入度,是否还有其他的结构度量,能够更准确地描述特定的强关系。
浪漫关系(Romantic Relationships)
我们的工作为亲密关系(如情侣和配偶关系)提出了一种新的基于网络的特征描述。我们研究这样一种亲密关系基于如下的考虑。
从一个现实的角度看,在一个人从青春期到老年的一生的社交过程中,浪漫关系是一种仅有的非一般的强社交关系。它对于一个人日常的行为以及在社交媒体上的表现均有重要的影响。
从方法论的角度来说,这种浪漫关系几乎是一种最强的强关系,但对于这样一种关系,依然没有清楚的结构理论能够基于“嵌入度”对它进行充分的描述。亦或者它们是否本身就拥有属于浪漫关系本身的独特的结构属性。
我们的核心发现在于,嵌入度确实是一种较弱的描述浪漫关系的办法,而我们所提出的离散度(dispersion)相比之下则更加有效。我们对离散度的测量不仅仅基于两个人共同好友的数量,更关注两个人共同好友之间的网络结构,即如果两个人的共同好友之间的连接程度较低,则他们俩之间具有较高的离散度。
基于大量Facebook用户数据(在用户信息中标记着是否有情侣关系)构建的随机样本,我们发现,在识别浪漫关系的问题上,与使用嵌入度相比,采用离散度作为衡量标准,可以获得两倍的精确度。事实上,对于已婚的Facebook用户,我们这种基于网络结构的测算方法,比一个使用机器学习方法,加入诸多用户交互的数据记录作为属性(包括消息、评论、页面浏览量、在事件和照片中同时出现的频率等)构建的复杂分类器的分类效果要好。更进一步地,通过将离散度和这些用户交互特征相结合,可以取得更高的识别精度。
本文的主要贡献如下:
1、 我们提出一个新的网络测度,离散度,用来估算关系强度。现有的对关系强度的分析大多依赖于嵌入度,而离散度的引入给出了一种新方法和思路,用于测算关系强度及其在线上领域的分类问题。
2、 基于我们对浪漫关系对用户在社交网络中行为的影响的理解,我们提供一个新的实质性的基于网络结构来描述浪漫关系的方法。
3、 基于这个特性,我们变化不同的条件和数量进行灵敏度分析。例如,我们发现,通过网络结构识别出来的结果有显著的性别差异,此外,通过这种方式识别出来的情感关系更稳定更坚固。
同样重要的是要描绘我们结果的范围。我们的方法分析在线社会浪漫的伙伴关系,主要是通过它们对网络结构的影响,也因此可以从网络结构特征反过来认识这种浪漫关系。因此,一种潜在的办法是结合其他关于这类关系在线上如何表达的观点,完整地描绘出人们在社会化媒体上的活动规律。
在分析在线社会网络时,一个重要的工作就是识别那些在单个个体的邻居网络中有着强社交关系的关键人物。在本文中,我们从情侣这一强关系入手研究这个问题。我们的研究仅仅围绕着这个问题展开:给定一个人与他所有的朋友之间的关系网络,是否可以仅从网络的结构角度,从这些朋友中识别出谁和他是情侣关系?利用Facebook用户产生的大量样本数据,我们发现这个想法可以实现,且识别精度较高。这其中的关键在于,我们引入了一个新的概念:离散度(dispersion),它表征了两个人的共同好友之间缺乏相连关系的程度。实验结果为识别在线应用中那些结构重要性高的人群提供了方法,也给出了现有社交关系强度理论的一个拓展的思路。
简介(Introduction)
在社会网络中,由某个个体及与其相连的邻居节点构成的邻居网络中包含的信息在很多领域的应用中得以展现,例如社会支持(social support)和就业机会(professional opportunities)。现在,人们越来越依赖于社交网络去经营其生活的方方面面,因此他们的线上社交网所包含的信息越来越多,复杂性也随之增强。
宏观上来说,一个人社交网络中的邻居包含了多种多样的关系,包括家庭关系、同事关系、长期的朋友关系,一面之交,情侣关系等等。因此分析这样的社会网络关系的关键就在于利用现有的数据去认知这丰富多样的社交关系。如果掌握了这样一套行之有效的方法,可以在处理线上人际关系上有诸多应用,如个性化的内容推荐,提高线上社交关系的凝聚力等等。
关系强度(Tie Strength)
关系强度是描述一个人与其他人的社交关系的一个重要维度。关系强度非正式地反映了一个人与他人的亲密程度。它上至与亲密朋友之间的强关系,下到与更多一面之交的弱关系。之前在社会学领域已经有对关系强度和他们在社会网络中的结构属性的研究。强关系通常“嵌入”在网络中,与之相关的大量节点之间都是朋友关系,并且经常同时出现大量分享等互动行为。相反的,弱关系通常出现在少量的朋友关系之间,它往往在网络中两个不同部分之间搭起“桥梁”。
与理解强关系相连的一个基本问题就是,通过一个人的社交网络中的潜在结构来认识他的社交网络中最重要的那些人。那么在一个人的强关系中如何定义其结构特征,我们又该如何认识它们呢?解决好这个问题,将大大地帮助个人组织好其线上关系,同时帮助我们以更广阔的视角观察亲密关系的社交网络中的结构。
近来,基于E-mail、手机通话以及社交媒体等数据,已经有一些研究开发了一些分析和估计在线社交关系强度的方法。在这些研究中,最核心的结构性特征是“嵌入度”(embeddedness),它是两个人之间共同好友的数量,通常随着关系强度的增长而增长。事实上,嵌入度和关系强度如此紧密的联系在一起,这使得我们反思,除了嵌入度,是否还有其他的结构度量,能够更准确地描述特定的强关系。
浪漫关系(Romantic Relationships)
我们的工作为亲密关系(如情侣和配偶关系)提出了一种新的基于网络的特征描述。我们研究这样一种亲密关系基于如下的考虑。
从一个现实的角度看,在一个人从青春期到老年的一生的社交过程中,浪漫关系是一种仅有的非一般的强社交关系。它对于一个人日常的行为以及在社交媒体上的表现均有重要的影响。
从方法论的角度来说,这种浪漫关系几乎是一种最强的强关系,但对于这样一种关系,依然没有清楚的结构理论能够基于“嵌入度”对它进行充分的描述。亦或者它们是否本身就拥有属于浪漫关系本身的独特的结构属性。
我们的核心发现在于,嵌入度确实是一种较弱的描述浪漫关系的办法,而我们所提出的离散度(dispersion)相比之下则更加有效。我们对离散度的测量不仅仅基于两个人共同好友的数量,更关注两个人共同好友之间的网络结构,即如果两个人的共同好友之间的连接程度较低,则他们俩之间具有较高的离散度。
基于大量Facebook用户数据(在用户信息中标记着是否有情侣关系)构建的随机样本,我们发现,在识别浪漫关系的问题上,与使用嵌入度相比,采用离散度作为衡量标准,可以获得两倍的精确度。事实上,对于已婚的Facebook用户,我们这种基于网络结构的测算方法,比一个使用机器学习方法,加入诸多用户交互的数据记录作为属性(包括消息、评论、页面浏览量、在事件和照片中同时出现的频率等)构建的复杂分类器的分类效果要好。更进一步地,通过将离散度和这些用户交互特征相结合,可以取得更高的识别精度。
本文的主要贡献如下:
1、 我们提出一个新的网络测度,离散度,用来估算关系强度。现有的对关系强度的分析大多依赖于嵌入度,而离散度的引入给出了一种新方法和思路,用于测算关系强度及其在线上领域的分类问题。
2、 基于我们对浪漫关系对用户在社交网络中行为的影响的理解,我们提供一个新的实质性的基于网络结构来描述浪漫关系的方法。
3、 基于这个特性,我们变化不同的条件和数量进行灵敏度分析。例如,我们发现,通过网络结构识别出来的结果有显著的性别差异,此外,通过这种方式识别出来的情感关系更稳定更坚固。
同样重要的是要描绘我们结果的范围。我们的方法分析在线社会浪漫的伙伴关系,主要是通过它们对网络结构的影响,也因此可以从网络结构特征反过来认识这种浪漫关系。因此,一种潜在的办法是结合其他关于这类关系在线上如何表达的观点,完整地描绘出人们在社会化媒体上的活动规律。
-
毛毛 赞了这篇日记 2017-08-25 01:19:06