social network analysis of 3377 case:web mining‘s application
一年以前我分析过3377的文本,从此这个大的帖子就一直存在电脑里,时不时地拿出来摆弄下。但苦于帖子太长实在是没有精力去分析。于是做过一点发帖数的统计,发现是一个标准的幂律。而对于帖子内容的挖掘则一直没有进行下去。
今年暑假武汉大学的沈阳老师把他们的Rost content mining软件弄好了,放在网上试用,但一直没有引起我的注意。今天早上碰巧随便摆弄了下,发现其中的功能分析模块中的社会网络和语义网络分析模块不错。于是开始用它来分析了几个微博客的帖子。
1、文本分析
下午的时候,重新用它跑了3377的总数据,数据有点大,软件有点吃不消。不过还是弄了出来。
仅保留最核心节点的图片
这里面很清晰是的是几个主要的人物关系:小三、前妻、房子、老公、妻子、男人、女人。天涯成了一个"朋友"帮助“人家”解决“幸福”问题的地方。
例2,我分析了一个双子座的星座帖子,如下:
2、微博客内容抓取及分析
抓取的我的新浪微博的语义网络
我的微博客语义网络仅保留核心节点
可见我自己写的微博客不多,除了星座帖外,只是零零散散的关于毕业、北大和齐泽克的文字。
3、生成标签云
毕业论文后记处理
分词—— 统计词频 ——生成标签云
今年暑假武汉大学的沈阳老师把他们的Rost content mining软件弄好了,放在网上试用,但一直没有引起我的注意。今天早上碰巧随便摆弄了下,发现其中的功能分析模块中的社会网络和语义网络分析模块不错。于是开始用它来分析了几个微博客的帖子。
1、文本分析
下午的时候,重新用它跑了3377的总数据,数据有点大,软件有点吃不消。不过还是弄了出来。
![]() |
netdraw raw pic |
仅保留最核心节点的图片
![]() |
reduced pic |
这里面很清晰是的是几个主要的人物关系:小三、前妻、房子、老公、妻子、男人、女人。天涯成了一个"朋友"帮助“人家”解决“幸福”问题的地方。
例2,我分析了一个双子座的星座帖子,如下:
![]() |
双子座星座帖 |
2、微博客内容抓取及分析
抓取的我的新浪微博的语义网络
![]() |
my sina miroblog semantic network |
我的微博客语义网络仅保留核心节点
![]() |
my reduced sina microblog semantic network |
可见我自己写的微博客不多,除了星座帖外,只是零零散散的关于毕业、北大和齐泽克的文字。
3、生成标签云
毕业论文后记处理
分词—— 统计词频 ——生成标签云
![]() |
毕业论文后记分词统计词频后绘制的标签云 |