如何分析一个公众号的数据,以记忆承载/深圳卫健委的阅读数点赞数在看数/留言数为例
之前分享过文章一键批量下载微信公众号文章内容/图片/封面/视频/音频,支持导出html和pdf格式,包含阅读数/点赞数/在看数/留言数 ,于是顺便研究下记忆承载这个号,这里抓取了2021年的所有文章,我放博客上了https://blog-susheng.vercel.app/ ,文章末尾点击阅读原文在线查看:

抓取的excel数据包含文章标题,日期,链接,封面图,阅读数,在看数和点赞数,留言数忘了抓取,下次补上:

接下来用python分析这个号的数据:
wechat=pd.read_csv('2021记忆承载公众号历史文章列表.csv',encoding='utf-8')
文章数量331篇
len(wechat)
文章作者前5,看数据都是碧树西风一个人。
>>> wechat.文章作者.value_counts().sort_values(ascending=False).head(5) 碧树西风 331 Name: 文章作者, dtype: int64
10万+文章只有一篇:
>>> wechat[wechat.阅读数>100000] 文章日期 文章标题 文章链接 ... 阅读数 在 看数 点赞数 139 2021-08-08 xxx http://mp.weixin.qq.com/s?__biz=MzU0MjYwNDU2Mw... ... 100001 825 1742 [1 rows x 12 columns]
阅读数总数8191166
>>> wechat.阅读数.sum() 8191166
阅读数排行前10的文章:>>> wechat[['文章日期','文章标题','文章链接','阅读数']].sort_values(by='阅读数', ascending=False).head(10)

阅读数点赞数在看数平均值
>>> wechat[['阅读数','点赞数','在看数']].mean() 阅读数 24746.725076 点赞数 622.480363 在看数 260.145015 dtype: float64
头条的阅读数点赞数在看数平均值
>>> wechat[wechat.文章位置 == 1][['阅读数','点赞数','在看数']].mean() 阅读数 28413.407407 点赞数 667.126984 在看数 276.148148 dtype: float64
头条和次条数分别为189和142:
wechat.groupby('文章位置',as_index=False).agg({"在看数":'count'}).sort_values(by=['在看数'],ascending=False).head(5) >>> wechat.文章位置.value_counts().sort_values(ascending=False).head(5) 1 189 2 142 Name: 文章位置, dtype: int64 wechat.query('文章位置 == 2')
原创文章331篇,比例100%
wechat.groupby('是否原创')['在看数'].count().sort_values(ascending=False).head(5) wechat.groupby('是否原创').agg({"在看数":'count'}).sort_values(by=['在看数'],ascending=False).head(5) >>> wechat.是否原创.value_counts().sort_values(ascending=False).head(5) 是 331 Name: 是否原创, dtype: int64
有原文链接数的文章为0
>>> wechat[wechat["原文链接"].notnull()] Empty DataFrame
上半年和下半年的文章数
date='2021-07-01' >>> len(wechat.query(f'文章日期 > "{date}"')) 173
还有另外一个号深圳卫健委,之前也分析过听说公众号深圳卫健委被网友投诉尺度大,我抓取了所有文章标题和阅读数分析了下

这个号每天发好几条,阅读数基本都10万+,有1000多篇,小于10万+的才100多篇。阅读数点赞数在看数平均值都挺高的:

>>> wechat[['阅读数','点赞数','在看数']].mean() 阅读数 97821.878414 点赞数 1192.307489 在看数 677.061674 dtype: float64
都不是原创。
>>> wechat.groupby('是否原创')['在看数'].count().sort_values(ascending=False).head(5) 是否原创 否 1135 Name: 在看数, dtype: int64
还有哪些数据值得看?
如果文章对你有帮助还请 点赞/在看/分享
三连支持下, 感谢各位!
公众号苏生不惑

还没人赞这篇日记