各省、地级市人民网政府留言板数据(2011-2023)
人民网《领导留言板》是人民日报社人民网为中央部委和地方各级党委政府主要负责同志搭建的网上群众工作平台,自 2006 年创办至2023年底,超 380 万件群众诉求得到回复办理。

以此为前提,本次推出地方留言板文本数据,问答文本内容全获取,时间跨度近10余年,数据量级过百万,可根据关键词、地区、年份等多种指标搜索,极具学术研究价值。
1
数据简介
数据来源:人民网地方领导留言板
时间范围:2011-2023.12
文件格式:csv,包括2011-2023合并版和分年份版(见下图)

字段说明:
'留言标题', '留言领域', '留言类型', '留言时间', '留言人', '留言内容', '状态', '留言对象', '省份', '城市', '年份', '月份', '日', '回复内容', '回复时间', '回复机构', '解决程度评分', '办理态度评分', '办理速度评分'

注:网站经历过改版,'解决程度评分', '办理态度评分', '办理速度评分'三个字段在2020年前并不存在。
2
数据概览
如可以查看各个领域留言数量:

或各个年份留言数

还有许多方法可以对这份数据进行分析,本号将在近期推出留言板数据清洗及分析代码和课程,凡参与此次众筹的用户可在后续推出的基于此文本数据的词频分析及过程辅导享有折扣价格。
说明:对比网站可以看出,最终数据量相比网站总留言数少5%左右,这是由于爬虫运行的时间点、IP被封、请求失败、文件编码(格式)问题等问题导致。实际上,以Python为典型代表的大规模数据挖掘,其核心原则是确保获得 Earnings(规模带来的信息增益) >> Loss(数据质量产生的损失) 。只要满足这个条件,就可以进行文本分析。本数据总量达360多万条,完全可以满足分析需要。
【注】获取详情公众号:Paper数据分析
