文章摘要
Iceooh
该数据统计了2002-2023年各省政府工作报告中与环境规制相关的词频信息。通过Python的jieba库对报告进行分词处理,分别以精确模式和全模式统计词频,并去除停顿词。共涉及24个指标,包括文本长度、词频、环保词汇的统计(如环境保护、减排、污染、能耗等)。该数据为面板数据,包含行政区划代码、年份、城市等基础信息,以及文本长度和15个环境规制相关词频明细,为分析地方政府在环境保护方面的政策演变提供依据。
此内容根据文章生成,并经过人工审核,仅用于文章内容的解释与总结

一、数据介绍

数据名称 N1160-地级市环境规制力度
数据内容 数据结果+参考文献
时间跨度 2002-2023年286个地级市2002年仅四个直辖市
数据来源 各省份政府工作报告
N1160-各地级市环境规制力度2002-2023年数据Excel表格15文本词频_预览图

二、指标说明

该数据统计了2002-2023年环境规制相关的15个词频明细、文本长度、文本词频总数
数据来源于各省份政府工作报告

统计方法

根据各省份政府工作报告,参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021)三人的做法、如图1/2/3,借助Python软件对政府工作报告进行分词处理,分别统计了省级政府工作报告中与环境规制相关的关键词的词频。

从地方政府网爬取工作报告原始文件,将报告文本整理为面板数据。
去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频

精确模式:’推荐’, ‘冰屋’, ‘数据网’
全模式:’推荐’, ‘冰屋’, ‘屋数’, ‘数据网’
保留中英文、数字、标点符号,利用正则表达式统计15个词频,
保留中英文、数字,统计全文文本总长度,
保存文本词频总数、15个词频明细、文本长度

一共24个指标,如下

行政区划代码 年份 城市
所属省份 文本总长度 仅中英文-文本总长度
文本总词频-全模式 文本总词频-精确模式 环保词频和
环境保护 环保 污染
能耗 减排 排污
生态 绿色 低碳
空气 化学需氧量 二氧化硫
二氧化碳 PM10 PM2.5

三、内容预览

N1160-各地级市环境规制力度2002-2023年数据Excel表格15文本词频_详情_2N1160-各地级市环境规制力度2002-2023年数据Excel表格15文本词频_详情_3N1160-各地级市环境规制力度2002-2023年数据Excel表格15文本词频_详情_4N1160-各地级市环境规制力度2002-2023年数据Excel表格15文本词频_详情_5N1160-各地级市环境规制力度2002-2023年数据Excel表格15文本词频_详情_6N1160-各地级市环境规制力度2002-2023年数据Excel表格15文本词频_详情_7N1160-各地级市环境规制力度2002-2023年数据Excel表格15文本词频_详情_8
声明:本站提供的一切资料是供学习研究之用,如用于商业用途,请购买正版。数据来自各省、市、县统计局公开信息及网友共享资源,仅作学术交流使用,请勿用于商业用途。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。