Word Cloud 文字雲分析政府編列法條


Posted by 大學生 on 2020-10-31

使用 Python Jieba 分析政府立法院公布法條,質詢內容,將出現的字詞頻率做排序,再使用 worldcloud 生成文字雲展示,希望能夠推敲出什麼東西。

想法來自於這一篇的應用:word-cloud-文字雲-分析財政預算案,分析政府編列之財政預算內容,推敲出政策走向

文字雲輸出畫面範例展示:

立法委員與官員質詢內容關鍵字

質詢字詞內容字詞頻率

國民法官法關鍵字:

109國防預算案關鍵字:

中華民國108年度 中央政府總預算案

中華民國109年度 中央政府總預算案

引用文字來源:
https://www.dgbas.gov.tw/ct.asp?xItem=26269&CtNode=5389&mp=1

可以發現 109 跟 108 其實差異並不大


109 總預算最高頻率用詞:
'基金': 307次
'經濟': 155,
'建設': 152,
'億': 1033,
'前瞻': 35,

大概了解到財政預算案的核心是
以基金,建設經濟為主大多以“億”為單位計算

蠻意外前瞻計劃沒有提太多次,可能用別的詞替換了

所以,來對比二十年前的預算案
可惜最早的檔案 83 年度左右皆為翻攝檔案
無法快速擷取文字所以以88那年的總預算表為例子
可以推估經費有使用到 萬元 字詞居多
補助、支出等字詞 明顯大於收入字詞
再透過其他資料分析可得知 1997年 亞洲金融風暴後
李登輝時期台灣的應對政策與成效

參考資料 :

斷詞與文字雲教學課堂簡報 國立臺中教育大學數位內容科技學系 吳智鴻教授.

https://yanwei-liu.medium.com/python自然語言處理-三-word-cloud文字雲-6da1eb3b7bef

行政院主計總處委託研究 主計資料大數據分析之研究:
https://www.dgbas.gov.tw/public/Data/839113538OM2RMIO7.pdf

立法院開放 API

https://data.ly.gov.tw

委員及法案議題相關數據資料庫

立法院國會圖書館

最新公佈法律:

https://lis.ly.gov.tw/lglawc/lglawkm

番外篇: Google 新聞關鍵字製作文字雲

這邊 👉 : Python-爬取新聞製作文字雲


#Python #文字雲 #wordcloud #jieba #斷詞 #爬蟲 #關鍵字







Related Posts

用 Nest.js 開發 API 吧 (八) - CRUD

用 Nest.js 開發 API 吧 (八) - CRUD

[TensorFlow Certification Day4] TensorFlow的人工智能, 機器學習和深度學習簡介 Week4

[TensorFlow Certification Day4] TensorFlow的人工智能, 機器學習和深度學習簡介 Week4

判斷式 用法

判斷式 用法


Comments