使用 Python Jieba 分析政府立法院公布法條,質詢內容,將出現的字詞頻率做排序,再使用 worldcloud 生成文字雲展示,希望能夠推敲出什麼東西。
想法來自於這一篇的應用:word-cloud-文字雲-分析財政預算案,分析政府編列之財政預算內容,推敲出政策走向
文字雲輸出畫面範例展示:
立法委員與官員質詢內容關鍵字
質詢字詞內容字詞頻率
國民法官法關鍵字:
109國防預算案關鍵字:
中華民國108年度 中央政府總預算案
中華民國109年度 中央政府總預算案
引用文字來源:
https://www.dgbas.gov.tw/ct.asp?xItem=26269&CtNode=5389&mp=1
可以發現 109 跟 108 其實差異並不大
109 總預算最高頻率用詞:
'基金': 307次
'經濟': 155,
'建設': 152,
'億': 1033,
'前瞻': 35,
大概了解到財政預算案的核心是
以基金,建設經濟為主大多以“億”為單位計算
蠻意外前瞻計劃沒有提太多次,可能用別的詞替換了
所以,來對比二十年前的預算案
可惜最早的檔案 83 年度左右皆為翻攝檔案
無法快速擷取文字所以以88那年的總預算表為例子
可以推估經費有使用到 萬元 字詞居多
補助、支出等字詞 明顯大於收入字詞
再透過其他資料分析可得知 1997年 亞洲金融風暴後
李登輝時期台灣的應對政策與成效
參考資料 :
斷詞與文字雲教學課堂簡報 國立臺中教育大學數位內容科技學系 吳智鴻教授.
https://yanwei-liu.medium.com/python自然語言處理-三-word-cloud文字雲-6da1eb3b7bef
行政院主計總處委託研究 主計資料大數據分析之研究:
https://www.dgbas.gov.tw/public/Data/839113538OM2RMIO7.pdf
立法院開放 API
委員及法案議題相關數據資料庫
最新公佈法律:
番外篇: Google 新聞關鍵字製作文字雲
這邊 👉 : Python-爬取新聞製作文字雲