Word Cloud 文字雲應用:分析社會公共議題


Posted by 大學生 on 2020-10-31

人工智慧課堂專題作業:

2023更新:可使用 ChatGPT 生成程式碼案例並加以修改,圖片遮罩部分可用 AI 生成圖片使主題更佳切合。

學習資料:斷詞與文字雲教學課堂簡報 吳智鴻教授. 國立臺中教育大學數位內容科技學系
https://yanwei-liu.medium.com/python自然語言處理-三-word-cloud文字雲-6da1eb3b7bef

分析字詞頻率,使用 worldcloud 生成文字雲

想法:能即時更新立法院相關討論議題,並以視覺化呈現關鍵字
透過爬蟲解析文字斷詞來判別哪個議題最常被討論,透過質詢內容萃取關鍵字,可得知大眾注重之議題。以及政府編列之 財政 國防 教育 交通 總預算內容,判斷該時期政府核心內容,其歷屆變化及未來趨勢,另外查到各政黨選舉相關紀錄,可以分析選區各黨派當選次數紀錄,可應用於政黨佈局策略。

想法來自於這一篇的應用:
word-cloud-文字雲-分析財政預算案

課程教學:人工智慧Python斷詞與文字雲教學jieba,wordcloud套件

文字雲輸出畫面範例展示:

立法委員與官員質詢內容關鍵字

某X借貸案事件質詢

國民法官法關鍵字:

109國防預算案關鍵字:

中華民國108年度 中央政府總預算案

中華民國109年度 中央政府總預算案

引用文字來源:
https://www.dgbas.gov.tw/ct.asp?xItem=26269&CtNode=5389&mp=1

可以發現 109 跟 108 其實差異並不大


109 總預算最高頻率用詞:
'基金': 307次
'經濟': 155,
'建設': 152,
'億': 1033,
'前瞻': 35,

大概了解到財政預算案的核心是
以基金,建設經濟為主大多以“億”為單位計算

蠻意外前瞻計劃沒有提太多次,可能用別的詞替換了

所以,來對比二十年前的預算案
可惜最早的檔案 83年度左右皆為翻攝檔案
無法快速擷取文字
所以挑了 88年剛出生那年的總預算表
可以推估經費有使用到 萬元居多
補助、支出等字詞 明顯大於收入字詞
再透過其他資料分析可得知 1997年 亞洲金融風暴後
李登輝時期台灣的應對政策與成效

參考資料 :

行政院主計總處委託研究 主計資料大數據分析之研究:
https://www.dgbas.gov.tw/public/Data/839113538OM2RMIO7.pdf

立法院開放 API

https://data.ly.gov.tw

委員及法案議題相關數據資料庫

立法院國會圖書館

最新公佈法律:

https://lis.ly.gov.tw/lglawc/lglawkm

有些格式是 PDF 若要及時取得線上資料要另外載 PDF PYTHON 套件

(以下主題當初是有一部分因為感覺民眾不是對政治冷漠就是只熱衷於選舉而忽略平常質詢帶出的政策面向而因此誕生此想法,不過這種吃力不討好又扯到政治的應用....看到四大公投變成政黨對決...就...期待未來的政府能夠推廣這一塊讓大眾在日常中就能了解相關議題)

番外篇: Google 新聞關鍵字製作文字雲

自動爬取文章內容製作文字雲:
這邊 👉 : Python-爬取新聞製作文字雲


#Python #文字雲 #wordcloud #jieba #斷詞 #爬蟲 #關鍵字







Related Posts

reverse engineer 1.1

reverse engineer 1.1

Sass/SCSS 簡明入門教學

Sass/SCSS 簡明入門教學

一次搞懂 var、let、const 三種變數

一次搞懂 var、let、const 三種變數


Comments