All Projects → gyunggyung → National-Petition

gyunggyung / National-Petition

Licence: Apache-2.0 license
청와대 국민청원 분석으로 국민의 생각 알아보기 📈🔬

Programming Languages

Jupyter Notebook
11667 projects

Projects that are alternatives of or similar to National-Petition

g2pK
g2pK: g2p module for Korean
Stars: ✭ 137 (+204.44%)
Mutual labels:  korean, konlpy
Android-DarkTheme-CodeLab
코드랩 가이드 문서 👉
Stars: ✭ 18 (-60%)
Mutual labels:  korean
website
라라벨 코리아의 홈페이지 소스입니다
Stars: ✭ 31 (-31.11%)
Mutual labels:  korean
text-classification-transformers
Easy text classification for everyone : Bert based models via Huggingface transformers (KR / EN)
Stars: ✭ 32 (-28.89%)
Mutual labels:  korean
KoParadigm
KoParadigm: Korean Inflectional Paradigm Generator
Stars: ✭ 48 (+6.67%)
Mutual labels:  korean
jungrapht-visualization
visualization and sample code from Java Universal Network Graph ported to use JGraphT models and algorithms
Stars: ✭ 37 (-17.78%)
Mutual labels:  network-visualization
videocloud
Generate word clouds from YouTube videos
Stars: ✭ 14 (-68.89%)
Mutual labels:  wordcloud
unihandecode
unihandecode is a transliteration library to convert all characters/words in Unicode into ASCII alphabet that aware with Language preference priorities
Stars: ✭ 71 (+57.78%)
Mutual labels:  korean
FCH-TTS
A fast Text-to-Speech (TTS) model. Work well for English, Mandarin/Chinese, Japanese, Korean, Russian and Tibetan (so far). 快速语音合成模型,适用于英语、普通话/中文、日语、韩语、俄语和藏语(当前已测试)。
Stars: ✭ 154 (+242.22%)
Mutual labels:  korean
chise.js
A web application to visualize and edit the pathway models represented by SBGN Process Description Notation
Stars: ✭ 15 (-66.67%)
Mutual labels:  network-visualization
KoLM
Korean text normalization and language preparation package for LM in Kaldi-based ASR system
Stars: ✭ 46 (+2.22%)
Mutual labels:  korean
TIL
[2020, 12, 12 ~ ing] Today I Learned
Stars: ✭ 18 (-60%)
Mutual labels:  korean
IreneBot
Irene Bot for Discord in Python
Stars: ✭ 15 (-66.67%)
Mutual labels:  korean
Korean-OCR-Model-Design-based-on-Keras-CNN
Korean OCR Model Design(한글 OCR 모델 설계)
Stars: ✭ 34 (-24.44%)
Mutual labels:  korean
nodejs-support
한국어 형태소 및 구문 분석기의 모음인, KoalaNLP의 Javascript(Node.js) 버전입니다.
Stars: ✭ 81 (+80%)
Mutual labels:  korean
AlgorithmSet
대회용 Algorithm / DS 모음
Stars: ✭ 18 (-60%)
Mutual labels:  korean
VOSviewer-Online
VOSviewer Online is a tool for network visualization. It is a web-based version of VOSviewer, a popular tool for constructing and visualizing bibliometric networks.
Stars: ✭ 44 (-2.22%)
Mutual labels:  network-visualization
PyKOMORAN
(Beta) PyKOMORAN is wrapped KOMORAN in Python using Py4J.
Stars: ✭ 38 (-15.56%)
Mutual labels:  korean
amazfit-bip-kr
Amazfit Bip Korean Firmware and tools for making it
Stars: ✭ 34 (-24.44%)
Mutual labels:  korean
local-government-desktop-addins
A series of ArcGIS Desktop Add-ins used in the ArcGIS for Local Government editing maps.
Stars: ✭ 58 (+28.89%)
Mutual labels:  network-visualization

National-Petition

Stargazers license GitHub stars results data

국민청원 및 제안 목록을 분석하여 국민의 생각을 알아보는 프로젝트

링크를 클릭하시면 더 자세한 분석 결과를 확인할 수 있습니다 : 보고서

📖 Introduction

문재인 정부에서는 국민과의 소통을 통하여 국정에 반영하고자 청와대 홈페이지에 국민소통광장을 마련하였습니다. 국민소통광장의 ‘국민청원 및 제안’에서는 국민 누구나 청원을 올릴 수 있으며, 청와대로부터 답변을 받을 수 있습니다. 2019년 1월 1일 현재, 371,229개의 청원이 있으며, 본 연구에서는 웹 크롤링(web crawling)을 통해 국민이 올린 모든 글을 모두 데이터화하여 분석하여, 국민의 청원을 과학적으로 분석합니다. 특히, 국민 청원 글을 단어 단위로 분석하여, 국민의 관심이 집중되는 키워드와 키워드 간의 관계 네트워크, 더 나아가 분류된 분야별 단위의 키워드를 분석하여, 국민 청원의 단순한 통계가 아닌, 국민의 글 전체를 포괄하는 단어 수준의 분석을 수행합니다.

국민청원 게시판의 모든 글은 청와대의 관리를 받아 청원과 관련되지 않은 글은 삭제되거나, 주제에 맞지 않은 글을 주제에 맞게 재분류됩니다. 이러한 면에서 국민청원 데이터는 국민의 의견을 분석하기에 용이한 장점을 가지고 있습니다. 국민의 생각이 국정에 더 깊이 반영하는 것입니다. 국민청원의 모든 내용을 정부에서 검토하지 않을 것입니다. 하지만 국민들의 뜻을 요약하고 한 눈에 볼 수 있다면 충분히 정부 측에서도 일반 국민들의 뜻을 알 수 있을 것입니다. 또한 4차산업혁명, 인공지능 등이 실질적으로 우리의 삶에 어떠한 영향을 끼칠 수 있는지를 보여주며 대한민국의 미래 발전에 크게 이바지할 기회라고 생각합니다.

인공지능 자연어처리를 통하여 글의 내용을 파악하는 연구는 다양한 분야에서 수행되어 왔으며, 기계학습 및 인공지능의 발전과 함께 많은 응용 분야에 적용되고 있습니다. 그러나 아직까지 자연어처리를 통한 연구는 데이터의 수집이 용이한 특정분야에 한정 돼있으며, 특히 정치 분야에는 아직 활발히 진행되지 못하고 있다. 그러나, 이번 국민소통광장을 통하여 본 연구소는 양질의 데이터를 확보하여, 정치분야의 연구를 통해 국민의 소리에 더 기울일 수 있는 기회를 제공하는 것이 이번 연구의 목적 중 하나라고 할 수 있습니다. 국민 청원 데이터는 첫째 청와대의 관리를 받고 있기에(데이터 전처리) 양질의 데이터 확보의 커다란 장점을 갖고 있습니다. 또한 국민의 추천수를 통해 글의 파급력이나 국민의 의견(동의)을 과학적으로 분석할 수 있는 기회를 제공합니다. 마지막으로 주제별/ 분야별로 청원이 분류되어 있어 분야별 분석을 용이하게 할 뿐 아니라 추후 지도학습 (supervised learning)도 고려할 수 있습니다.

💾 Petitions data analysis

먼저 국민청원을 분석하기 위해 국민청원 사이트를 크롤링한 데이터를 다운로드합니다.

기본적으로 Git이 설치되있다고 가정하겠습니다. 국민청원 분석을 하는 코드를 저장할 하위 폴터에서 아래 코드를 실행시킵니다.

git init
git clone https://github.com/gyunggyung/National-Petition.git

그럼 National-Petition 폴터가 생성될 것입니다. 이제 국민청원 DataNational-Petition 폴더 내부에 넣습니다.

📂 Directory structure

  |-Data-Analysis                          #데이터 분석 및 그래프를 제작
  |  |-images                              #분석 결과 이미지
  |  |  |-graph_*.png                      #여러 그래프 이미지
  |  |  |-num_*.JPG                        #추천수별 이미지
  |  |-Create_a_graph.ipynb                #분야별 추천수 그래프를 만드는 코드
  |  |-Create_a_graph_month.ipynb          #월별 추천수 그래프를 만드는 코드
  |  |-Data_Analysis.ipynb                 #그래프에 필요한 분야별 CSV 파일 제작
  |  |-Data_Analysis_month.ipynb           #그래프에 필요한 월별 CSV 파일 제작
  |  |-README.md                           #데이터 분석 및 그래프 제작을 설명하는 문서
  |  |-participants.csv                    #Data_Analysis에서 만든 CSV 파일
  |  |-participants_index.csv              #Data_Analysis에서 만든 index가 추가 된 CSV 파일
  |  |-participants_month.csv              #Data_Analysis_month에서 만든 CSV 파일
  |  |-participants_month_index.csv        #Data_Analysis_month에서 만든 index가 추가 된 CSV 파일
  |-Data                                   #국민 청원 데이터 크롤링
  |  |-Crawling.ipynb                      #크롤링을 하는 코드
  |  |-Filtering.ipynb                     #추천수를 str형에서 int형으로 변환하는 코드
  |  |-README.md                           #국민 청원 데이터 크롤링을 설명하는 문서
  |  |-briefing2.csv                       #브리핑한 청원을 크롤링한 CSV 파일
  |-Find-similar                           #비슷한 청원 찾기
  |  |-README.md                           #비슷한 청원 찾기를 설명하는 문서
  |-Government-Thinking                    #정부의 생각 알아보기
  |  |-img                                 #브리핑한 청원에 대한 워드클라우드 이미지들
  |  |-Data_Analysis.ipynb                 #분야별 추천수 그래프를 만드는 코드
  |  |-README.md                           #정부의 생각 알아보기를 설명하는 문서
  |  |-Word_Cloud.ipynb                    #브리핑한 청원에 대한 워드클라우드를 만드는 코드
  |  |-briefing.csv                        #브리핑한 청원을 크롤링한 CSV 파일
  |  |-crawling.ipynb                      #브리핑한 청원을 크롤링하는 코드
  |-National-Petition-Important-Keywords   #중요 키워드를 분석하여 국민의 뜻 알아보기
  |  |-README.md                           #중요 키워드를 분석하기를 설명하는 문서
  |-National--Thinking                     #청원의 추천수별 키워드를 보며 국민의 관심사 분석
  |  |-README.md                           #청원의 추천수별 키워드를 보며 국민의 관심사 분석에 대해서 분석을 설명하는 문서
  |  |-Word_Cloud.ipynb                    #추천수별 워드클라우드를 만드는 코드
  |  |-briefing.csv                        #브리핑한 청원을 크롤링한 CSV 파일
  |  |-graph.ipynb                         #어떤 경우에 추천이 많은지를 분석하는 그래프를 제작하는 코드
  |-National-Petition-Network              #국민 청원에서 등장하는 키워드의 네트워크를 제작
  |  |-README.md                           #키워드 네트워크를 설명하는 문서
  |-Word-Cloud                             #분야별, 월별 키워드의 워드클라우드 제작
  |  |-Birthstone                          #월별 워드클라우드 이미지
  |  |  |-*.png                            #해당하는 월에 대한 워드클라우드
  |  |-img                                 #분야별 워드클라우드 이미지
  |  |  |-*.png                            #해당하는 분야에 대한 워드클라우드
  |  |-README.md                           #워드클라우드에 대해 설명하는 문서
  |  |-Word_Cloud.ipynb                    #분야별 워드클라우드를 제작하는 코드
  |  |-Word_Cloud_month.ipynb              #월별 워드클라우드를 제작하는 코드
  |-LICENSE                                #Apache License 2.0
  |-README.md                              #이 문서
  |-REPORT_V1.md                           #국민청원을 분석한 내용
  |-installation_code.ipynb                #필요한 페키지를 설치하는 코드

👨‍💻 System requirements

기본적으로 ANACONDA 환경에 jupyter notebook에서 진행합니다. 이를 위해 ANACONDA 설치 및 환경 설정이 필수적으로 필요합니다.

그리고 주로 KoNLPy를 많이 사용하는데 이를 위해 Java 설치 및 환경설정이 필요합니다. 윈도우 사용자의 경우 KoNLPy 설치 문서를 따라 설치를 하신 후 아래 내용을 진행하시길 바랍니다.

이후 필요한 내용은 Installation Code를 실행하시면 필요한 Package들이 설치됩니다.

👩‍💻 Dependency Build Instructions

Ubuntu User

sudo apt-get update
sudo apt-get install oracle-java8-installer
sudo apt-get install fonts-nanum-coding

All User

pip install nltk
pip install konlpy
pip install wordcloud
pip install urllib
pip install bs4
pip install multiprocessing

📝 Todo list

청원 분석에 대해 제작할 코드와 문서들입니다. (밑에 Emoji를 클릭하면 해당하는 Github page로 이동합니다)

  • 💻 국민청원 게시판 크롤링
  • 💻 국민청원 데이터 분석
  • 💻 국민청원 워드클라우드 제작
  • 💻 국민청원 네트워크 제작
  • 💻 국민의 생각 알아보기
  • 💻 정부의 생각 알아보기
  • 💻 국민청원 중요 키워드 분석
  • 📗 국민청원 게시판 분석 내용
  • 🔨 영어 키워드 찾기
  • 🔨 청원 분류
  • 🔨 비슷한 청원 찾기
  • 🔨 강화된 네트워크 제작
  • 🔒 국민청원과 지지율의 상관관계 찾기
  • 🔒 국민의 뜻과 정부의 생각과 괴리 찾기
  • 🔒 통합 웹 사이트 제작
  • 🔒 해석하는 인공지능 제작
  • 🔒 루머 청원 찾기

🤝 Connect

github : https://github.com/gyunggyung
Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].