MACE's life blog
텍스트마이닝 - 다빈도 출현어휘 추출 본문
반응형
- 프로젝트명 : 서울 정보소통광장 신년 콘텐츠 - 키워드로 본 2016년 박원순 서울시장 신년사
- 담당업무 : 데이터 분석(R)
- 프로젝트 기간 : 2016.01.04
- 사용툴 : R
서울시장의 신년사 텍스트를 분석하여 다빈도 출현 어휘를 추출하면, 어떤 부분을 강조하고 있는지 보다 쉽게 알수 있고, WordCloud를 활용하면 인포그래픽과 같이 사용자에게 보다 쉽게 접근할 수 있다고 생각했다.
신년사 텍스트는 서울시 온라인 매체에서 스크랩하였으며, R을 활용해서 텍스트마이닝과 워드클라우드 아웃풋을 출력했다. 포토샵으로는 동그란 원형으로 마스킹만 적용했다.
* 작업원본: http://opengov.seoul.go.kr/issue/7147724
반응형
'My work' 카테고리의 다른 글
정보소통광장·문서공개시스템 기능보완 및 유지관리 사업 (0) | 2014.04.30 |
---|---|
서울시 정보소통광장 (0) | 2013.12.08 |
Comments