목록Study/R (2)
컴공돌이의 취미 블로그
[R]. 연관 분석(Association Rules)오늘은 지난 번에 만들어 보았던 워드 클라우드(Word Cloud)에서 사용했던 MC the MAX 노래 가사를 이용한 연관 분석을 만들어 보고자 한다.이글 또한 나름 이리저리 검색해보고 최선을 다해서 만든 코드이기 때문에 다른 사람들한테도 도움이 되었으면 하는 생각에서 작성해 보게 되었다. 제일 먼저 연관 분석에서 사용할 데이터는 이전 워드 클라우드 만들때 사용했던 MC the MAX 의 1집 가사들이지만 약간의 수정이 필요하다. 왜냐하면 연관 분석은 보통 하나의 글마다 나오는 단어를 분석한 후 어떠한 단어들이 연계되어서 자주 나오는가를 분석하는 것이기 때문에 이전 데이터로 만들어 보게 된다면 한 줄마다 단어의 연관을 분석하여 결과로 아무것도 나오지 ..
[R]. 워드 클라우드 (Word Cloud) 오늘은 R과 R Studio를 사용해서 데이터 분석의 입문(?) 단계라고도 생각되는 워드클라우드를 만들어 보고자 한다.이리저리 검색해 보고 나름 최선을 다해서 만든 코드이기 때문에 다른 사람들한테도 도움이 되었으면 하는 생각에서 글을 작성해 보게 되었다. 맨 처음 고민했던 것은 어떠한 문서에 들어있는 단어들을 분석하여 워드 클라우드를 실습해볼까 였다.그래서 이것 저것 고민하던중 한가지 재미있는 생각이 들어서 바로 실행해보기로 마음 먹었다. 내가 생각한 것은 바로 '노래 가사' 였다.개인적으로 MC the MAX 를 매우 좋아했기 때문에 MC the MAX의 노래를 한번 분석해 보면 재미있을 것 같아서 앨범들 중 1집을 선택하였다.네이버 뮤직에 들어가서 MC ..