Do it! 쉽게 배우는 R 텍스트 마이닝 pdf 다운로드를 무료로 제공합니다 4년간 R 데이터 분야 1위 도서 저자의 후속작 ‘텍스트 마이닝’ 도서 출간! 형태소 분석, 긍정·부정 분위기 분석, 연관 단어 분석, 시각화 모두 내 손으로!
관련 책 pdf 모음
책 소개
봉준호 감독의 영화 〈기생충〉이 오스카상 4관왕을 수상한 사실은 이제 모두가 알고 있다! 그런데 온라인 댓글 분위기는 천차만별이었네? 이 영화가 대체 어땠길래? 당시 분위기를 분석하고 돌아볼 수는 없을까? 영화 평가가 긍정·부정적이었는지, 영화 자체의 평이 많은지 아니면 영화 외적 요소의 평이 많은지 궁금하다. 이제 김영우 선생님과 함께 R로 텍스트 마이닝을 해보자! 이 책은 직장인, 대학생, 연구자 누구나 쉽게 텍스트 분석을 할 수 있다. 한글 텍스트 분석은 물론 30종 넘는 다양한 그래프까지! 보고서에 바로 사용할 수 있는 다양한 결과물을 내 손으로 직접 만들 수 있다. 텍스트 마이닝을 진짜 내가 할 수 있을까? 이 책과 함께라면 당연히 할 수 있다! 저자는 R에 입문한 사람이라면 누구나 따라 할 수 있는 구성으로 ‘완벽한 텍스트 마이닝 실습 매뉴얼’을 준비했다. 이 책은 텍스트 마이닝 실전 연습을 충분히 할 수 있도록 현재 우리 사회에서 이슈가 되고 있는 4가지 주제를 중심으로 데이터를 엄선하여 텍스트 마이닝 실습을 진행한다. ‘대통령 연설문’, ‘영화 〈기생충〉 오스카상 수상 댓글’, ‘타다 금지법 댓글’, ‘내년 대선 후보 댓글’의 4가지 실제 사례를 분석하며 개념을 이해하는 과정으로 구성해서 처음에는 복잡해 보이는 개념도 실습을 진행하다 보면 술술 이해될 것이다.
Do it! 쉽게 배우는 R 텍스트 마이닝
__1장 단어 빈도 분석: 무엇을 강조했을까?
_01-1 텍스트 전처리
_01-2 토큰화하기
_01-3 단어 빈도 분석하기
__2장 형태소 분석기를 이용한 단어 빈도 분석
_02-1 형태소 분석
_02-2 명사 빈도 분석하기
_02-3 특정 단어가 사용된 문장 살펴보기
__3장 비교 분석: 무엇이 다를까?
_03-1 단어 빈도 비교하기
_03-2 오즈비 – 상대적으로 중요한 단어 비교하기
_03-3 로그 오즈비로 단어 비교하기
_03-4 TF-IDF – 여러 텍스트의 단어 비교하기
__4장 감정 분석: 어떤 마음으로 글을 썼을까?
_04-1 감정 사전 활용하기
_04-2 댓글 감정 분석하기
_04-3 감정 범주별 주요 단어 살펴보기
_04-4 감정 사전 수정하기
__5장 의미망 분석: 어떤 맥락에서 단어를 썼을까?
_05-1 동시 출현 단어 분석 – Co-occurrence analysis
_05-2 동시 출현 네트워크 – Co-occurrence network
_05-3 단어 간 상관 분석 – Phi coefficient
_05-4 연이어 사용된 단어쌍 분석 – n-gram
__6장 토픽 모델링: 어떤 주제로 글을 썼을까?
_06-1 토픽 모델링 개념 알아보기
_06-2 LDA 모델 만들기
_06-3 토픽별 주요 단어 살펴보기
_06-4 문서를 토픽별로 분류하기
_06-5 토픽 이름 짓기
_06-6 최적의 토픽 수 정하기
__7장 텍스트 마이닝 프로젝트: 타다 금지법 기사 댓글 분석
_07-1 주요 단어 살펴보기
_07-2 공감, 비공감 댓글 비교하기
_07-3 관심 댓글 비교하기
_07-4 단어 간 관계 살펴보기
_07-5 토픽 모델링
__8장 텍스트 마이닝 프로젝트: 차기 대선 주자 SNS 여론 분석
_08-1 SNS 언급량 추이 살펴보기
_08-2 SNS 이슈 살펴보기
_08-3 감정 단어 살펴보기
_08-4 감정 경향 살펴보기
_08-5 감정 추이 살펴보기
_08-6 긍정, 부정 트윗 단어 비교하기
__9장 텍스트를 효율적으로 분석하는 방법
_09-1 텍스트 데이터 수집하기
_09-2 텍스트 분석 품질 높이기
_09-3 완전 유용한 꿀팁