파이썬으로 경험하는 빅데이터 분석과 머신러닝 pdf 다운로드를 무료로 제공합니다 제가 몸담고 있는 가천대 길병원 로비에는 로봇이 걸어 다닙니다. 초롱초롱 눈망울이 귀여운 이 친구의 이름은 ‘페퍼’입니다. 감정 인식이 가능한 페퍼는 소프트뱅크가 개발한 세계 최초 휴머노이드 소셜 로봇입니다
관련 책 pdf 모음
책 소개
페퍼는 병원 본관 로비와 인공지능 암센터에 배치되어 환자를 응대하고 다양한 건강 정보를 제공하며 무균실, 중환자실 등 일반인 접근이 어려운 병실에서 환자들의 신체적 건강뿐만 아니라 감성까지 도와주고 있습니다. 뿐만 아닙니다. IBM 인공지능 의사 ‘왓슨’은 길병원 최전선 임상 현장에서 이미 오래전부터 활약하고 있습니다. 이제 인공지능 기술은 선택의 문제가 아닙니다. 앞으로 얼마나 더 많은, 또 얼마나 더 똑똑한 ‘페퍼’와 ’왓슨’이 쏟아져 나올지 상상해 보십시오. 우리 주변은 벌써 ‘스마트’ 또는 ‘지능형’과 같은 수식어를 단 사물로 가득하며, 이런 인공지능 기술의 진화는 이미 제어하기 힘들 정도의 가속도를 얻으며 미래로 달려가고 있습니다. 이런 인공지능 기술의 핵심은 빅데이터 머신러닝입니다. 쉬운 개념은 아닐지 모르나 결코 낯선 단어는 아니죠. 인터넷 클릭 몇 번이면 관련 지식들이 쏟아지니까요. 하지만 막상 빅데이터 머신러닝을 배우려고 시도해 본 사람이라면, 이 기술에 접근하기가 생각보다 쉬운 일이 아님을 깨닫게 됩니다. 빅데이터, 통계, 머신러닝 기술은 밀접하게 연관되어 있기는 하나, 각자 나름의 영역을 분명하게 가지고 있습니다. 입문자들에게 이런 특성은 뛰어넘기 어려운 벽으로 작용합니다. ‘빅데이터 머신러닝 기술’이 어려운 데에는 이유가 있습니다. 각 영역의 특성을 이해하고 기본기를 탄탄히 하지 않은 채 시작하기 때문입니다. 기본 이론을 단순히 암기하거나 소홀히 지나친다면, 이 중요한 미래 기술을 내 것으로 만들기 힘듭니다. 시중에는 이미 훌륭한 빅데이터 인공지능 관련 책들이 많이 나와 있습니다. 하지만 복잡한 수학 이론을 별다른 도움 없이 이해할 수 있는 경력자들을 위한 책이 대부분이라는 점은 교육 현장에서 학생들의 어려움을 직접 보고 듣는 입장에서 매우 안타까운 일이었습니다. 이 책은 빅데이터 머신러닝 기초 이론부터 파이썬으로 차근차근 눈으로 보며 실습하는 것을 목표로 합니다. 복잡한 프로그래밍은 최소화하고 가장 유명한 데이터들로 판다스, 시본, 케라스, 텐서플로 등 인기 있는 파이썬 라이브러리를 경험할 수 있습니다. 나아가 클라우드 머신러닝을 활용한 최신 기술들도 실습할 수 있습니다. 기본 이론을 이해하고 실습을 통해 차근차근 경험을 쌓아 나가기만 한다면, 빅데이터 머신러닝이라는 거창한 이름이 만만한 친구처럼 편안해질 날은 생각보다 빨리 옵니다. 그때까지 이 책이 여러분의 짐을 나눠지고 지름길을 찾아주는 착한 안내자 역할을 해 줄 수 있기를 기원합니다.
파이썬 빅데이터 분석과 머신러닝
1장 빅데이터와 인공지능
1. 빅데이터와 인공지능 그리고 머신러닝
도로를 달리는 컴퓨터
컴퓨팅 파워
빅데이터와 인공지능의 발전
2. 인공지능 시대 기술
인공지능 머신러닝 딥러닝과 빅데이터
인공지능 센서가 되는 사물인터넷(IoT)
인공지능 확산 핵심 인프라 클라우드
인공지능 원료 빅데이터
더 안전한 블록체인 기반 인공지능
3. 데이터 사이언티스트
빅데이터 머신러닝(이하 빅러닝)을 위한 지식들
데이터 기술자 시대
데이터 사이언티스트
빅러닝 파이프라인
■ 연습문제
2장 빅러닝 환경
1. 빅러닝 분석 도구
빅러닝 도구 필수 조건
파이썬과 R
결론은 파이썬
2. 개발 환경 준비
아나콘다 배포판 준비
파이썬 모듈과 패키지
파이썬 주요 라이브러리
통합 IDE
3. 분석 보고서 만들기
마크업
마크다운
주피터 노트북 마크다운 보고서 작성
■ 연습문제
3장 파이썬 데이터
1. 파이썬 데이터 다루기
데이터 표현
기본 연산
논리 연산
비교 연산
2. 변수와 자료형
변수
자료형
3. 함수와 모듈
함수
모듈
■ 연습문제
4장 데이터 준비
1. 데이터 이해
정형 데이터
반정형 데이터
비정형 데이터
2. 데이터 소스
데이터 구하기
오픈 데이터
3. 데이터 불러오기
CSV 파일
EXCEL 파일
JSON 파일
4. 데이터 저장하기
CSV 파일 저장
EXCEL 파일 저장
JSON 파일 저장
피클 저장하기
5. 공공 데이터 OPEN API
공공 데이터 서비스 이용 방법
공공 데이터 이용 방법
API 키 인증 없이 API 정보 가지고 오기
API와 HTTP 프로토콜
6. 파이썬 웹 크롤링
웹 크롤링 이해
BeautifulSoup 기본 설명
네이버 웹 크롤링
■ 연습문제
5장 데이터 보기
1. 판다스 데이터 구조
2. 시리즈와 데이터프레임
시리즈
데이터프레임
3. 데이터프레임 조작
데이터프레임 행과 열
행과 열의 크기
깔끔한 데이터
데이터프레임 확인
행 데이터
열 변수
데이터 조작
4. 데이터 연결과 병합
데이터 연결
데이터 병합
5. 단일변수 데이터 보기
데이터프레임 변수 유형
변수 유형별 데이터 분석
범주형
연속형
■ 연습문제
6장 데이터 클린징
1. 데이터 클린징의 이해
2. 결측 데이터
결측 데이터 확인
결측 데이터 개수 확인
결측 데이터 제거
결측 데이터 대체
결측 데이터 처리 주의 사항
3. 이상 데이터
이상 데이터 확인
이상 데이터 시각화
이상치 처리 방법
4. 중복 데이터
중복 데이터 확인
중복 시작과 끝 확인
중복 데이터 제거
■ 연습문제
7장 데이터 탐색
1. 데이터 그룹 분석
그룹 분석
집계 함수 사용
2. 데이터 재구조화
데이터 구간화
원-핫인코딩
데이터 전치
피봇테이블
멜트
스택/언스택
3. 시계열 데이터
시간 조작
타임스탬프
기간 함수
■ 연습문제
8장 데이터 시각화
1. 시각화의 시대
눈으로 보는 데이터
시각화의 중요성
엔스콤 시각화
시각화 라이브러리
2. 기본 시각화
시각화 준비
시각화 옵션 지정
일차 시각화
선그래프
막대그래프
산점도
히스토그램
3. 고급 시각화
시본
시각화 옵션
막대그래프
박스플롯
박스플롯으로 이상치 제거 후 시각화
4. 변수 유형별 시각화
일변수 시각화
이변수 시각화
다변량 시각화
5. 인터랙티브 시각화
갭마인더
플로틀리
피갈
보케
홀로뷰
6. 시계열 시각화
시계열 시각화 유형
시계열 시각화 실습
■ 연습문제
9장 데이터 분석
1. 분석 파이프라인
빅데이터 분석 파이프라인
데이터 분석 시작 전 몇 가지 질문
2. 타이타닉 분석 파이프라인
데이터 준비
데이터 보기
데이터 클린징
데이터 탐색
데이터 탐색 자동 보고서
데이터 시각화 분석
타이타닉 분석 요약
■ 연습문제
10장 스몰데이터 통계
1. 기초 통계 이해
2. 가설 수립과 검정
가설 수립
가설 검정
오류
통계 결과 해석
3. T-분석
4. 카이제곱 검정
■ 연습문제
11장 통계에서 머신러닝으로
1. 상관분석
2. 회귀분석
선형회귀분석
로지스틱 회귀분석과 가중치
3. 머신러닝 넘어가기
머신러닝 모델 최적화
머신러닝 모델 일반화
■ 연습문제
12장 머신러닝 핵심
1. 머신러닝
프로그래밍과 머신러닝
머신러닝의 발전
2. 머신러닝 구성
머신러닝 데이터
머신러닝 문제
3. 머신러닝 학습 구분
머신러닝 학습
머신러닝 평가
4. 머신러닝 준비
머신러닝 라이브러리
머신러닝 파이프라인
로지스틱 모델 예측
의사결정나무 예측
■ 연습문제
13장 머신러닝 모델
1. 지도 학습, 비지도 학습 모델
지도 학습
지도 학습 모델
비지도 학습
비지도 학습 모델
2. 인공신경망 모델
인공신경망
기본 신경망
케라스 신경망
케라스 ANN 이미지 모델
3. 머신러닝 최적화 성능 요소
비용함수
옵티마이저
활성화 함수
가중치 감소와 규제
데이터 분할 반복
플레이그라운드 머신러닝
■ 연습문제
14장 딥러닝 텐서플로
1. 딥러닝
심층망의 시작
텐서플로
텐서플로 DNN 모델 만들기
2. 딥러닝의 발전
딥러닝의 문제점
CNN 모델
필터 모델 개념 실습
3. 텐서플로 CNN 모델 만들기
4. 텐서플로 Estimator
■ 연습문제
15장 미래 머신러닝
1. 인공지능의 미래
강/약 인공지능
설명 가능 AI(XAI)
머신러닝 모델
제로샷 학습
2. 클라우드 머신러닝
클라우드 컴퓨팅
클라우드 컴퓨팅 서비스
클라우드 머신러닝
3. GPU가 필요해
코랩
코랩 클라우드 환경
GPU CNN 모델 만들기
■ 연습문제