티스토리 뷰

 

1판은 "파이썬을 활용한 머신러닝 쿡북"

전처리에서 딥러닝까지, 판다스와 사이킷런 중심의 실전 문제 해결 200선

 

이번 2판은 제목이 바뀌었다.

"실무로 통하는 ML 문제 해결 with 파이썬"

 

이 책은 목차가 모든 것을 말해준다.

1~8장은 데이터를 핸들링하는데 필요한 내용

9~19장은 회귀, 분류를 위한 머신러닝 기본 기법들과 평가방법

20장 이후에는 파이토치, 신경망 까지 포괄적으로 다룬다. 한마디로 "광범위"하다

 

1장 벡터, 행렬, 배열
2장 데이터 적재
3장 데이터 랭글링
4장 수치형 데이터 다루기
5장 범주형 데이터 다루기
6장 텍스트 다루기
7장 날짜와 시간 다루기
8장 이미지 다루기
9장 특성 추출을 사용한 차원 축소
10장 특성 선택을 사용한 차원 축소
11장 모델 평가
12장 모델 선택
13장 선형 회귀
14장 트리와 랜덤 포레스트
15장 k-최근접 이웃
16장 로지스틱 회귀
17장 서포트 벡터 머신
18장 나이브 베이즈
19장 군집
20장 파이토치 텐서
21장 신경망
22장 비정형 데이터를 위한 신경망
23장 훈련 모델의 저장, 로딩, 서빙

 

광범위하므로 내용이 많아져서 527page 지만, 한가지 주제에 아주 디테일한 건 아니다. 오히려 앞쪽 파트에 공을 많이 들인 느낌이다. 특히 2장을 보면 일반적인 데이터분석 관련 책들은 csv, xls 정도의 파일을 적재하는 부분만 알려주는데, 이건 JSON, SQL, 구글 시트 뿐만 아니라 AWS S3 적재 방법까지 알려준다. "감동"!

 

_2.0 소개
_2.1 샘플 데이터셋 적재하기
_2.2 모의 데이터셋 만들기
_2.3 CSV 파일 적재하기
_2.4 엑셀 파일 적재하기
_2.5 JSON 파일 적재하기
_2.6 파케이 파일 적재하기
_2.7 아브로 파일 적재하기
_2.8 SQLite 데이터베이스로부터 적재하기
_2.9 원격 SQL 데이터베이스에 쿼리하기
_2.10 구글 시트에서 데이터 적재하기
_2.11 S3 버킷에서 데이터 적재하기
_2.12 비구조적인 데이터 적재하기

 

2장은 꼭 필요한 내용과 더불어 유의사항도 알려준다.

1) 적재하기 전에 파일의 내용을 확인

2) 매개변수 체크

 

파이썬 코드는 라인 바이 라인으로 주석이 달려있다.

이 부분은 초심자를 위해서 꼭 필요한 부분인데, 많은 책들이 분량 문제인지 생략하는 경우가 많다.

 

더불어 박해선 역자는 데이터분석 분야의 그냥 레전드 같은 분인데, 이 책엔 특별히 '덧붙임'을 통해 유사함수나 다양한 옵션을 추가로 설명하는 부분이 포함되어있다. 

* 박해선 님 : 혼공 시리즈 저, 핸즈온 머신러닝 역 등 다수

 

장점

폭넓은 주제를 다룸

Full color 로 코드에 대한 설명이 친절함

실제 분석할때 꿀팁 들이 포함되어있음

 

단점

527page 에 다 담을 수 없었던지라 깊이가 부족함(2장은 충분히 자세함)

완전초보가 보기엔 어려움, 중급 이상이 보는게 적절해보임

 

초보자부터 시작한다면 아래 순서대로 책을 보는 것도 좋아보인다

1. 혼자 공부하는 데이터 분석 with 파이썬
2. 혼자 공부하는 머신러닝+딥러닝
3. 데이터 분석가가 반드시 알아야 할 모든 것 
4. 실무로 통하는 ML 문제 해결 with 파이썬
5. 파이썬 머신러닝 완벽 가이드
6. 핸즈온 머신러닝

 

 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

댓글