[책] 데이터가 뛰어노는 AI 놀이터 캐글

2021. 6. 20. 20:52이런저런/책

머신러닝으로 데이터를 가지고 좀 놀아봤다면?
이제 넓은 세상에 나가 그 실력을 발휘할 때지.
어디서? 데이터 분석 경진 대회들!
그런 예측모델 분석 대회 플랫폼인 캐글!
Kaggle! www.kaggle.com!

그런데, 그냥 가면되나? 무작정?
그게 그렇지가 않다는군.
가벼운 마음으로 나갔다가
경진 대회에서 마음만 받을께~ 라는
당황스러운 마음의 스크레치를 선물로 받을 수 있다.

하지만 캐글에서의 경험을 바탕으로 주옥같은 노하우들을
집대성해놓은 이 책이 더해진다면
이미 기본적인 준비는 되었다고 봐도 과언이 아닐 듯 싶다.


실제 데이터들을 이용하고,
이론서들에서 찾아보기 어려운 기법들과
데이터셋들마다 다양한 테크닉이 필요한 경진 대회에서
상위 순위권에 진입하기 위해서는
문제를 정확히 이해하고 풀어내는 능력이 꼭 필요하다.

어떻게 하는데? 모든 경우에 대한 답이 들어있지는 않겠지만
예측 대상이나 모델의 평가지표가 명확할 때
어떻게 해야 성능이 높은 모델을 만들 수 있는지..

일반적으로 주의해야 할 내용들은 무엇인지..
모델의 성능을 개선할 때는 어떤 것들을 생각해야 하는지..
성능을 개선하는 기법들의 장단점과 특성은 어떠한지..

도구나 힌트가 될 수 있을 것 같은 것들을
수식은 최소화하면서 글이나 예제, 표를 사용해서
조금 더 이해를 쉽게 할 수 있도록 
쉽고 세세하게 설명해주고 있어서
대회를 준비하는 사람들에게 너무나 좋은 책이 아닌가 싶다.

단, 파이썬과 라이브러리의 사용법이나
머신러닝의 기본 개념이나 미분/행렬 연산등은
설명하지 않으니 미리 알아두면 좋을 듯 하다.

이제 랭커로 등록되러 가볼까?


"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."