- [์ฑ ์ ๋ณด] (https://wikibook.co.kr/ml-definitive-guide/)
- [์์ ์ฝ๋ ๋ค์ด๋ก๋] (https://github.com/wikibook/ml-definitive-guide/archive/master.zip)
CH01 (ํ์ด์ฌ ๊ธฐ๋ฐ์ ๋จธ์ ๋ฌ๋๊ณผ ์ํ๊ณ ์ดํด) <๋ ธํธ๋ถ ๋ฐ๋ก๊ฐ๊ธฐ>
- boolean ์ธ๋ฑ์ฑ์ ํตํ ๋ฐ์ดํฐํ๋ ์ ์กฐ๊ฑด ์ถ์ถ
- Aggregation ์ ์ฉ ๋ฐฉ๋ฒ
- groupby ์ ์ฉ ๋ฐฉ๋ฒ
- ๊ฒฐ์ธก ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ฐฉ๋ฒ (isna, fillna)
- apply, lambda ์ ์ฉ ๋ฐฉ๋ฒ
CH02 (์ฌ์ดํท๋ฐ์ผ๋ก ์์ํ๋ ๋จธ์ ๋ฌ๋)<ํด๋>
- Scikit-learn ์ค์น
- train_test_split()
- ์์ธก ํ๊ฐ
- ๊ต์ฐจ๊ฒ์ฆ (KFold, StratifiedKFold, cross_val_score)
- ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋(GridSearchCV)
- ๋ฐ์ดํฐ ์ธ์ฝ๋ฉ (๋ ์ด๋ธ์ธ์ฝ๋ฉ, ์ํซ์ธ์ฝ๋ฉ)
- ํผ์ฒ์ค์ผ์ผ๋ง (ํ์คํ, ์ ๊ทํ) (StandardScaler, MinMaxScaler)
- ๋ฐฐ์ด ๋ด์ฉ์ผ๋ก ํ์ดํ๋ ์์กด์ ์์ธก
- ๊ฒฐ์ ํธ๋ฆฌ, ๋๋คํฌ๋ ์คํธ, ๋ก์ง์คํฑ ํ๊ท๋ฅผ ์ด์ฉํด ํ์ต
CH03 (ํ๊ฐ) <๋ ธํธ๋ถ ๋ฐ๋ก๊ฐ๊ธฐ>
- ์ ํ๋
- ์ค์ฐจ ํ๋ ฌ
- ์ ๋ฐ๋
- ์ฌํ์จ
- F1 ์ค์ฝ์ด
- ROC-AUC
- Pima Indians Diabetes Database ๋ฐ์ดํฐ๋ก ์ ๋ฆฌํ
CH04 (๋ถ๋ฅ) <ํด๋>
- ์์๋ธ
- Gradient Boosting Machine - GBM
- eXtra Gradient Boost - XGB
- XGB๋ฅผ ์ด์ฉํ ์ค์ต
- LightGBM - LGBM
- LGBM์ ์ด์ฉํ ์ค์ต
- XGB, LGBM ๋น๊ตํ๋ฉฐ ์ค์ตํ Satander Customer Satisfaction(์บ๊ธ ๋ฐ์ดํฐ)
- creditcardfraud ์ค์ต (์บ๊ธ ๋ฐ์ดํฐ)
- Stacking