MacにXGBoostをインストールして予測モデルを作成する - インストール編
XGBoostで予測モデルを作成していきます。
XGBoostとは
近年KaggleやKDDなどの機械学習界隈で予測精度がよいと評判のアルゴリズム、Gradient Boosting(勾配ブースティング、GBDTと呼ぶことが多い)をc++で実装したもので、計算が速いことが知られています。
GBDTとは弱学習器である決定木を作成し、誤って分類されたところは重みをつけてまた決定木を作成...と逐次決定木による学習を繰り返すことでモデルの精度を向上させるアルゴリズムです。(かものはしさんのブログがグラフィカルでわかりやすい)
XGBoostのインストール
理論的な部分はおいといて、分類精度がよいとゆうことでとりあえず使える状態にしたいと思います。Pythonのライブラリがあるので、それをMacにインストールします。
1. まず、XGBoostはコンパイルにc++が必要なため、gccとよばれるコンパイラをインストールします。けっこう時間かかります。
brew install gcc --without-multilib
2. あと、c++のコンパイルのためにこちらも必要です。
brew tap homebrew/boneyard
brew install clang-omp
3. あとはpipでインストールすればおっけーです。
pip install xgboost
次回はXGBoostでモデリングを行います。
参考
xgboost/python-package at master · dmlc/xgboost · GitHub
XGBoostをMac, CentOSにインストールする - Qiita
パッケージユーザーのための機械学習(12):Xgboost (eXtreme Gradient Boosting) - 六本木で働くデータサイエンティストのブログ