読者です 読者をやめる 読者になる 読者になる

サイエンティストとマーケターのはざま

Pythonとか広告とかデータ分析とかとか


MacにXGBoostをインストールして予測モデルを作成する - インストール編

XGBoostで予測モデルを作成していきます。

XGBoostとは

近年KaggleやKDDなどの機械学習界隈で予測精度がよいと評判のアルゴリズム、Gradient Boosting(勾配ブースティング、GBDTと呼ぶことが多い)をc++で実装したもので、計算が速いことが知られています。

GBDTとは弱学習器である決定木を作成し、誤って分類されたところは重みをつけてまた決定木を作成...と逐次決定木による学習を繰り返すことでモデルの精度を向上させるアルゴリズムです。(かものはしさんのブログがグラフィカルでわかりやすい)

XGBoostのインストール

理論的な部分はおいといて、分類精度がよいとゆうことでとりあえず使える状態にしたいと思います。Pythonのライブラリがあるので、それをMacにインストールします。

 

1. まず、XGBoostはコンパイルにc++が必要なため、gccとよばれるコンパイラをインストールします。けっこう時間かかります。

brew install gcc --without-multilib

2.  あと、c++のコンパイルのためにこちらも必要です。

brew tap homebrew/boneyard
brew install clang-omp

3. あとはpipでインストールすればおっけーです。

pip install xgboost

 次回はXGBoostでモデリングを行います。

 

参考

xgboost/python-package at master · dmlc/xgboost · GitHub

XGBoostをMac, CentOSにインストールする - Qiita

パッケージユーザーのための機械学習(12):Xgboost (eXtreme Gradient Boosting) - 六本木で働くデータサイエンティストのブログ

XGBoostやパラメータチューニングの仕方に関する調査 | かものはしの分析ブログ

勾配ブースティングについてざっくりと説明する - About connecting the dots.