Azureにはオンラインで利用できる機械学習Machine Learning(Azure ML)が提供されており、様々なパーツをドラッグ&ドロップするだけで簡単に機械学習を使うことが出来ます。
今回から複数回に分けてAzure上にもサンプルのあるUCI(University of California、Irvine) Machine Learning Repositoryの”Statlog (German Gredit Data)”を利用して貸付の信用リスクの分析を行います。
大きな流れとしては、「2つの機械学習モデルを比較」し、「優れたモデルを学習モデルとして利用する」という流れになります。
<2つの機械学習モデルを比較>に関しては以下の流れとなります。
- Machine Learning Studioのセットアップ
- 分析データの取り込み
- Rを使ってリスクに合わせたデータの作成
- 1つ目のモデル「Two-Class Boosted Decision Tree」に取り込み
- 上記モデル評価のためにリアルデータとのスコアリングを作成
- もう1つのモデル「Two-Class Support Vector Machine」に対しても作成
- 2つのモデルのスコアリングデータの比較
が作成後のStudioの画面となります。
<優れたモデルを学習モデルとして利用する>に関しては以下の流れとなります。
1. Coming Soon
次回からは実際に機械学習に取り組みます。
お楽しみに!