Azure Machine Learningの新機能「Run selected」を試してみた

今回は、Azure Machine Learning (Azure ML)に新たに実装された機能「Run selected」をご紹介します。

「Run selected」の概要

「Run selected」は2016年5月21日に実装された、選択したモジュールの結果のみを出力するためのExperiment実行方法
です。

Azure MLは簡単なモデルであれば数個のモジュールをつなげることで多項分類などの分析ができるシンプルなサービス
になっています。

しかし、実業務で使用する場合、最適なモデルを探求するために複数の分析方法を組み込んだり、
データ加工の条件分岐を組み込んだりしているうちに、以下のように膨大かつ多並列的なモデルになってしまうことが
多々あります。

最初に示した基本的なモデルであれば1~2分程度で分析が終わるのですが、
ここまでモジュールが増えると全モジュールを実行する「Run」では無駄なモジュール実行が発生してしまい、
一回の実行に15~20分と分析にも時間がかかってしまいます。

また、一部だけ結果がほしい場合でも、すべて実行しなければならないため、分析が非効率的になってしまいます。

今回実装された「Run selected」は、選択したモジュールが結果を出力するのに必要なモジュールだけを選択的に実行する
ことができるため、無駄なモジュールの実行を省くことができ、分析時間の短縮、分析コストの削減が期待できます。

「Run selected」の使い方

「Run selected」の使用方法は非常に簡単です。
結果がほしいモジュールを予め選択しておき、画面下部の「RUN」→「Run selected」を選択することで実行できます

「Run selected」にマウスオーバーすると選択したモジュールを実行するのに必要なモジュールが青くピックアップ
されます。

多くのモジュールを使っていますが、実際の分析には半分程度のモジュールしか必要ないことがわかります。

実行時間はというと、従来の「Run」で実行した場合には18分59秒かかっているのに対し、
「Run selected」で実行した場合には、8分33秒と半分以下の時間で実行が完了していることが分かりました。

「Run selected」は多数の分析から一部だけ結果を出力したい場合や、モジュール構成を一部変更して再実行するなど多くの場面で分析時間短縮が期待できます。

また、Azure MLはExperimentの実行時間で課金されるため、「Run selected」を利用して、業務時間、分析コストの両面でメリットを得られるのではないでしょうか。

次回もお楽しみに!!

この記事を書いた人

azure-recipe-user