DataLakeAnalytics 概要について

今回は、Azure Data Lake Analyticsについて調べたので紹介します。

Azure Data Lake Analyticsとは

ペタバイト規模のデータを扱う超並列データ変換処理プログラムを実行することができるクラウド分析サービスになります。管理が必要なインフラストラクチャやクラスタなどを用意する必要がなく利用ができます。
Azure Data warehouseやAWSのRedshiftは、データを蓄積し、その結果をPowerBIなどのツールに反映をする必要がありますが、Azure Data Lake Analyticsは、クラウド上で分析が実行できるサービスになっています。

機能

●スケーリング
Data Lake Analytics は、クラウドのスケールとパフォーマンスを考慮して設計されています。 リソースを動的にプロビジョニングするので、大容量のデータも分析できます。(テラバイト級~エクサバイト級まで) ジョブが完了するとリソースが自動的に縮小され、使用した処理能力の分だけのお支払いで済みます。保存するデータのサイズや使用するリソースの量を増減する際に、コードを書き直す必要はありません。 そのため、大規模なデータセットの処理や保存の仕方に悩むことなく、本来の業務に集中できます。

●既存のツールでの利用が可能
Data Lake Analytics はVisual Studioと密に連携しているため、使い慣れたツールでコードの実行、デバッグ、調整を行うことができます。 U-SQLジョブが視覚化されるので、コードがどのように大規模に実行されるのかを見ることができます。そのため、パフォーマンスのボトルネックを簡単に特定し、コストを最適化できます。

※U-SQLとは
SQLのシンプルで使いやすい宣言的な特性をC#の表現力で拡張するクエリ言語です。U-SQL言語は、Microsoft内のビッグデータシステムを支えているのと同じ分散ランタイムを基礎にしています。

●エンタープライズなセキュリティ、監査、サポート
Azure Active Directory を通じて、シングルサインオン(SSO)、多要素認証、数百万のIDのシームレス管理などの機能が組み込まれています。役割毎のアクセス制御と、すべての処理や管理操作を監査する機能が既定で備わっています。マイクロソフトのビッグデータソリューションは99.9%のエンタープライズSLA と365日24時間体制のサポートを保証しています。

料金と利用可能リージョン

■利用可能リージョン
現在Data Lake Analyticsが利用ができるリージョンは以下の3か所となっています。
・米国中部、東部2
・北ヨーロッパ

米国の2か所は料金パターンが2通り利用になっておりますが、北ヨーロッパについては、現状は、従量課金モデルのみの利用となっております。

■料金
料金は分析ユニットを使った分だけの課金体系(従量制)と月にどのぐらいを利用するかコミットすることで、従量制よりお得に利用ができるパッケージ(コミット制)の2パターンがあります。
下記がその料金になります。

●従量制(3リージョン共通)
分析ユニット利用
1時間当たり¥204

●コミット制
あらかじめ設定されている分析ユニット利用時間(月)を選んでいただいてその該当する金額が課金される仕組みになっています。

※超過分については、時間当たり¥153が課金されます。

例えば、月に90時間分析する場合、
従量制なら¥18,360
コミット制なら100時間まで\10,200
になるため、コミット制を選んだ方がお得に利用することができます。
従量制50時間でコミット制の100時間相当になるため
それより下の時間利用をするのであれば、従量制の利用がいいのではないでしょうか。

必要なリソースを管理する必要もなく簡単に大規模データを分析にかけることができるサービスがAzureで手軽に利用ができるのはうれしいですね。
今後、利用可能なリージョンは増えてくると思うので、日本で利用ができるようになると需要が増えてきそうなサービスですね。

次回もお楽しみに。

この記事を書いた人

azure-recipe-user