カテゴリー別アーカイブ: databricks

Excel / Azure Notebook / Databricks で同じことをやってみる #2 【Excel編】

はじめに 前回紹介した内容に沿った簡易集計と可視化を、Excelで行います。 流れ 3つのCSVデータを組み合わせて、中間テーブルを作成します。 青色は、 各々のレコードに対して feight / (price + freight)で算出した、単価と送料の合計に占める送料の割合。オレンジは、キーとなる値を紐づけて取得し… 続きを読む

Excel / Azure Notebook / Databricks で同じことをやってみる #1 【はじめに】

はじめに/対象者 Excelのつらみを日々体感している以下のような方に向けて、Azureファミリーの便利なサービスを何記事かに分けてご紹介します。 ・非技術者でデータを扱っている ・データの集計や可視化に、Excelを使っている ・とりあえず今やってる作業の効率化から進めたい ・今より少し踏み込んだ分析ができるプラット… 続きを読む

Azure Databricksを使ってみた

渡邊です。 Apache Sparkベースの分析プラットフォーム「Databricks」がAzure上で使用出来るようになりました。 今回はこの「Azure Databricks」をなるべく簡単な構成で使ってみます。 1. 構成図 構築する環境の構成は下図の通りです。 2. 全体の流れ 下記の流れで進めていきます。 ・… 続きを読む