Azure OpenAIのDALL·E 2とDALL·E 3を実行してみた

本記事は OpenAI活用法 Advent Calendar 2023 by ナレコム の12日目の記事です。

OpenAI活用法 Advent Calendar 2023 by ナレコム ではGPTsを含めた最新のOpenAIの活用法について紹介します。

はじめに

2023年12月現在、人工知能の分野では、画像生成技術が注目を集めています。特に、OpenAIが開発したDALL-Eシリーズは、その進化と応用範囲の広さで多くの関心を引いています。この記事では、Microsoft Azureプラットフォーム上で利用可能な2つのバージョン、DALL-E 2とDALL-E 3の比較を行います。

DALL-E 2とDALL-E 3は、それぞれ異なるAPIバージョン、ライブラリの要件、さらには異なるAzureリージョンでの展開によって特徴づけられています。このような違いが実際の使用にどのような影響を与えるのか、同じプロンプト「A painting of a dog」(犬の絵)を用いて両者を比較し、それぞれの特徴と利用方法の違いを探ります。

2023年12月現在、Azure上ではDALL·E 2とDALL·E 3の両方を実行することができます。ただし、以下のように大きく異なります。

主な違い

項目 DALL·E 2 DALL·E 3
API Version 2023-06-01-preview 2023-12-01-preview
OpenAI Pythonライブラリ 0.28.1のみ 1.x系
Azureリージョン East US Sweden Central

上記の違いから同一環境で動作させることができません。この2つに対して同一のプロンプトで実行して比較してみました。

事前準備

下図を参考に、それぞれのリージョンの エンドポイント  キー を取得します。
image.png

DALL·E 2を動かす

まず、OpenAI Pythonライブラリのバージョンを下げる必要があります。

レスポンス
d2.png

DALL·E 3を動かす

今度は、OpenAI Pythonライブラリのバージョンを上げる必要があります。

レスポンス
d3.png

まとめ

この記事では、Azure上で利用可能なDALL-E 2とDALL-E 3の主な違いとそれぞれの特性について詳しく見てきました。重要なポイントを振り返ると、以下のようになります。

  1. APIバージョンとライブラリ: DALL-E 2は「2023-06-01-preview」APIバージョンとOpenAI Pythonライブラリのバージョン0.28.1を使用します。一方、DALL-E 3では「2023-12-01-preview」APIバージョンと1.x系のライブラリが必要です。

  2. Azureリージョンの違い: DALL-E 2はEast USリージョンでのみ利用可能ですが、DALL-E 3はSweden Centralリージョンで展開されています。

  3. 画像生成の結果: 同じプロンプト「A painting of a dog」を使用した際、DALL-E 2とDALL-E 3はそれぞれ異なる視覚的特性とスタイルを示しました。これは、両バージョンの技術的進歩とアプローチの違いを反映しています。

この比較を通じて、DALL-E 2とDALL-E 3の使い方、それぞれのユニークな特徴、そして最新の画像生成AI技術の可能性についての理解を深めることができたと思います。


また、ナレッジコミュニケーションでは Musubite というエンジニア同士のカジュアルトークサービスを利用しています!この記事にあるような生成AI 技術を使ったプロジェクトに携わるメンバーと直接話せるサービスですので興味がある方は是非利用を検討してください!

この記事を書いた人

azure-recipe-user