AzureでOCRができる?Azure Computer Visonでテキスト抽出をやってみた!

はじめに

この記事では Azure の機械学習サービス【Azure Computer Vision】 を使って画像からテキストを抽出を試していきます。

Azure Computer Vison ではテキスト抽出の自動化・リアルタイムのビデオ分析などが行えます。機械学習に関する専門知識は不要です。
詳細なサービス内容については以下をご参照ください
Computer Vision APIを解説 【シリーズ Azureサービスいちから紹介】

本記事の概要

  • 前提として Azure のアカウント登録はしている状態から始めます。
  • 手書きの文字を取った画像を Azure Computer Vison でテキスト抽出するまでを解説します。言語は Python を使用しています。
  • Azure Computer Vison を試してみたい・導入を検討している方に向けて執筆しています。

開発環境

Windows 10
Anaconda
Python 3.6
OpenCV 4.4.0
Azure Computer Vision API
Computer Vision クライアント ライブラリ(必要なら)

導入

1.Azure ポータルにログインします
2.Computer Vision API のリソースを作成します

https___qiita-image-store.s3.ap-northeast-1.amazonaws.com_0_63863_db52fef2-972e-fe1b-d430-d2914d5cdc75.png

3.キーとエンドポイントをメモします

https___qiita-image-store.s3.ap-northeast-1.amazonaws.com_0_63863_f5c0b265-c718-98d6-893a-e11adabf078d.png

4.必要なライブラリをインストールしてください。

5.メモしたキーとエンドポイントを入力し、次のコードを実行してみましょう!

エンドポイントはリージョン(場所)指定でも動くようです。

画像 URL からテキスト抽出する

クイック スタート: Computer Vision の REST API と Python を使用して印刷されたテキストと手書きテキストを抽出する

input output
https___raw.githubusercontent.com_MicrosoftDocs_azure-docs_master_articles_cognitive-services_Computer-vision_Images_readsample.jpg https___qiita-image-store.s3.ap-northeast-1.amazonaws.com_0_63863_e3e84db0-bca3-d504-4974-bfa1da58cd75.png

ローカル画像からテキスト抽出する

input  output
https___raw.githubusercontent.com_MicrosoftDocs_azure-docs_master_articles_cognitive-services_Computer-vision_Images_readsample (1).jpg https___qiita-image-store.s3.ap-northeast-1.amazonaws.com_0_63863_ff1597be-1b59-b5ab-28c9-dd64fbb08d33.png

Computer Vision クライアント ライブラリを使用する

クイック スタート: Computer Vision クライアント ライブラリを使用する

お疲れ様でした。

最後に

Azure Computer Vison で テキスト抽出を行うところまでを解説していきました。
手書きの文字が認識できると手書き帳簿の読み取りを Azure Computer Vison を使って可能になるかもしれないですね。
今回は英語での検証でしたが、パブリックプレビュー版で日本語対応機能が追加されているのでそちらも検証していきたいと思います。

この記事を書いた人

azure-recipe-user