Google Cloud Vision AIでツリー構造の情報を読み取るサンプルスクリプト
- .envファイル作成
GOOGLE_CLOUD_API_KEY=xxx
- 下記の手順で実行
# openai_envという名前で仮想環境を作成(同名のディレクトリが作成される)
python3 -m venv tree-ocr_env
source tree-ocr_env/bin/activate
pip install 必要はものたち
# 実行
python3 request.py 引数でファイル名を指定
画像ファイル 'tree.png' からテキストを抽出しています...
49行のテキストが検出されました。
--- 検出されたツリー構造 ---
- テキスト: フレーム
階層: 0
親: None
- テキスト: :
階層: 0
親: None
- テキスト: 30
階層: 0
親: None
- テキスト: ハンドル
階層: 0
親: None
- テキスト: :
階層: 0
親: None
- テキスト: 31
階層: 0
親: None
- テキスト: 自転車
階層: 0
親: None
- テキスト: A
階層: 0
親: None
- テキスト: :
階層: 0
親: None
- テキスト: 29
階層: 0
親: None
- テキスト: サドル
階層: 0
親: None
- テキスト: :
階層: 0
親: None
- テキスト: 35
階層: 0
親: None
- テキスト: タイヤ
階層: 0
親: None
- テキスト: :
階層: 0
親: None
- テキスト: 36
階層: 0
親: None
- テキスト: (
階層: 0
親: None
- テキスト: ×
階層: 0
親: None
- テキスト: 2
階層: 0
親: None
- テキスト: )
階層: 0
親: None
- テキスト: ネジ
階層: 0
親: None
- テキスト: :
階層: 0
親: None
- テキスト: 39
階層: 0
親: None
- テキスト: (
階層: 0
親: None
- テキスト: 8
階層: 0
親: None
- テキスト: )
階層: 0
親: None
- テキスト: ライト
階層: 0
親: None
- テキスト: :
階層: 0
親: None
- テキスト: 32
階層: 0
親: None
- テキスト: ブレーキ
階層: 0
親: None
- テキスト: :
階層: 0
親: None
- テキスト: 33
階層: 0
親: None
- テキスト: グリップ
階層: 0
親: None
- テキスト: :
階層: 0
親: None
- テキスト: 34
階層: 0
親: None
- テキスト: ネジ
階層: 0
親: None
- テキスト: :
階層: 0
親: None
- テキスト: 39
階層: 0
親: None
- テキスト: (
階層: 0
親: None
- テキスト: ×
階層: 0
親: None
- テキスト: 4
階層: 0
親: None
- テキスト: )
階層: 0
親: None
- テキスト: ホイール
階層: 0
親: None
- テキスト: :
階層: 0
親: None
- テキスト: 37
階層: 0
親: None
- テキスト: タイヤ
階層: 0
親: None
- テキスト: チューブ
階層: 0
親: None
- テキスト: :
階層: 0
親: None
- テキスト: 38
階層: 0
親: None