OCRアノテーションツール

Mindkoshで画像を自動的にOCRアノテーションする方法をご覧ください

OCR用に画像にラベルを付けるには、タスクを作成する際にラベルに テキスト タイプの属性を追加するだけです。既にタスクを作成している場合は、タスクを編集して既存のラベルに新しい属性を追加することもできます。

各ラベルに複数のエントリを入力したい場合は、同じラベルに テキスト タイプの属性を複数追加することもできます。

ラベルにテキストタイプの属性を追加してOCR注釈を有効にします

属性が追加されると、テキスト上にバウンディングボックスを描き、属性に自由形式のテキストを入力できます。これを行う方法はいくつかあります:

  1. オブジェクトを描画したら、注釈上で右クリックし、ポップアップ下部の属性テキストボックスにテキストを入力します。

  2. 右サイドバーのオブジェクト注釈カードからこれを行うこともできます。カードに属性が表示されていない場合は、 詳細 ボタンをクリックして属性セクションを展開してください。

  1. 入力したいテキストが長く、小さなテキストボックスに収まらない場合は、属性テキストボックスの右側にある三点リーダー(...)をクリックしてテキスト入力ウィンドウを表示できます。

自動OCR注釈

画像内のすべてのテキストを自動的に検出してラベル付けするには:

OCR用の自動注釈ダイアログボックス
  1. タスクページで 自動OCRを実行 ボタンをクリックします。

  2. これによりラベル選択ウィンドウが開きます。

    1. 行を検出 - これはテキストを行単位で検出します。文書や請求書など、テキストが主に行として書かれているもののラベリングに適しています。また、このテキストに割り当てるラベルと、テキスト値を保存する属性を選択する必要があります。

    2. トークンを検出 - これはテキストをトークン(単語)単位で検出します。道路標識や小さなテキストブロックなどのラベリングに適しています。

    3. 両方をラベル付けすることも選択できます。これを行うと画像に追加されるオブジェクト数が増えるため注意が必要で、多くの不要な注釈を削除する必要が出る場合があります。

    4. テキストの周りのバウンディングボックスに割り当てるラベルを選択してください。

    5. テキストを保存する属性(プロパティ)を選択してください。

  3. 画像の枚数によっては、タスクの処理に数分から1時間ほどかかることがあります。注釈の進行状況はタスクページで確認できます。

行とトークンの両方を自動でラベル付けする場合、ページに表示される注釈数を減らすためにフィルターを使用するのがよい場合があります。右サイドバーのフィルターアイコンをクリックしてフィルターを適用できます。について詳しくは、 ここでフィルターの使い方を学べます。

また、 バウンディングボックスの結合 ツールを使用して複数の注釈を単一のバウンディングボックスに結合することもできます。マージするとテキスト値もコピーされます。例えば住所の異なる行を素早く結合して単一の住所オブジェクトにするためにこれを使用できます。

注釈を結合

最終更新

役に立ちましたか?