OCRについて

OCRとは

画像データ内の文字を認識して、文字データに変換する技術です。PINOKIOでは、以下の4種類の文字解析アクションでOCRを使用できます。

文字解析アクションの種類

テキスト取得

指定した画像ファイルの文字を読み取り、文字データに変換します。文字データは{}や[]で囲われた状態で取得され、そのままでは扱いずらいため、後述のアクションを使って加工します。
【文字解析】テキスト取得
画像からテキストデータを読み込みます。

名刺情報取得

「テキスト取得」アクションで取得した文字データから、氏名や電話番号、住所など、名刺に記載されるようなデータを抽出します。
【文字解析】名刺情報取得
画像から取得したテキストデータから、会社名、氏名、電話番号など、名刺に記載されるような情報を抽出します。

解析結果修正画面表示

「テキスト取得」アクションで取得した文字データを修正する画面を表示します。
【文字解析】解析結果修正画面表示
画像から取得したテキストデータを確認、修正できるアクションです。

項目取得

「テキスト取得」アクションで取得した文字データを、定型データ化します。請求書など、フォーマットが決まった書類の画像データを読み込む際に活用できます。
【文字解析】項目取得
画像から取得したテキスト情報を定型データ化します。
【文字解析】テキスト取得
画像からテキストデータを読み込みます。
【文字解析】名刺情報取得
画像から取得したテキストデータから、会社名、氏名、電話番号など、名刺に記載されるような情報を抽出します。
【文字解析】解析結果修正画面表示
画像から取得したテキストデータを確認、修正できるアクションです。
【文字解析】項目取得
画像から取得したテキスト情報を定型データ化します。