ホーム API/ツール API 文字認識

文字認識

    ※2018年6月27日をもちまして機能提供を終了させていただきます。

    文字認識APIは、画像内の文字を読み取るWeb APIです。対象となる画像から文字や単語を抽出し、位置座標や認識精度を示すスコアも併せて得ることができます。

    API
    基本情報
    提供 : REST, SDK(Android™,iOS,Server side JAVA)
    • 審査 : アプリ審査
    利用条件 : あり※1

    ※1「ガイドライン(必読)」に記載の利用条件に予め同意していただく必要がございます。

    ご利用いただくためには「アカウント登録(無料)」が必要です。

    リファレンスを参照するAPI機能名を選択してください

    文章画像レイアウト認識要求

    スキャナや画面キャプチャで取得した画像(文章画像)から行領域の取得を行います。
    手書き文字やデザインされた文字には対応していません。認識対応言語は日本語、英語です。

    リクエストURL

    https://api.apigw.smt.docomo.ne.jp/characterRecognition/v1/layout

    メソッド : POST
    文字コード : UTF-8

    リクエストヘッダ

    キー 必須 説明
    Content-Type 送信データのMIMEタイプは、下記を指定。
    multipart/form-data

    リクエストクエリパラメータ

    キー 必須 説明
    APIKEY APIにアクセスするアプリの認証に利用する。

    リクエストボディ

    キー 必須 説明
    image 文字認識に用いる画像は、以下の条件を満たす画像のみ有効。
    ・JPEGまたはPNG形式の画像データ(透過PNGは対象外)
    ・幅および高さ4096ピクセル以内
    ・推奨文字サイズは縦横サイズ32ピクセル以上
    lang - 認識する言語は、下記のいずれかを指定。
    jpn (省略時)
    eng

    レスポンスヘッダ

    キー 必須 説明
    Content-type - 受信データのMIMEタイプは、下記を返却。
    application/json

    レスポンスボディ(JSON形式)

    キー 必須 説明
    job - 認識ジョブ。
       @id - 情景画像認識要求のレスポンスに含まれる認識ジョブID。
    サンプル値) 4A0485BB09AA43B7B3B600BA52570BC5
    @status - 認識ジョブの進行状況は、下記のいずれかを返却。
    処理成功 : success
    処理失敗 : failure
    @queue-time - リクエストの受付時刻(yyyy/mm/dd hh:mm:ss 形式)。
    サンプル値) 2013/10/22 13:11:25
    lines - 行の情報。
       @count - 行情報の数。
    サンプル値) 4
    line - 認識した行の情報。
    ※認識が成功したときにのみ返却。
       shape - 抽出した単語の形状を表す座標情報。
    各頂点は反時計回りの順序で並び、終端は開放。
       @count - 頂点情報の数。
    サンプル値) 4
    point - 頂点情報。
    @x - 認識対象画像の左上を原点(0,0)とするx座標(ピクセル単位)。
    サンプル値) 296
    @y - 認識対象画像の左上を原点(0,0)とするy座標(ピクセル単位)。
    サンプル値) 4
    message - メッセージ。
       @text - 進行状況に関する出力メッセージ。

    リクエストサンプル

    POST https://api.apigw.smt.docomo.ne.jp/characterRecognition/v1/layout?APIKEY=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
    
    Content-Type:multipart/form-data; boundary=----WebKitFormBoundaryhwZz6hhFHARN6wAB
    
    ------WebKitFormBoundaryhwZz6hhFHARN6wAB
    Content-Disposition: form-data; name="lang"
    
    jpn
    ------WebKitFormBoundaryhwZz6hhFHARN6wAB
    Content-Disposition: form-data; name="image"; filename="sample.png"
    Content-Type: image/png
    
    画像データ(binary)
    ------WebKitFormBoundaryhwZz6hhFHARN6wAB--
    

    レスポンスサンプル

    {
      "job":{
        "@id":"AAAAAAAAAAAAAAAAAAAAAA",
        "@status":"success",
        "@queue-time":"2013/10/22 13:12:36"
      },
      "lines":{
        "line":[{
          "shape":{
            "point":[
              {"@x":"7","@y":"23"},
              {"@x":"7","@y":"67"},
              {"@x":"100","@y":"67"},
              {"@x":"100","@y":"23"}],
            "@count":"4"
          },
          "shape":{
            "point":[
              {"@x":"154","@y":"25"},
              {"@x":"154","@y":"67"},
              {"@x":"296","@y":"67"},
              {"@x":"296","@y":"25"}],
            "@count":"4"
          },
          "shape":{
            "point":[
              {"@x":"301","@y":"24"},
              {"@x":"301","@y":"128"},
              {"@x":"342","@y":"128"},
              {"@x":"342","@y":"24"}],
            "@count":"4"
          }],
        "@count":"3"
      },
      "message":null
    }
    
    よくあるご質問
    APIなどの各サービスに関するよくある質問を掲載します。
    お問い合わせ
    「docomo Developer support」及び「作ろうスマートフォン/iモードコンテンツ」に関するお問い合わせです。よくあるご質問や技術ブログで解決しない場合は、お問い合わせください。