ホーム API/ツール API 画像認識

画像認識

    画像認識APIは、画像内の物体等を認識しその名称等を返却するAPIです。現在3つの機能を提供しており、服や料理などを認識できるカテゴリ認識機能、書籍や食品パッケージ などを認識できるオブジェクト認識機能、人の顔を判別する顔認識機能をご利用いただけます。

    画像認識API利用イメージ
    API
    基本情報

    ■画像認識(カテゴリ認識、オブジェクト認識)

    提供 : REST※1, SDK(Android, iOS, Server side JAVA)

    ※1 ユーザデータ登録、カテゴリ認識はRESTのみ提供


    ■画像認識(顔認識、オブジェクト認識)【powerd by PUX】

    提供 : REST

    ご利用いただくためには「アカウント登録(無料)」が必要です。

    画像認識API (カテゴリ認識、オブジェクト認識) とは

    画像を送信することで、画像内の物体等を認識しその名称等を返却することができるAPIです。カテゴリ認識では、服や料理などを認識でき、オブジェクト認識では、書籍や食品パッケージなどを認識できます。それぞれの認識対象物の詳細については、下表を参照ください。

    種類 認識対象物 認識対象物の追加方法
    カテゴリ認識 以下について、カテゴリ(種類)を認識できます。
    ・シーン
    ・ファッション
    ・料理
    ・花
    ・キノコ
    ・ランドマーク
    事業への活用(任意の認識対象物の追加方法)」よりご相談ください。
    オブジェクト認識 以下について、特定の商品を認識できます。
    <公開対象>
    ・書籍
    ・食品パッケージ
    <非公開対象> ※
    ・DVD
    ・CD
    ・PCソフト
    ・ゲームソフト
    ※非公開対象の利用をご希望の方は、 お問い合わせ よりご相談ください。
    APIで簡単に追加できます。
    ※商品以外も追加できます。

    画像認識API(カテゴリ認識)

    画像認識API(カテゴリ認識)は、Deep Learningの技術を用い、画像に写っているものが、指定されたモデルの中のどのカテゴリに属するのかを判定し、そのカテゴリの名称と判定の確からしさを表すスコアを返却するAPIです。指定できるモデルとしては、結婚式等のカテゴリが定義されているシーン、Tシャツのような衣類のカテゴリが定義されているファッション、料理、花、キノコとランドマーク(現在は日本の代表的な城37種類を認識対象物として提供しており、城以外の認識対象物は随時追加予定です)を定義しています。

    pattern1

    事業への活用(任意の認識対象物の追加方法)

    任意の認識対象物の追加について、ご興味のある方は、「docomo Innovator support」まで、ご相談ください。

    画像認識API(オブジェクト認識)

      画像認識API(オブジェクト認識)は、ユーザまたは開発者が事前に登録した画像に対して、認識を行うことができます。認識結果として、ユーザが登録した名称と画像認識の確からしさを表すスコアを返却します。キャラクター、オリジナル商品や専門的な画像まで自由に画像を登録できますので、幅広い分野で画像認識技術を用いた 様々な新サービスを生み出すことができます。
      pattern1
      本機能を利用する場合は、認識させたい画像を登録し、ユーザカテゴリという独自のカテゴリ(複数の認識対象画像から構成されるグループおよびその名称)を作成・登録する必要があります。
      また、サンプルとして、商品認識機能を用意しております。商品認識機能は、書籍、食品パッケージの商品画像に対して、認識を行うことができます。多数の市販されている商品を登録しており、対象となる画像に写っている商品の名称等の情報、商品の関連情報が記載されたWebページのURL、画像認識の確からしさを表すスコアを取得できます。

    ユーザカテゴリ登録の流れ  (クリックで展開します)

    登録画像と認識精度の例

    以下に登録画像と認識精度の例について説明します。

    pattern1

    各機能の制限事項について

    各機能の制限事項について説明します。

    項目 制限
    1アプリでの利用APIキー数 1個/開発者
    データセットに格納可能な画像上限 1000枚/データセット
    データセット数 2個/ユーザトークン
    辞書数上限 2個/ユーザトークン
    カテゴリ数上限 1個/ユーザトークン
    デプロイ数上限 1個/ユーザトークン
    辞書パラメータの制限 パラメータ固定
    (処理速度:高、精度:中)
    下記API呼び出し回数
    ・データセットのアップロード(uploadDataSet)
    ・辞書作成 (createDic)
    ・画像からデータセット作成(CreateTempImangeDataSet)
    各4回/時間
    下記データの有効期限
    ・画像
    ・データセット
    ・辞書
    ・ユーザカテゴリ
    ※ユーザカテゴリへのデプロイ状態にかかわらず削除されます。
    3ヵ月

    docomo Innovator supportに申し込むことで制限の緩和が可能です。

    画像認識API (顔認識、オブジェクト認識) 【Powered by PUX】とは

    本APIは、4つの機能を有しており、主に顔やオブジェクトの画像解析、認証の機能をお使いいただけます。

    本APIを使用すると、画像内の顔の詳細な情報を取得することができます。また、事前に顔情報を登録しておくことで、個人を特定し、認証を行うことも可能です。顔だけでなく、オブジェクトや手書き文字の認識にも対応しており、画像を送るだけで事前に登録されたオブジェクトの中から一致するものを検出することができたり、タッチパッドやスクリーンなどから入力された手書き文字を高精度に認識する事が可能です。

    使ってみようAPI講座

    ドコモAPIを実際に使いながらご紹介する「使ってみようAPI講座」。画像認識API(商品認識)を例に、アプリから実行する方法を紹介します。

    よくあるご質問
    APIなどの各サービスに関するよくある質問を掲載します。
    お問い合わせ
    「docomo Developer support」及び「作ろうスマートフォン/iモードコンテンツ」に関するお問い合わせです。よくあるご質問や技術ブログで解決しない場合は、お問い合わせください。