ホーム API/ツール API 画像認識

画像認識

    画像認識APIは、画像内の物体等を認識しその名称等を返却するAPIです。現在3つの機能を提供しており、服や料理などを認識できるカテゴリ認識機能、書籍や食品パッケージ などを認識できるオブジェクト認識機能、人の顔を判別する顔認識機能をご利用いただけます。

    画像認識API利用イメージ
    API
    基本情報

    ■画像認識(カテゴリ認識、オブジェクト認識)

    提供 : REST※1, SDK(Android, iOS, Server side JAVA)

    ※1 ユーザデータ登録、カテゴリ認識はRESTのみ提供


    ■画像認識(顔認識、オブジェクト認識)【powerd by PUX】

    提供 : REST

    ご利用いただくためには「アカウント登録(無料)」が必要です。

    画像認識APIが提供する各機能概要、および機能別リファレンスを提供します。

    画像認識 (カテゴリ認識、オブジェクト認識)

    docomo_logo

    画像認識(カテゴリ認識)


    画像認識関連API

    カテゴリ認識

    画像に写っているものが、指定されたモデルの中のどのカテゴリに属するのかを判定し、そのカテゴリの名称と判定の確からしさを表すスコアを返却します。

    画像認識(オブジェクト認識)


    画像認識関連API

    画像認識

    画像認識を用いて、スマートフォンのカメラなどで撮影された画像に写る被写体を認識し、ユーザカテゴリ情報を返却します。


    フィードバック関連API

    認識結果の候補全体に対するフィードバック(※1)

    画像認識の結果に対してフィードバックを行います。認識結果として返却された候補の一覧に対するフィードバックが可能です。

    認識結果の各候補に対するフィードバック(※1)

    画像認識の結果に対してフィードバックを行います。認識結果として返却された候補のうち、1つを指定してのフィードバックが可能です。

    不適切な認識結果に対するフィードバック(※1)

    画像認識の結果として返却される各種データに関して、不適切・不適当なものがある場合に本機能を用いて報告できます。

    データの記載誤りに対するフィードバック(※1)

    画像認識の結果として返却される各種データに関して誤りがある場合に本機能を用いて報告できます。


    ユーザ認証関連API

    ユーザ認証ページ取得

    ユーザカテゴリ登録機能を利用するにはユーザ認証が必要です。本機能は、ユーザ認証ページのURLを取得します。

    ユーザトークン取得

    TwitterのOAuth認証(PIN番号)にて取得したPIN番号を元に、以下のユーザカテゴリ登録機能を利用するために必要なユーザトークンを取得します。


    データセット作成(画像ファイル)関連API

    データセットを画像ファイルから作成するには画像蓄積領域に画像ファイルをアップロードします。画像蓄積領域内に配置した画像ファイルからデータセットを作成します。

    画像蓄積領域への画像登録

    画像蓄積領域へ画像ファイル、画像ラベル、画像ファイル名を登録します。

    画像蓄積領域内データ削除

    画像蓄積領域内の全てのデータを削除します。

    画像蓄積領域に登録されている画像とラベル情報の取得

    画像蓄積領域内の画像とラベル情報の一覧を取得します。

    画像蓄積領域からのデータセット作成

    画像蓄積領域内の画像とラベル情報の一覧からデータセットを作成します。

    画像蓄積領域からのデータセット作成状況確認

    画像蓄積領域からのデータセット作成状況を取得します。


    データセット作成(画像URL)関連API

    画像URLからのデータセット作成

    1つ以上の画像URLと画像ラベルのペアを一括でサーバにアップロードし、データセットを作成します。

    画像URLからのデータセット作成状況確認

    画像URLからのデータセット作成状況を確認します。


    データセット操作関連API

    データセット一覧取得

    データセットの一覧を取得します。

    データセット詳細取得

    指定したデータセットの詳細情報を取得します。

    データセット削除

    指定したデータセットを削除します。


    辞書関連API

    辞書作成

    1つ以上のデータセットから辞書を作成します。

    辞書作成状況確認

    辞書の作成状況を確認します。

    辞書一覧取得

    作成した辞書一覧を取得します。

    辞書削除

    指定した辞書を削除します。


    ユーザカテゴリ関連API

    ユーザカテゴリ作成

    画像認識するために必要なカテゴリ(以降、ユーザカテゴリ)を作成します。

    ユーザカテゴリ一覧取得

    作成したユーザカテゴリの一覧を取得します。

    ユーザカテゴリ削除

    作成したユーザカテゴリを削除します。

    ユーザカテゴリのデプロイ

    ユーザカテゴリ作成機能で作成したユーザカテゴリに辞書作成機能で作成した辞書を登録し、画像認識で利用可能にします。

    ユーザカテゴリのアンデプロイ

    ユーザカテゴリのデプロイにて画像認識で利用可能となったユーザカテゴリで利用不可にします。

    ユーザデータ凍結情報取得

    登録したユーザデータ(画像・ラベル)が画像認識にて画像認識対象となっているか一覧で確認します。なお、凍結されたデータは画像認識対象外となります。


    ※1 画像認識の精度向上にご協力ください。認識結果が正しいかどうかを上記のAPIを通じてフィードバックしていただければ、画像認識の精度向上に利用させていただきます。フィードバックは、認識結果の一覧、もしくは、ひとつの認識結果に対して、送信することができます。


    画像認識 (顔認識、オブジェクト認識) 【Powerd by PUX】    PUX_logo

    • 顔検出

      指定された画像を解析し顔を検出します。見つけたそれぞれの顔の位置や、輪郭、眉、目、鼻、口などの顔のパーツ座標、性別、年齢、笑顔、目の瞬きなどの情報を取得することができます。

    • 顔認証

      指定された画像を解析し、事前登録した顔情報を元に個人を特定し、認証を行うことができます。

      ※事前登録できる画像は10個までです。

    • オブジェクト認識

      指定された画像を解析し、事前登録したオブジェクト情報を認識することができます。

      ※事前登録できる画像は10個までです。

    • 手書き文字認識

      タッチパッドやスクリーンなどから入力された手書き文字を高精度に認識することができます。

    よくあるご質問
    APIなどの各サービスに関するよくある質問を掲載します。
    お問い合わせ
    「docomo Developer support」及び「作ろうスマートフォン/iモードコンテンツ」に関するお問い合わせです。よくあるご質問や技術ブログで解決しない場合は、お問い合わせください。