VNEXTの会社紹介資料

資料ダウンロード

ホーム > V-BLOG > 技術・サービス

【画像認識とは】仕組みや歴史、活用事例について徹底解説!

2023/11/21

近年は、さまざまな分野でAI技術が積極的に取り入れられています。

 

中には ”AIを用いなければ実現できない技術” も多く、私たちにとってAIは欠かせない存在と言っても過言ではありません。

 

AI技術を活用したサービスで「画像認識」が注目されているのをご存知でしょうか?

 

本記事では、画像認識の基礎知識から仕組み歴史活用事例について詳しく解説していきます。

 

 目次 

● 画像認識とは?

● 画像認識の歴史

● 画像認識の仕組み

● 画像認識の種類

● 画像認識の企業活用事例 

 ▶️ キューピー株式会社(不良品検品)

 ▶️ 羽田空港(認証ゲート)

 ▶️ 変なホテル(無人コンビニエンスストア)

● 画像認識を使った無料アプリ

● まとめ

● 画像認識・解析ならVNEXT

 

|画像認識とは? 

画像認識(Image Recognition)とは、画像に映る人やモノを認識する技術のことです。

 

一言でいうと、「画像に何が写っているのか」を解析します。

 

画像認識はパターン認識の一種で、近年は「ディープラーニング」という手法によって精度が向上してきており、多様な分野での導入が進んでいます。

 

人間であれば、過去の経験をもとに「画像に写っている人(物)が誰(何)なのか」を判別することが可能です。しかし、コンピューターには人間の

ように「蓄積された経験」が存在しないため、経験を活かして画像に写っている人(物)を認識することはできませんでした。

 

そこで、AIに膨大な数の画像データを読み込ませ学習を重ねることで、「蓄積された経験」を得て、画像の中のさまざまな情報を識別できるように

なったのです。

 

これを「画像認識AI」とも言います。今では、画像認識といえば「AI」の分野とイメージする人も多いのではないでしょうか?

 

では、どのような経緯で画像認識の精度は高まってきたのでしょうか?次の「画像認識の歴史」で見ていきましょう。

 

|画像認識の歴史 

画像認識は、ディープラーニングの登場によって注目を集めるようになったわけですが、その歴史は意外と古く、技術自体も昔から存在しています。

 

最近では、画像認識に「機械学習」のパターン認識技術が当たり前のように用いられており、そこにディープラーニングも加わることで高い精度での

画像認識が実現可能になりました。

 

以下では、画像認識の精度が高まっていく経緯を解説していきます。

 

|バーコード 

画像認識技術として最も古いといわれているのは、1940年代に活用され始めた「バーコード」です。

 

バーコードとは、バーとスペースの組み合わせによって、数字や文字を機械が読み取れるように表現したものを指します。

 

買い物をした時に、レジで読み込むと商品と値段が出るのを不思議と思ったことはないでしょうか?

 

バーコードは、バーコードスキャナと呼ばれる光学認識装置によって読み取ります。

 

バーコードを画像と呼ぶにはシンプルかもしれませんが、画像のパターンから情報を読み取っているという点を踏まえれば、画像認識といえるでしょう。

 

 

|テンプレートマッチング 

テンプレートマッチングとは、画像に映っている物体の位置を検出する「画像検出」という技術のひとつです。

 

検出したい物体の画像をテンプレートとして、対象画像の一部分との類似性をスライドしながら比較していきます。

これによって、「対象となる物体が画像内のどこに映っているのか」「いくつ映っているのか」といった情報を抽出することが可能になるのです。

 

しかし、この方法は照明による変化が大きい場合など、テンプレート画像からの変化が激しいケースではどうしても認識率が下がってしまう傾向に

あります。

 

また、認識したい対象物ごとにテンプレートが必要となるという点も、大きな課題でした。

 

|ディープラーニング 

2000年代に入ると、計算機の技術が発展したことで、データの処理速度も大幅に向上していきました。

 

そして、この変化によって、大量の画像データを用いた機械学習による画像認識が実現可能となったのです。画像認識技術は、これまでのような人が

行なっていたルールやモデル構築といったものから、パターン認識へと移行していきました。

 

2012年には、Googleが発表した「Googleの猫」という研究結果が大きな注目をあびました。

この研究の注目すべきポイントは、人間が教えなくともAIが猫を判別できたという点です。

 

Googleは、1000万枚の画像をAIに学習させ、AIが自発的に画像内の特徴を認識・分類できるようになったと発表しました。AIが人間の力を借りずに

特徴を認知できることが実証されたのです。

 

これは、AIが大量のデータを学習し、その特徴を自動的に学んで判断する「ディープラーニング」を用いています。

ディープラーニングは、近年の画像認識の精度を飛躍的にアップさせた技術となり、世界中から注目されています。

 

|画像認識の仕組み 

画像認識はどのような仕組みで、画像を認識・解析しているのでしょうか?

以下では、画像認識の基本的な仕組みを解説します。

 

例として、AIが画像の中から「F」という文字を認識する流れをみていきます。

 

 

Step1:AIが「F」という文字の特徴を以下のいずれかの方法で学ぶ

 

Step2:認識させたい画像を入力する

 

Step3:AIが画像を認識しやすく処理する

 

  画像の背景やノイズ、歪みなどを除去

  明るさや色合いを調整

  輪郭を強調して抽出 など

 

Step4:AIが「Step2」の画像の特徴を抽出する

  右斜めの線

  平行線

  真ん中に縦棒

  各パーツが真ん中の縦棒を軸にくっついている など

 

Step5:画像識別・判断

AIが他の文字と特徴を比較し、該当するものを識別する

 

Step6:AIが画像を「F」と認識する

 

ここまでが、基本的な画像認識の流れとなります。

 

この仕組みに、さらに「ディープラーニング」を用いることで画像認識の精度が向上します。

 

ディープラーニングにはいくつかの種類がありますが、画像認識に用いられるモデルはCNN(畳み込みニューラルネットワーク)と呼ばれます。

 

画像に対する高いパターン認識能力があり、素早く識別できることが特徴です。

 

CNNは画像の特徴を抽出する「畳み込み層」と、特徴を分析する「プーリング層」で構成されています。

 

これまでの技術では、人間が特徴を設計したものに対して機械が識別をしていましたが、CNNを使用することで、人間が事前に特徴を定義しなくても

AIが膨大な特徴量を学習し、被写体を識別できるようになりました。

 

|画像認識の種類 

コンピュータ上で行われる画像認識は、人間のように「視覚」で認識するのではなく、オブジェクトの抽出やピクセルデータの処理といった複雑な

処理が必要になります。

 

画像認識は、画像の種類によって対象物の「形状」「色」「複雑さ」「データ数」などで差が生じることから、画像認識はいくつかの種類に分けら

ています。

 

つまり、扱う画像データによって技術領域を分類しているということです。

 

画像認識の代表的な種類は以下が挙げられます。

 

物体認識

物体検出

画像キャプション生成

・顔認識

・文字認識(OCR)

 

以下では、それぞれを詳しく解説していきます。

 

|物体認識 

物体認識とは、対象の物体と同一の物体が画像内に存在するかどうかを検証する技術のことです。

画像に映っている物体のカテゴリーを特定するなど、画像に含まれている物体の情報を抽出することができます。

 

|物体検出 

物体検出とは、画像に写る物体を識別し、位置を特定する技術です。

物体認識とは実行方法が異なりますが、対象となる物体の特徴を抽出する際に、その物体の「位置」も重要になるため、物体認識と併用される

ケースが多いです。

 

|画像キャプション生成 

画像キャプション生成とは、CNNと自然言語処理を組み合わたもので、入力した画像内に何が映っていて、映るものがどのような状況かを判別し、

説明文を出力するものです。

 

簡単に言うと、「画像に写った物体の説明文を生成する」ことです。

 

|顔認識 

顔認識とは、人間の顔画像から目立つ特徴を抽出していく技術のことです。

この技術を利用することによって、顔の識別を行ったり、似た顔の検索を行ったり、顔のグループ化を行ったりすることができるようになります。

 

|文字認識(OCR)

文字認識(OCR)は、画像に写る数字や文字を識別する技術です。

紙に書かれている手書きの文字や、印刷された文字などスキャナやカメラで画像データ化をし、テキストを抽出、デジタルデータ化ができます。

近年では、従来のOCRにAIを搭載した「AI-OCR」により、高精度な文字認識ができるようになりました。

 

OCRについては以下の記事で詳しく解説しています。

▶︎ 【OCRとは】文字をデジタル化して業務効率化!〜AI-OCRについても解説〜

 

|画像認識の企業活用事例 

今や、画像認識はさまざまな分野・業界で導入されています。以下では活用事例をご紹介します。

 

|キューピー株式会社(不良品検品)

キューピー株式会社では、惣菜の原料となるカット野菜の検査に、AIを活用した自社開発の原料検査装置を導入し、不良品検品の運用を開始しました。

 

当初は、不良品・良品それぞれのパターンを学習させる方法を検討していましたが、不良のパターンが無限にあることから、良品のみの教師データを

作り、学習させました。

 

そして、「良品」に該当しないものをすべて「不良」として検出することで、制度が飛躍的に向上したのです。

 

出典:キューピーアヲハタニュース

 

|羽田空港(認証ゲート)

羽田空港では、入国手続きを簡素化するために、認証ゲートに画像認識を導入しました。

 

法務省入国管理局では、外国人の入国手続きにより多くの人員を割く必要があり、そのためには日本人帰国者の入国手続きを簡素化する必要があるため、

こうした顔認証ゲートの導入に踏み切りました。

 

顔認証ゲートの利用にあたり、事前登録は一切不要で、日本のパスポートに内蔵されているICチップ内の顔写真と、入国ゲートで撮影した本人の写真を

照合し、本人確認を実施しています。

 

|変なホテル(無人コンビニエンスストア)

ハウステンボス株式会社が運営する「変なホテル ハウステンボス」で、日本初の本格的な無人コンビニをオープンしました。

 

この無人コンビニ「スマートコンビニ」でも、顔認証や商品の画像認識が活用されています。

 

無人コンビニの仕組みは、店舗の入り口で顔を登録。購入したい商品を精算用の台に並べるだけで画像が認識され、明細と支払額が表示されます。

明細を確認後、顔認証を受けてから購入することができます。また、退店にも顔認証が必要です。

 

出典:PR TIMES

 

|画像認識を使った無料アプリ 

画像認識は私たちにとって身近な存在となっており、画像認識を使ったフリーソフトや無料アプリなどがリリースされています。

以下では、画像認識を使ったさまざまな分野の無料アプリを3つご紹介します。

 

|PlantSnap 

 

道端で花を偶然見かけた時、「この花は何という名前なのだろう」と気になったことはありませんか。しかし、何と検索をかけて良いものかわからない

こともありますよね。

 

「PlantSnap」は、気になる植物を写真に撮るだけで、60万種以上に及ぶという植物のデータの中から写真に写された植物と近いものを、名前と共に

示してくれます。

 

日常で、ふと目に入った植物や花をこのアプリで検索してみてはいかがでしょうか?

 

|Googleレンズ 

 

Googleレンズは、スマホ内に保存してある写真や画像をそのままGoogleの画像検索に載せ、類似結果を表示してくれる便利なアプリです。

 

また、その場で撮った写真からも検索結果を表示してくれます。

 

対象を絞ることなく人物や服から建物や楽器に至るまで何でも探してくれたり、画像の一部のみを選択範囲に指定できるので、その部分だけの画像認識も

可能で使い勝手が良いです。

 

|WEAR 

 

街中やSNS、あるいは雑誌で気になるコーディネートを見つけたけれど、商品名がわからなくて気になるという経験はありませんか。

 

「WEAR」は、元々、自分のお気に入りのファッションコーディネートをシェアできる「コーディネートSNS」とも呼べる存在ですが、

画像認識アプリのような機能も備わっています。

 

たとえば、雑誌などに掲載されている服の着用写真をスマホカメラで撮影し、それで「画像検索」をすると、WEAR上にあるコーディネートが

ヒットします。

 

また、ヒットした商品をそのまま購入できるので服好きの方にはおすすめのアプリです。

 

|まとめ 

画像認識とは、「画像に何が写っているのか」を機械やコンピュータが認識する技術のことです。

 

画像認識にはAI技術が深く関わっており、ディープラーニングという手法を用いることで高精度になっています。

 

さまざまな分野・業界での活用事例では、画像認識を利用することで、人的・時間的リソースなどのコスト削減や業務効率化に貢献しています。

 

また、AIによって収集・分析した画像データをもとに新たなる価値を生み出し、新規事業・サービスの中で活用されています。

 

AI技術の発展に伴い、今後の画像認識技術にも注目していきたいです。

 

|画像認識・解析ならVNEXT 

弊社VNEXTが提供する画像認識・解析「V-AI」は、独自の画像処理技術を搭載したAIで95〜99%の高精度な画像認識・解析ソリューションを

提供しています。

 

製造現場のDX化、交通インフラ管理、顧客行動の可視化・データ化など、ビジネスAIであらゆる課題を解決します。

 

|「V-AI」の3つの特徴 

 

◆ 画像認識・解析で「新しい」を発見 

人の目で見ただけでは判断できないものを、画像認識・解析でヒトやモノを検知し、ディープラーニング技術でデータを可視化!

通常では発見できない「新しい」が見えることで、業務の効率化や改善、経営戦略、DX化などにつながります。

 

◆ ニーズに合わせたソフトを構築 

膨大な教師データは不要で、「対象の判別基準」の情報と「少量のサンプル画像」からお客様のニーズや目的に合った専用の画像認識・解析ソフトを

構築します!

 

◆ 動きのある対象にも対応 

ヒトの行動や高速道路のモニタリングなど、動きのある対象にもリアルタイムで解析!

検知した情報から、解析データを活用して、マーケティング戦略や交通インフラ管理などを行うことができます。

 

画像認識・解析の導入をご検討の方は、まずはご要望をお聞かせください!

お客様から課題や要望をヒアリングし、ご希望の結果が出せるようにカスタマイズしていきます。

 

▶︎ お問い合わせ:https://vnext.co.jp/contact.html?view=contact