2024/03/15

「Hey Siri」「OK Google」とスマーとフォンや機器に日常的に呼びかけることが自然になってきた昨今、注目されているのが「VUI」です。
VUIとは、Voice User Interfaceの略で、声を使ってあらゆるやりとりや操作を行うことを指します。
本記事では、UIの進化とVUIの基礎知識、活用事例や利用メリットなどについて解説していきます。
目次
● VUIとは?● VUIとUIの進化● VUIを活用している事例● VUIのメリット▶︎ 操作入力の手間ヒマが少ない▶︎ インターネットを使える人が増える▶︎ 多くの人の生活に入り込みやすい● VUIのデメリット▶︎ プライベートな空間以外で使いにくい▶︎ 正しい情報の入力が難しい● VUIを開発する際に必要な技術● VUIの今後の進化● まとめ |
|VUIとは?
VUI(Voice User Interface)とは、PCやスマートフォンなどのデジタルデバイスの操作画面や操作方法であるUIの中で、声を用いて操作するものを指します。
身近な例では、iPhoneのSiriを代表する音声アシスタントが挙げられます。
近年VUIが注目されている背景のひとつには、AI技術を活用した音声認識技術の精度が向上してきていることが挙げられます。
特に、ディープラーニングを中心にAI技術が発達してきたことによって、音声認識の精度向上はもちろんのこと、認識した音声をテキスト情報として処理する自然言語処理の技術が実用的なレベルになり、AppleのSiriやAmazonのAlexa、Google Assistantをはじめ、さまざまな音声アシスタント製品が登場していることも近年の傾向です。
|VUIとUIの進化
そもそもUIとは、デジタルデバイスの操作画面や操作箇所または入力方法や入力手段の総称のようなものですが、さまざまなタイプが存在し、技術進化とともにその利便性が高められながら進化してきました。
|CUI(Character User Interface)
CUI(Character User Interface)の「Character=キャラクター」は、英数字などの「文字」を意味します。
CUIとは、今では当たり前のように行われている文字入力によってデバイスを操作する方法です。
コンピューターが登場した初期から存在するオーソドックスなUIではありますが、現在でも各種プログラミングやWindowsのコマンドプロンプトなど、今もなお用いられているUIの1つです。
|GUI(Graphical User Interface)
CUIの次に登場したUIが、グラフィックによってデバイスを操作するGUI(Graphical User Interface)です。
PCのデスクトップ上に並んだアイコンをクリックして開くという操作方法はGUIの代表例で、現在でも日常的に活躍しているUIです。
CUIでは原則、決まったプログラミング言語でデバイスに対する指示を入力することから専門的な知識が必要である上、ルールに従った入力手順が求められるため、一般のユーザーにとっては決してハードルが低いものではありませんでした。
一方、GUIのような直感的な操作を可能とするUIが登場したことは、PCをはじめとするデジタルデバイスを一般家庭にも広く普及させることに貢献したことに加え、UIの重要性を社会的に認知させることにもなりました。
|NUI(Natural User Interface)
近年身近なUIとして普及し、様々なデジタルプロダクトにも搭載されるようになったのがNUI(Natural Interface)です。
「Natural=ナチュラル」、つまり人にとってより日常動作に近い自然な方法でデバイスを操作することを目的にしたUIで、スマートフォンのタップ操作やスライド操作、ATMのタッチパネル操作などのようなジェスチャー操作が代表的な例ですが、もちろん今回の記事のテーマである音声操作、VUIもこのNUIの一種です。
「五感によるUI」とも言われ、今の時代にまさに主流になっているUIがこのNUIですが、その台頭の背景には、赤外線センサーやBluetooth、モーションセンサーなど、各種センサーの技術向上が挙げられ、マウス操作が中心だったGUIの時代に比べると、その操作はさらに直感的でわかりやすい方法へと進化してきています。
|OUI(Organic User Interface)
OUI(Organic User Interface)は、デジタルデバイスが操作画面といった“操作や入力のツール”としてではなく、まるでそれ自体を操作しているかのような“操作対象”になってしまうような概念です。
有機を意味する「Organic」は言い換えると、“そのモノの特性に本質的に由来する”といった意味になります。
OUIは、2008年頃から提唱されてきている概念ではあるものの、現段階で完全にはこの領域に達していると言い切れず、近未来のUIの姿だといえます。
OUIの大きな特徴として挙げられるのが「3次元操作」です。
現在、種集のデジタルデバイスの画面のUIのほとんどは縦・横の2次元で開発されていますが、OUIではこれに奥行きも含めた3次元でのUIがベースになります。
近年、擬似的ではあるもののAR(Augmented Reality:拡張現実)やVR(Virtual Reality:仮想現実)、プロジェクションマッピングを活用したUIも登場しています。
|VUIを活用している事例
次は、VUIがどのような場面で活用されているのか、具体例をご紹介します。
|スマートスピーカー
VUIが活用されている機能で有名なものは、音声アシスタントつきのスマートスピーカーです。
Amazonの「Alexa」、Apple製品の「Siri」、Googleアシスタントの「OK Google」などの機能として製品化されています。iPhoneのSiriを起動して「Hey Siri, ○○の曲をかけて」と話しかけると、必要な対応をしてくれます。
家電と接続しておけば、呼びかけに応じてエアコンや照明などを操作できます。インターネットに接続して「トイレットペーパーを補充して」と呼びかければネットショップで購入してくれるなど、使い方はさまざまです。
|カーナビ
カーナビを運転中に操作することは危険ですが、VUIが搭載されていれば運転中にカーナビやスマホを操作することなく、必要な情報を得ることができます。
VUIに音声で「○○に行きたい」、「○○の天気を教えて」、「音楽をかけて」と呼びかけると、必要な操作を行ってくれます。
LINEがトヨタと連携して出したカーナビアプリではそれが可能となっており、ドライブ中でもスマホの画面を見ずに色々な操作ができるので安全にも繋がるものとなっています。
AIアシスタント「Clova」の技術を使っており、今はアプリでの使用ですが、近いうちに実際の車にも搭載されるようになるでしょう。
参考:LINEが新アプリ「LINEカーナビ」を発表、トヨタのナビ基盤とClovaのVUIを統合
|スマート冷蔵庫
VUIがIoTと一緒に話題になったこともあり、家電に組み込まれていることも多くあります。
たとえば、LGが発売している「Smart InstaView」は音声アシスタント機能を内蔵しており、様々な操作が音声を使って行えるようになっています。
Smart InstaViewではAmazonを使った食材の注文も冷蔵庫に話しかけるだけででき、レシピの検索までしてくれます。
料理中は料理で手が塞がっているので、なかなか手を使った機器操作が難しいですが、音声アシスタント機能があればいちいち手を止める必要がないので非常に便利です。
参考:冷蔵庫はここまで進化した!音声で6000もの操作が可能な「Smart InstaView」
|VUIのメリット
VUIによってユーザーにもたらされたメリットは多くあります。
ここでは、代表的なメリットを3つご紹介します。
|操作入力の手間ヒマが少ない
音声だけでデバイス操作が可能になるVUIは、これまでのUIと比べて一つの操作を達成するための手間ヒマが圧倒的に少ないことが特徴です。
たとえば、目的地への最短ルートを調べる場合、マウスやキーボードを使ったPC操作が必要となるGUIではインターネットブラウザでマップを開いて目的地を入力する、あるいは公共交通機関のWebサイトなどを検索して補足的な情報を集める必要もあるかもしれません。スマートフォン操作のような一部のNUIでも、手順としては似たような内容になるはずです。
一方のVUIでは、音声アシスタントを立ち上げさえすれば、日常会話をするように「◯◯への行き方を教えて」とだけ伝えれば、デバイス側でデータベースにアクセスし、必要な情報を探索、自動音声で回答してくれます。
|インターネットを使える人が増える
今までのスマートフォンなどでは、手を絶対に使わないといけない、もちろん字も読めないと使えないものでした。
しかし、VUIの普及により、障害などで手が不自由な人、または字は読めないが音声なら大丈夫という人がVUIを通してインターネットを使えるようになりました。
また、「話しかけるだけ」というのはキーボード入力などの手間が不必要なので製品を使う学習コストが低いとも言えます。
たとえば、どうしてもキーボード入力が覚えられないという人も、いつものように話しかけるだけで操作できるのであれば使えるはずです。
本などの読み上げ機能なども充実してきており、より多くの人がインターネットを通じて娯楽を楽しめるようになるでしょう。
|多くの人の生活に入り込みやすい
VUIの製品は家などにおかれることが多く、より日常生活と密接なものになっています。
その製品の性質上、外でずっと喋りながら機械を操作したいという人は少ないので、必然的にVUIが使われているのは家の中や車で使われるような製品が多くなりますが、そのためより日常に溶け込むものになっています。
また、ソフトバンクのPepperくんや、ショッピングモールや空港で見る案内ロボットもVUIで操作することが可能なことが多く、様々な人が話かけている姿を見られます。これが「キーボードで入力してください」だと入力の手間が多く少し躊躇ってしまいますが、音声だからこそ気軽に話かけて使えるのかもしれません。
|VUIのデメリット
VUIには、”音声だからこそ“ のデメリットが存在します。
|プライベートな空間以外で使いにくい
VUIは、声に出して操作をするので、家やプライベート空間以外では使いにくいという問題があります。家の中やプライベート空間であれば、AlexaやSiriに周りを気にせずに話しかけられる人が多いです。
しかし、駅や人の多い場所で「○○駅の生き方を教えて」と言うことに抵抗がある人もいるでしょう。VUIは一度話しかけただけで正しく認識しないこともあり、何度も話しかける様子を周りに見られることが嫌な人もいます。
また、静かな場所で声を出しにくい、電車や車などの騒音が大きくて音声を認識しないなど、使用できる空間が限られてしまうという問題もあります。
|正しい情報の入力が難しい
人間の言葉を機械が完全に理解するというのは難しい部分もあり、話かけても間違った単語で認識されたりとVUI側でうまく内容をキャッチしてもらえない時は、何度も聞かれ直したりします。
実際、私もたまに音声でメッセージ送信や検索を試みますが、あまり聞き取ってもらえないこともあります。
日々いろんな人が使うことでデータが溜まり、より改善していくと分かっていても、なかなか分かってもらえない時はとても歯痒いです。
|VUIを開発する際に必要な技術
VUIに使われている技術は、簡単にいうと大きく3つのフェーズに分けられます。
|音声認識
スマートスピーカーなどに対して話した言葉を認識する必要があります。
どのような言語なのか、どのような声色でどんな音が発せられたのかを捉えます。
|AIを活用した解析・分析ロジック
捉えた音声をAIで解析し、分析します。
ユーザーがどんなことを聞いているのかをデータを元に分析して処理し、結果を返します。
|テキスト変換
処理した結果をテキストにし、それをまた音声にして返します。
このようにして、ユーザーは結果を音声で聞くことができるのです。
AmazonのAlexaなどは開発のためのパッケージが提供されているので、興味のある方は触ってみてはいかがでしょうか。
https://developer.amazon.com/en-US/alexa
VUIでは、人間の声・話という曖昧なものが相手になるので、よく言えば柔軟、違う言い方をすれば「それっぽいもの」を作ることになるようです。
オフショア開発ではVUIをメインで扱っている会社は少ない印象ですが、webエンジニアの基礎があれば比較的開発はやりやすいと言われており、これからベトナムなどのオフショア開発でもVUIの開発をできる人は多くなっていくでしょう。
|VUIの今後の進化
現在特に著しい普及をしているVUIですが、これらを使うことで日々の煩わしい作業が解決されます。
最近ではUIデザインの制作に使用するソフトウェア「Adobe XD」の大型アップデートにより音声コントロール機能が搭載され、音声操作のUIデザインが行えるようになりました。
IoT業界全体が盛り上がりを見せている昨今、VUIを使用したデバイスは業界や業種を問わず続々と誕生していくことが考えられます。
|まとめ
どんどん私たちの生活に溶け込んでいるVUIですが、知れば知るほどそのメリットを感じます。
デメリットはありますが、VUIは音声で手軽に操作できる優れたインターフェースのため、今後もさまざまな場所で活用されていくでしょう。
VUIデザインは開発時に欠かせないものとなっていく可能性が高いため、キャッチアップしていきましょう。
VUIを活用したサービス開発が可能な外注先をお探しなら、AIに強い弊社VNEXTに一度ご相談ください!
▶︎ お問い合わせ:https://vnext.co.jp/contact.html?view=contact