VNEXTの会社紹介資料
2023/09/20
近年、AI市場において「生成AI」と呼ばれるAIが飛躍的な発展を遂げています。
生成AIは、画像や音声、テキストなどさまざまなコンテンツを手軽に生成でき、業務効率化や新たなアイデアの創出など、多くのメリットが
期待できる技術です。
本記事では、生成AIの基本から種類、使い方、活用例などについてわかりやすく解説していきます。
目次
|生成AIとは?
生成AIとは、「ジェネレーティブAI(Generative AI)」とも呼ばれるAIの一種です。
機械学習のひとつであり、学習済みのデータを活用してオリジナルデータを生成するAIを指します。
従来のAIは決められた行為の自動化が目的であるのに対し、生成AIはデータのパターンや関係を学習し、新しいコンテンツを生成することを
目的としています。
近年では、テキスト生成AIの「ChatGPT」をはじめ、画像生成AIの「DALL·E 2」など多種多様な生成AIがビジネスシーンや日常生活で活用され
始めています。
具体的には、テキスト生成AIで文章の作成を行ったり、画像生成AIで動画制作に使用するサムネイルを作ったりすることが可能です。
|従来のAIとの違い
生成AI(Generative AI)の「Generative」という単語は、「生産または発生することができる」という意味です。
生成AIについての厳密な定義はありませんが、「人間のようにクリエイティブな成果物を生み出せるAI」ということができます。
生成AIが注目されている理由は、従来のAI(生成AIが出てくる前のAI)とは学習の視点や目的などいくつか違いがあるからです。
従来のAIは、決められたタスクの自動化が目的であり、出力されるものは数値データやテキストデータなど構造化されたものが多く、
新しい形で創造されたものではありませんでした。
一方で生成AIは、生成するために学習をし、情報の特定や予測ではなく、創造することを目的としています。
学習に使うアルゴリズムは両者とも「ニューラルネットワーク」ですが、生成AIは構造化されていないデータセットをもとに学習し、
新しいコンテンツを生成します。
|生成AIの基本的な使い方
生成AIを使用するためには、各AIツールに対応した形式でデータを入力する必要があります。以下では、3つの生成AIの例を紹介します。
◇ テキスト生成AI:テキスト(プロンプト-Prompt)入力
◇ 画像生成AI:テキスト、画像入力
◇ 文字起こし生成AI:音声入力
◆ テキスト生成AI
Web上のテキストボックスにAIへの要望や質問など(これをプロンプト(Prompt)といいます)を記述して送信することで、AIが入力された内容を
解析し、適切な答えを返します。
代表的なツールは「ChatGPT」や「Google Bard」が挙げられます。
◆ 画像生成AI
テキスト生成AIのようにプロンプトをもとに画像を生成するものや、学習元になる画像をAIツールに入力することで、入力された画像をAIが学習し、
それらの画像の特徴を持った全く新しい画像を生成します。
代表的なツールは「DALL·E 2」や「Adobe Firefly」が挙げられます。
◆ 文字起こし生成AI
音声データをAIに入力し、テキストとして出力するものです。
商談や会議の音声をAI技術を活用し、リアルタイムで自動文字起こしをするなどビジネスでも活用されています。
代表的なツールは「Whisper」や「Google Docs」が挙げられます。
|生成AIの種類
生成AIには、画像生成・テキスト生成・音声生成・動画生成など、いくつかの種類があります。
目的や用途に応じて生成AIを使い分けることで、希望している形に近い成果物を生み出すことが可能です。
|テキスト生成
テキスト生成AIは、フォームに入力した「プロンプト」と呼ばれる文章を送信すると、自動的にテキストが生成されるAIのことです。
AIが文章の内容を解析して、回答となるテキストを生成します。
使用されている言語モデルによっても精度は異なりますが、現在多くの人が利用しているであろう「ChatGPT」などでは、まるで人間が答えを
返しているかのような高精度な回答が可能になっています。
テキスト生成AIは、文章を作成するだけでなく、たとえば、プログラミングでエラーが表示されたコードをそのままAIに入力してエラー箇所を
指摘してもらう、旅行のプランニングの提案をしてもらう、といった使い方もできます。
|画像生成
画像生成AIは、テキストで指示や学習元になる画像を入力するだけで、イメージに近いオリジナルの画像を生成できるAIです。
画像生成AIを活用すると、Webサイト用の素材を簡単に生成してクリエイティブな作業にかかる時間を短縮したり、新たなアイデア創出のための
ひらめきとして参考にできるため、さまざまなクリエイティブ業界において、業務のサポートなど幅広い活用が期待されています。
|音声生成
音声生成AIは、音声データやテキスト入力することによって、新しい音声データを生成できる生成AIです。
たとえば、ある一人の声を大量に学習させると、その人の声質と全く同じ声で、さまざまな文章を自由に話す音声を生成することが可能になります。
音声生成AIを活用して、本人の声を収録せずに任意のナレーションを読み上げたり、アバターに手軽に音声を付加したりできます。
|動画生成
動画生成AIは、テキストで指示したイメージに近い動画を生成するAIです。
動画生成AIはAIの中でも開発の難易度が高いといわれていますが、画像生成AIの発展形として近年はさまざまなサービスが登場しています。
現時点では数秒ほどの短い動画を生成することができる程度ですが、技術が進歩すれば、将来的には、簡単なプロモーションビデオの作成などにも
活用できる可能性があります。
|生成AIの仕組みとモデル
生成AIに活用されているデータ分析手法は主に「ディープラーニング(深層学習)」と呼ばれる機械学習の手法であり、与えられた学習データをもとに
AI自身が最善の回答を探し出していくことによって「創造」をすることができます。
生成AIがコンテンツを生み出すために用いられている生成モデルは、AIの性質に応じて異なるモデルが使われています。
以下では、代表的な生成モデルをご紹介していきます。
|GPT(Generative pre-trained transformer)
GPTとは「Generative Pre-trained Transformer」の略であり、OpenAIが開発した大規模言語モデルを指します。
AIが大量のテキストデータを学習し、文章の生成や言語理解の能力を身につけ、次の予測や推測ができるようになった"次世代型言語モデル"です。
【GPTを利用したテキスト生成の流れ】
Step1:ユーザーがフォームにプロンプト(要望や質問)を入力・送信する
Step2:AIがプロンプトの内容を解析して、最適な回答を導き出す
Step3:AIは回答を出力し、ユーザーに伝える
GPTの仕組みについては、こちらの記事で詳しく解説していますのでご覧ください。
▶️【GPTってなに?】GPTの仕組みと歴史、活用方法を徹底解説!
|VAE(変分オートエンコーダー)
VAE(変分オートエンコーダ)とは、「Variational Auto-Encoder」の略称で、学習用データから特徴を学び、そのデータの特徴をもとにその性質を
持った全く新しい画像を生成できるモデルのことです。
VAEは、特定の傾向を持つ複数の作品を学習し、その作風に近い作品を生み出すことが特徴です。
また、複雑性の高い画像の特徴を捉えることにも適しているため、構造が複雑な工業製品の異常検知などに活用されています。
【VAEのコンテンツ生成イメージ】
Step1:ユーザーが学習用のデータをAIに与える
Step2:AIが与えられた学習用のデータから特徴を学ぶ
Step3:AIが学習したデータの特徴から、新しいコンテンツを生成する
Step4:生成したコンテンツをユーザーに提供する
|GAN(敵対的生成ネットワーク)
GANは、「Generative Adversarial Networks」の略称で、「生成器(Generator)」と「識別器(Discriminator)」という2つのネットワークを
2つのネットワーク構造を利用して新たな画像を生成するモデルです。
・Generator=ランダムに作成されたデータ
・Discriminator=学習用の正しいデータ
このGeneratorとDiscriminatorを競わせながら学習することで、精度の高い画像を生成できます。
【GANのコンテンツ生成イメージ】
Step1:何らかの数値(基本は乱数)からGeneratorを生成する
Step2:正しいデータのDiscriminatorを用意する
Step3:GeneratorとDiscriminatorを比較して、Generatorが本物かどうかを判定する
Step4:1~3を繰り返し、Generatorの精度を高める
Step5:精度の高まった画像を出力する
この仕組みを活用すると、低解像度の画像から高解像度の画像を生成したり、テキストから全く新しい画像を生成するなど、さまざまな応用が可能です。
|拡散モデル
拡散モデルは、GANの発展形ともいえるモデルで、ノイズの追加と除去を通じて高精度な画像を生成します。
画像生成AIの「Stable Diffusion」や「DALL-E2」はこのモデルを採用しています。
学習用の画像にノイズを追加し、次にこのノイズを徐々に取り除くことで、元の画像を復元するプロセスがあり、これを繰り返して画像生成を行う
仕組みをAIに学習させます。
【拡散モデルのコンテンツ生成イメージ】
Step1:学習用の画像にノイズを追加する
Step2:ノイズが付加された画像からノイズを除去する
Step3:2を繰り返し、元の画像を復元する
Step4:1~3の仕組みを繰り返して、高精度な画像を生成する
|生成AIでできること
上述のように、生成AIにはさまざまな種類と使い方があります。以下では、生成AIを用いることで実現できることを5つご紹介します。
|定型業務の効率化
生成AIでは、全体の流れや作業手順が定まっている業務の効率化が期待できます。
たとえば、「文字起こし生成AI」を活用した際の業務効率化について考えてみます。
文字起こし生成系AIは、入力された音声をAIが自動的に認識して、音声の内容をテキスト化することができます。
そのため、会議の録音データをテキスト化して議事録にしたり、コールセンターの応対を録音したデータを文字起こししてシステムに登録するなどが
可能になります。
これまで、手動で行ってきた議事録の作成や録音データを聞き返すといった必要がなくなるため、業務効率化につながります。
|クリエイティブな提案
生成AIは、人が思いつかないクリエイティブな部分を補足してくれる役割もあります。
たとえば、商品やサービスのキャッチコピーが思い浮かばないときに「○○の商品につけるキャッチコピーのアイデアが欲しい」と指示するだけで、
キャッチコピーの候補をいくつか提案してくれます。
また、頭の中で考えているいくつかの情報をテキスト生成系AIに与えて、作品のアイデアをもらうような使い方もできます。
|セロコストでコンテンツ作成が可能
内製や外注で対応していたコンテンツ作成を生成AIに代替させ、ゼロコストで作成することも実現できます。
たとえば、マーケティングの活動でブログ記事の作成をしている場合、記事のサムネイルのイラストを外部のイラストレーターに外注していたとします。
これを画像生成AIで作成することで、外注費を丸ごと削減できます。
また、自社のHPで動画を制作する際に、音声生成AIでBGMを生成すれば人件費とリソースの削減が可能になります。
|カスタマイズの向上
生成AIは、学習データから新しいデータを生成するため、特定の目的に合わせてカスタマイズすることができます。
たとえば、旅行会社の予約アプリがあり、チャットボットで顧客が質問に答えていくことでおすすめのツアーを提案していたとします。
これをオペレーターが顧客に最適な旅行プランを提案することを目的とした生成モデルにカスタマイズすることで、旅行の相談情報(日数、人数、
旅行形態など)を入力するだけで旅行プランをいくつか提案することができます。
これにより、顧客情報をもとにパーソナライズされた提案も可能になります。
|品質の向上
生成AIを活用すると、多くの場合、高品質なデータを生成することが可能です。
実際に、2023年6月、みずほと富士通がシステム開発に生成AIを活用し、品質向上を狙った業務の実証実験を始めると発表しました。
具体的にはシステム開発段階において、設計書のレビュー業務を生成AIで支援します。
過去のレビュー表やレビュー観点のノウハウをもとに、生成AIが設計書の記載間違いや漏れを自動検出し、開発品質の向上を目指すというものです。
|生成AIにできないこと・課題
さまざまなことができる生成AIですが、できないこともあります。
生成AIは、「学習したデータに基づいた特徴を持つコンテンツ」を作ることは得意ですが、人間の感情を読み取って、その人に合わせたオリジナル
コンテンツを提供するような挙動は不可能です。
上記のように「人間の感情に寄り添った、人間と同様の思考ができるAI」、ドラえもんみたいなAIを「AGI(汎用性人工知能)」と呼びますが、
現在のところ、AGIは現実に存在していません。
また、現時点で生成AIが抱えている課題もいくつかあります。
|情報の信憑性
生成AIを活用して出力された情報は、必ずしも正しいとは限りません。
たとえば、ChatGPTは2021年9月までの情報を学習しており、最新の情報が反映されていないため、近年の情報やリアルタイム性の高い情報を
回答することができません。
そのため、真偽性を確かめずに出力された情報をそのまま使用すると、自身の信頼性を大きく損なうおそれもあり、十分な注意が必要です。
|著作権の問題
画像生成AIや音声生成AIにおいては、著作権問題に発展する懸念もあります。
たとえば、画像生成AIでは、有名イラストレーターの作品をAIに多数学習させることで、イラストレーターの絵柄とそっくりなイラストを
生成できてしまいます。
結果的に学習元となったイラストレーターの著作権を侵害するおそれがあるだけでなく、イラストレーターの知らないところで自身の作品で
あるかのようなイラストが拡散されてしまい、風評被害を受ける可能性もあります。
文化庁では、生成された画像などが既存の画像(著作物)との類似性や依拠性が認められれば、著作権者は著作侵害として損害賠償請求/差止請求が
可能なほか、刑事罰の対象ともなるとして「AIと著作権の関係等について」という文書を公開しています。
|サイバー攻撃への悪用
テキスト生成AIは、新たな文章を自動的に生成することに長けていますが、その性質を悪用して、フィッシングメールの文面を生成したり、
サイバー攻撃用のプログラムのコードを生成したりする目的で使われる可能性もあります。
現時点では、生成しようとしている文面やコードが悪意を持ったものであるかどうかを生成AI自身が判断できません。
そのため、利用者側の意識次第でサイバー攻撃へ悪用されてしまい、サイバー攻撃の激化につながることも考えられます。
|生成AIの活用例
生成AIはビジネスでも活用されてきています。以下では、企業の生成AI活用例をご紹介します。
|コカ・コーラ
コカ・コーラは、同社の有名なビジュアルイメージに、ユーザーの独創性を追加して、アート作品をクリエイトできるAIプラットフォーム
「Create Real Magic」を立ち上げました。
「Create Real Magic」には、「DALL-E」や「GPT」などの生成AIモデルが組み込まれており、ユーザーはコカ・コーラのボトルやロゴ、
それにサンタクロースやシロクマなどのキャラクターを使ったアート作品を制作できます。
従来だとコカ・コーラの商品広告を作ろうと思うと、それなりの技術なり才能が必要だったわけですが、今回はこのプラットフォームを使い
「コンテスト」を開催して商品広告を作ったのです。
サイトの利用期間は終わってしまっているので、その実際の機能を使うことはできないのですが、世界各国のアーティストが応募した作品を
見ることができます。
|ブルームバーグ
ブルームバーグは、金融業界向けの大規模言語モデル「BloombergGPT」を開発しました。
同社は、金融ビジネスの複雑さと独特の語彙のため金融情報に特化した訓練を受けたAIが求められていると提言しています。
大量の金融データから学習したこのモデルは、リスク評価や市場センチメントの把握、さらには会計や監査の自動化の可能性を持ち、これにより
同社の顧客により良いサービスを提供できるようになり金融業界にAIの可能性を最大限に引き出せるようになると期待されています。
|アサヒビール
アサヒビールは、Azure OpenAI Serviceを活用した情報検索システムを試験的に導入しました。
主にR&D部門の社員を対象に始め、将来的にはアサヒグループ社内に点在している技術情報を集約・整理し、効率的に取得しやすくすることで、
グループの知見を生かした商品開発の強化や業務効率化を目指すとしています。
上記で3社をご紹介しましたが、生成AIの企業での活用はまだ少ないのが実情です。
帝国データバンクが行ったアンケートによると、生成AIを活用・検討している企業は61.1%でしたが、実際に利用しているのは9.1%にすぎません。
出典:帝国データバンク「生成AIの活用に関する企業アンケート」
生成AIの導入には多大なコストとリソース、時間がかかることが原因のひとつです。
また、活用を検討している企業でも現時点では活用イメージが湧かないという回答が37.8%を占めています。
企業にとって、生成AIの活用は、その企業のビジネスに最適な方法であるかどうかを検討することが重要です。
|まとめ
生成AIは、クリエイティブなコンテンツを生成できることで、近年、個人・企業問わずさまざまな分野で注目を集めています。
テキスト生成や画像・動画生成、音声生成など多種多様なコンテンツを生成できる生成AIは、定型業務の効率化やクリエイティブな提案、
コンテンツ制作のゼロコスト化など、目的や用途によってメリットをもたらす可能性を秘めています。
現在もさまざまな生成AIがリリースされており、今後も技術発展が期待できる分野です。
一方で、生成AIにできないことや課題もあります。
生成AIのメリットや課題も含めて「生成AIで何を実現したいか」を明確にし、ビジネス活用の検討をしてみてはいかがでしょうか?
|おすすめのAI資料
AI開発の流れから費用相場、開発コストを抑えるコツをご紹介した資料をご用意しました!
VNEXTのAI開発事例も掲載していますので、この機会にぜひ無料ダウンロードしてみてください(下記バナーをクリック)