VNEXTの会社紹介資料
2024/02/01
テキスト生成AIサービスの先駆けとなった「ChatGPT」は、今や世界中を巻き込み、様々な業務の効率化や事業の拡大を支えています。
そんなChatGPTですが、新たなモデル「GPT-4」が登場しました。
GPT-4はGPT-3.5よりも優れた出力性能を持つとされていますが、GPT-3.5と比較し、どのくらいすごいのでしょうか?
本記事では、GPT-4の特徴やできること、GPT-3.5との違いについて詳しく解説していきます。
目次
|GPT-4とは?
そもそも、GPTとは「Generative Pre-trained Transformer」の略であり、OpenAIが開発した大規模言語モデルを指します。
簡単に説明すると、
AIが大量のテキストデータを学習し、文章の生成や言語理解の能力を身につけ、次の予測や推測ができるようになった"次世代型言語モデル"です。
OpenAIは2018年に公開した「GPT-1」以降、年々パラメータ数が増え続けており、GPT-4はChatGPTに搭載されていた「GPT-3」「GPT-3.5」の上位モデルとなります。
GPT-3やGPT-3.5に比べて出力精度が高く、誤字脱字が大幅に減ったのはもちろんのこと、複数の指示を含む応用的なプロンプトの意図にも対応できるようになりました。
また、GPT-4の大きな特徴として「マルチモーダルAI*」が知られており、テキスト情報のみならず、画像や音声などのフォーマットも入力データとして処理できるように進化しています。
*マルチモーダルAI:複数の異なる情報源から情報を収集し、統合して処理することができるAI
|GPTの歴史
GPTは初期モデルからアップデートを繰り返しています。
GPTの初期段階は、AIに文章を生成させるために学習機能を搭載させ、自動で文章を構築することを目的に開発されました。
OpenAIは2018年に公開した「GPT-1」以降、年々パラメータ数が増え続け、2023年のGPT-4では非公開でありながらパラメータ数*は100兆以上ともいわれており、飛躍的な進化を遂げています。
*パラメータ数:モデルの複雑さや表現力を示す重要な要素で、パラメータ数が多いとモデルはより複雑なパターンや関係性を学習することができる
以下はGPTの歴史を図で表したものです。
|GPT-4の料金
GPT-4は、一般ユーザーでも利用できるようにサブスクリプションサービスとして提供されています。ChatGPT Plusに登録すると、GPT-4によるChatGPTを利用できるようになります。
なお、GPT-4を利用できるChatGPTの利用料金は、月額20ドル(2024年2月時点)です。
すでに無料版のChatGPTを利用している方であれば、ログインしてChatGPTのページを開くと「GPT-4」を選択できる画面が表示されます。
GPT-4はMicrosoftが提供する検索エンジン「Bing AI」で利用することが可能です。
Bingに搭載されたAIチャットはGPT-4モデルで動作していることが確認されており、Microsoftアカウントを保有するユーザーは、無料でGPT-4の性能を体験できます。
まずはMicrosoftアカウントを作成してBingのAIチャットを利用することをおすすめしますが、AIチャットの履歴閲覧やチャット内容の出力、GPT-3.5モデルの利用、20ターンを超える入力、などを検討しているユーザーは「ChatGPT Plus」の登録を検討するとよいでしょう。
|GPT-4は日本語で使える?
GPT-4は、日本語で利用することが可能です。
GPT-3が主流の頃は、日本語の入力に対して英語が出力されるケースがありましたが、現在は日本語の入力に対しては日本語の出力が行われるように調整されています。
仮に日本語の入力に対して英語が出力されるようなケースでも、全ての出力が終わった後に「日本語に翻訳してください」といった指示を入力することで、日本語に翻訳した文章を生成してくれます。
|GPT-4とGPT-3.5の違い
ここでは、ChatGPT-4とChatGPT-3.5との違いについて、表を見て確認していきましょう。
ChatGPT-4とChatGPT-3.5を比べると、パラメータ数はもちろん、情報の最新性やプラグインの利用可否、アクセス制限などで、GPT-3.5と違いがあることがわかります。
|GPT-4の特徴
GPT-4の特徴には、以下が挙げられます。
― GPT-3.5よりも性能が高い
― マルチモーダルAI
― 長文のプロンプト・ターンに対応できる
― 整合性が高まった
― 最新のデータではない
GPT-4では、旧モデルのGPT-3やGPT-3.5では生成精度が低かったプロンプトにも対応でき、長文の出力や、ReActプロンプトなどの「1回のターンでChatGPTが推論を行って出力を導く」といった高度な出力にも問題なく対応できます。
GPT-3やGPT-3.5では限界を感じていたプロンプトであっても、GPT-4では望み通りの出力結果が得られる傾向にあります。
では、それぞれの特徴について詳しく見ていきましょう。
|GPT-3.5よりも性能が高い
ChatGPTのデフォルトのモデルとして知られるGPT-3.5は、比較的早い速度でプロンプトに対する出力を導きます。
しかし、プロンプトの入力内容によっては、出力されるテキストの精度が低い場合もあり、ビジネスシーンへの応用といった観点では必ずしも信頼できるものではありませんでした。
その点でGPT-4は、精度の高いテキストを出力することが可能で、GPT-3.5で複数回のターンを必要としたプロンプトも、一度で出力できるようになっています。
|マルチモーダルAI
2023年9月25日に、OpneAIはChatGPTに画像解析機能と音声出力機能のGPT-4Vが追加され、マルチモーダルAIになったと発表しました。
マルチモーダルAIとは、テキスト・音声・画像など、種類の異なる複数の情報を総合的に処理できる人工知能のことです。
GPT-4では、プロンプトとしてテキストだけでなく画像や音声などのデータ処理にも対応しています。
|長文のプロンプト・ターンに対応できる
GPT-4は、「Zero-shot CoT」や「Self-Consistency」、「Generate Knowledge Prompting(知識生成プロンプティング)」、「ReActプロンプト」などの長文のプロンプト・ターンを必要とする応用的なプロンプトに対応しています。
GPT-3やGPT-3.5などのモデルでもプロンプトは入力できますが、より高い精度で出力を得たい場合はGPT-4を利用することをおすすめします。
|整合性が高まった
GPT-4は、AIが間違ったことをいう「ハルシネーション」が大幅に低減し、回答の整合性が向上しています。
GPT-3より進化した学習アーキテクチャを備えており、幅広いデータセットでトレーニングされているGPT-4は質問に対して深い理解を示し、より正確な情報や洞察を提供することができるため、ユーザーの要求に的確に応えることができます。
|最新のデータではない
GPT-4の学習データは、2022年1月までの学習済データが使用されています。
そのため、2022年1月以降に起きた出来事や新しい情報に関する質問に答えられないという問題があります。
|GPT-4でできること
GPT-4でできることは、主に下記の5つが挙げられます。
― 画像を認識できる
― 複雑な条件・プロンプトに対応
― マインドマップの作成
― テンプレート(メール・マニュアル)の作成
― 文章の要約
それぞれについて、詳しく解説していきます。
|画像を認識できる
GPT4ではテキストだけではなく、画像も認識することができます。
たとえば、生卵の写真を読み込ませて「これでどのような料理を作ることができますか?」と質問すると「さまざまな卵料理」が返ってきます。
このように写真の内容をAIが判断して回答してくれます。
|複雑な条件・プロンプトに対応
GPT-4では、GPT-3.5以前では対応の難しかった複雑な質問やプロンプトにも対応することができます。
たとえば、税金に関する複雑な計算ができたり、会社の収支計算など経理をGPT-4に任せることもできます。
人間では時間のかかってしまう部分もGPT-4にお願いすることで、時間が効率よく使えるようになります。
|マインドマップの作成
マインドマップとは、人間の自然な思考プロセスを反映したノート法です。
頭の中で起きていることが「見える化」されるので、考え続けることが非常にラクになります。
GPT-4では、このマインドマップの作成も簡単に行うことができます。
マインドマップはリサーチを始めたばかりなど、知識があまりない状態で “概要だけ把握したい” といったシーンの時、非常に役立ちます。
|テンプレート(メール・マニュアル)の作成
GPT-4では、よく使うテンプレートや定型文を簡単に作成することができます。
外注に記事制作や資料制作の依頼書を投げる時、業務に関するマニュアルを作る時などに活用することが可能です。
|文章の要約
何かリサーチしている中で「文章が長い」「文章が読みづらい」「難しい言葉ばかりで理解が難しい」といったシーンに出会ったことはないでしょうか。
そんな時、GPT-4に「文章の要約」をお願いすることで、あっという間に要約してくれたり、わかりやすく文章を修正して回答してくれます。
また、GPT-4は画像にも対応しているため、本などを写真で撮影して、要約をお願いすることも可能です。
特に専門的な内容だと難しい言葉を使っていたり、そもそも意味を知らない言葉などがあったりと、理解するのが難しかったりします。
そんな時、GPT4を使えば簡単に理解することが可能です。
|GPT-4を搭載したサービス
GPT-4を利用できるサービスはChatGPTだけではありません。
GPT-4を搭載している有料・無料のサービスをいくつかご紹介しますので、ぜひ利用して、GPT-4の性能やできることを確かめてみてください。
|Bing AI
Bing AIとは、Microsoftが無料で一般公開している検索エンジンです。
ChatGPTと同じく、自然な言葉のプロンプトで指示や質問ができます。また、ChatGPTは搭載されている情報をベースに回答が作成されますが、Bing AIはリアルタイムで検索して回答を作成するため、新しい話題やニュースなどにも対応しています。
Bing AIはパソコンだけでなく、AndroidとiOSの両方に対応可能です。手軽にGPT-4の性能を確かめたいときも、利用してみましょう。
|Be My Eyes
Be My EyesはOpenAI社のサービスで、視覚障害者や低視力者をサポートするために開発されました。
リアルタイムのビデオ通話を通じて、視力に問題を抱える方とボランティアをつなぎ、視覚的支援を提供します。
たとえば、ライトが点灯しているか、洋服のコーディネートに問題がないかなど、日常生活のさまざまな場面で視力に問題を抱える方をサポートします。
こちらも、AndroidとiOSの両方に対応し、無料で利用可能です。
|Duolingo
DuolingoもOpenAI社のサービスで、語学学習アプリです。
40の言語に対応し、100を超えるコースが用意されています。
DuolingoはAIと言語化学を組み合わせることで、一人ひとりに合わせたパーソナルラーニングを実現しています。誰もが自分に適したレベルとスピードで学べるため、効率よく学べるのも特徴です。
世界で1億人以上のユーザーがいるDuolingoで、語学を学んでみてはいかがでしょうか。
|Tome
Tomeは、会社や研究会での発表に使用するプレゼン資料を作成するサービスです。
無料でも利用できますが、クレジット制のため、何度も繰り返し利用するときは、Proなどの有料プランを申込む必要があります。有料プランは制限なしに利用でき、何度でも作成し直すことが可能です。
また、サービス自体は英語ですが、日本語のプロンプトを入力すると資料を日本語で作成できます。必要な情報をテキストで入力するだけで作成できるため、プレゼンの準備に時間をかけられます。
|GPT-4がさらに進化した「GPT-4 Turbo」も登場
OpenAI社は、2023年11月6日にChatGPTの新バージョン「GPT-4 Turbo」を発表しました。
従来のGPT-4より速度が向上し、学習データも2023年4月までに更新されました。
また、プロンプトも128,000トークンのコンテクストまで対応ができるとされています。これによって、1プロンプトに対して300ページ以上の長文回答ができるようになりました。パフォーマンスが最適化されたため、価格も「GPT-4」より抑えられています。
|まとめ
GPT-4の特徴を理解しておくことで、より高度に有料版のChatGPTを使いこなせます。
今回、ご紹介した情報も参考に、ぜひGPT-4を活用してください。
また、ChatGPT以外でもGPT-4の利用は可能です。Bing AIなどの無料サービスなら、より手軽に活用できますので、ぜひ試してみてください。
GPTや効果的な生成AIのプロンプト活用方法については、下記の記事でご紹介していますので、あわせてご覧ください!
▶︎【GPTとは】ChatGPTのGPTの仕組みと歴史、活用方法を徹底解説!
▶︎ 生成AIのプロンプトとは?効果的な作成方法やフレームワークをご紹介!