生成AIって何？今までのAIと何が違う？

はじめに

AIの世界は年々目覚しい発展を遂げています。最近ではChatGPTに代表される生成AIが注目を集めています。生成AIによって文章、画像、音楽、さらには動画まで、人工知能が創造する時代が既にやってきています。（本記事のトップ画像はOpenAIの「DALL-E 3」という画像生成モデルによって作成しています。）

しかし、今までAIで話題になっていたディープラーニングやニューラルネットワークと何が違うのかをわからないという方もいらっしゃると思います。この記事では、生成AIとは何なのかについて解説し、従来のAIからどのような点が進化しているのかをご説明します。皆さんの生成AIに対する疑問が解消され、生成AIを業務などに活用できる一助になれば幸いです。

そもそもAIって？

AI（Artificial Intelligence：人工知能）とはコンピュータに人間の知能や学習能力を模倣させる技術全般を指しています。まるで機械が自分で考えて知的な作業や意思決定しているかのように動作します。AIは大量のデータから学習し、問題解決や意思決定を行う能力を習得します。これによって特定の能力に特化させたAIがこれまで様々な分野で活用されてきました。

モデル

AIのモデルとは人工知能の分野において学習を行った数学的なモデルやアルゴリズムを指しています。

これらのモデルは「入力→AIモデル→出力」という形で出力を得る関数になっています。AIモデルは学習によって様々な問題に対して最適化させることができます。

AIモデルは学習の方法によっていくつかの種類に分かれています。

教師あり学習モデル
- 入力とそれに対して期待する出力をセットにして学習させるモデル
- 日付と気温を入力とすることで将来の売り上げなどを予測する問題などに用いられています。
- 分類問題、回帰問題など
教師なし学習モデル
- 入力のみで学習するモデル
- 入力の中からパターンを発見する問題などに用いられています。
- クラスタリング、次元削減など
強化学習モデル
- 何度も繰り返し試行することで最適な行動を学習するモデル
- AIにゲームをプレイさせて強いAIを作成する問題などに用いられています。
- ゲーム、ロボティクスなど
深層学習モデル
- 深層学習（ディープラーニング）を用いて上記のモデルよりも複雑なパターンについて学習するモデル
- 自動で入力の特徴を学習でき、学習データが多くなるほどその性能がよくなるという特徴を持っています。
- 画像認識、自然言語処理など

AIモデルは機械学習の根幹となるもので、モデルの構築によって機械学習の技術そのものが成り立っています。

数年前までの状況

AIについて、よく話題になっていたキーワードとしてはディープラーニングが有名でしょうか。ディープラーニングによる画像認識や言語処理能力の向上などが話題になったのは、これまでの問題より複雑な問題をAIによって解くことが出来るようになったためです。

ディープラーニングの登場以降は第三次人工知能ブームと呼ばれています。これまでのAIに比べて目に見えて高性能になったため、大きな注目を集めた技術になります。

人工知能（AI）の歴史　
総務省「ICTの進化が雇用と働き方に及ぼす影響に関する調査研究」（平成28年）

生成AIとは？

この第三次AIブームが冬の時代を迎える前に登場したのが、生成AIと呼ばれる対話型の生成系AIシステムです。第四次AIブームとも呼べる一大ムーブメントを巻き起こしたこのシステムはLLM（大規模言語モデル）を活用した技術になります。

LLM（Large Language Model）

LLMとは大量のテキストデータを学習させたAIモデルを指しています。日本語では大規模言語モデルと訳されることが多いです。LLMの特徴としては今までのAIモデルと比較した際の汎用性の高さが挙げられます。LLMとして以下のようなモデルが存在しています。しかし、これらはごく一部に過ぎず、次々と新しいモデルが公開されています。

PaLM 2
GPT-4
OpenCALM
Gemini

LLMを用いた生成AIの特性

生成AIが注目を集めているのは3つの特性によるものが大きいです。

スケーリング則
- スケーリング則とはモデルの学習するパラメータ数や学習データのサイズ、計算の回数が増えるにしたがって、LLMの性能が向上するという法則です。
- この法則によってコストをかければかけるほど性能が向上することが予測されているため、大企業による生成AIの開発が進められています。
  - 近年は物理的な限界に近付きつつあるらしいです。参考：https://www.wired.com/story/openai-ceo-sam-altman-the-age-of-giant-ai-models-is-already-over/
創発的能力（Emergent Abilities）
- 創発的能力とは、LLMのサイズが大きくなるにつれて今までの機能とは異なる新しい特性や行動を示すようになる現象です。
- これまでは1つの問題に対して1つのモデルを作成するというのが常識でした。しかし、LLMはその学習量から様々な問題へ単一のモデルで応用することが出来るようになっています。
知識の生成
- 生成AIが直接的には学習していない知識を学習データを用いて作成するという能力です。
- これまでの機械学習では特定の入力に対して用意された回答をどれだけ正確に予測できるかという点が注目されていました。しかし、LLMは学習している大量のデータとディープラーニングによる学習の自動化によって「アイデアの発案」という強力な能力を得ることに成功しました。

注意点として、ChatGPTやBardなどはLLMを用いたアプリケーションの一つであってモデルではありません。これらのアプリケーションはチャットでの対話に最適化されています。チャット以外にもLLMは様々な問題に応用することが出来る汎用モデルであると言ってよいでしょう。

生成AIの一つとして学習していない知識を生成できるという点が挙げられます。

生成AIの仕組み

簡単に生成AIの原理を紹介します。今回の例ではテキスト生成について紹介します。

人間が行った入力（プロンプト：Prompt）に対して、学習データを参考に特徴を抽出します。特徴の抽出においてはディープラーニングのどの特徴が重要かを自動で判断する（テキストの場合は単語などが重要視される）仕組みを用いています。

入力の特徴から応答するべき出力を予測します。例えば、「Q:日本で一番高い山は？」と入力すると生成AIはそれに続く回答を予測します。この時、学習データの中から入力された内容に続く確率の高い文章を1文字ずつ予測していきます。

実際にChatGPTで試してみましょう。

その後に続く回答として富士山が含まれることを予測し、応対を行います。理想的な回答としては「A:」から続く形で返して欲しいところでしたが、ChatGPTはチャットでの応対にチューニングされているので大抵の場合は文章で応答してきます。

生成AIの活用

生成AIの活用事例についてもいくつかご紹介します。

文章の要約・翻訳
- テキストの要点を抽出するタスクは生成AIの得意分野です。資料の作成に活用することが出来ます。
- 注意点としては元のデータに含まれていない情報がAIの推測によって追加されていないかなどファクトチェックが必要です。
アイデアの創出
- その大規模な学習データを元により広い視点からアイデアを提案してもらえる。
- 学習データに含まれていない知識は創出できない点は注意です。使用するLLMの学習した期間によっては質問の前提となる重要な知識が欠けている可能性があります。
自社のデータを用いたAIチャットボットの作成
- 生成AIのチャットボットへの応用はすでに多く実施されています。お客さんとの最初のやり取りをチャットボットによって自動化することで、人的リソースの有効活用をはかることが出来ます。
- また、LLMの学習データに追加して社内の文書などを学習させることで、社内文書の検索などの効率化や生産性の向上が期待できます。
コード生成のサポート
- プログラムのコーディングなどでエラーが発生した場合に相談することが出来ます。
- Githubの提供しているCopilotなどを用いることでよりコーディングに特化したサポートを受けることも可能です。
- 単純なコード作成にかかる時間を大きく削減することが出来ます。