AIの「推論（Inference）」とは？学習との違いをわかりやすく解説

By篠原まゆ 2026年3月2日2026年2月15日

AIの話題で「学習」と並んでよく出てくるのが「推論」という言葉です。この2つの違いを理解しておくと、AI導入のコストや運用の話がぐっとわかりやすくなります。

推論とは ― ひと言でいうと

推論（Inference）とは、学習済みのAIモデルを使って、新しいデータに対する予測や判断を行うことです。「学習」がAIの勉強フェーズだとすれば、「推論」は勉強の成果を使って本番のテストに答えるフェーズにあたります。

ChatGPTに質問を入力して回答が返ってくるとき、裏側では「推論」が行われています。すでに学習を終えたモデルが、あなたの質問（入力データ）を処理して、回答（出力）を生成しているのです。

学習は一度行えば完了しますが（定期的な再学習を除く）、推論はAIを使うたびに発生します。学習は膨大な計算リソースと時間がかかりますが、推論は比較的軽量で、リアルタイムに結果を返せます。

ビジネスの観点では、学習コストは「初期投資」、推論コストは「運用コスト」と考えるとわかりやすいでしょう。AIサービスの料金が「トークンあたり○○円」と表記されている場合、これは推論コストを指しています。

AIを本格的に運用すると、推論コストは無視できない額になります。たとえば、毎日数千件の問い合わせをAIで処理する場合、1件あたりの推論コストが小さくても、積み重なれば大きな金額になります。

このため、用途に応じてモデルのサイズを使い分ける（簡単なタスクには小さいモデルを使う）、不要な入出力を省いてトークン数を抑える、といったコスト最適化が重要になります。

推論は「学習済みモデルで新しいデータに対して予測・判断を行うこと」です。AIの日々の運用コストに直結する概念であり、AI導入の費用対効果を考えるうえで欠かせない知識です。