ホーム
ChatGPT, Python
LangChainのソースコードから実装を見てみる（ChatModelのinvoke編）

2025.01.31

LangChainのソースコードから実装を見てみる（ChatModelのinvoke編）

生成AIのアプリケーション開発をするライブラリであるLangChainについて、いくつかのバージョンアップなどもあり昔の機能が非推奨になったり、様々な更新などがあったため、公式のドキュメントを漁っていてlangchainでモデル呼び出す際の入力について気になったことがあったので詳しく調べてみました。

モデルの呼び出し方

ドキュメントによると次の呼び出し方を実施しています。

import getpass
import os

if not os.environ.get("OPENAI_API_KEY"):
  os.environ["OPENAI_API_KEY"] = getpass.getpass("Enter API key for OpenAI: ")

from langchain_openai import ChatOpenAI

model = ChatOpenAI(model="gpt-4o-mini")

model.invoke("Hello, world!")

invoke関数がモデルの呼び出しを行うもので、引数としては文字列が入力されています。

これは入力した文字列がgpt-4o-miniに送られているのだろうと想定されますので、理解は難しくないです。

しかし、チュートリアルでは以下のような呼び出しになっています。

from langchain_core.messages import HumanMessage, SystemMessage

messages = [
    SystemMessage("Translate the following from English into Italian"),
    HumanMessage("hi!"),
]

model.invoke(messages)

これは2つのメッセージクラスのリストを入力しています。これも会話をリスト形式で保持しているのだろうとは想像できますが、次の形はどうでしょうか。

model.invoke("Hello")

model.invoke([{"role": "user", "content": "Hello"}])

model.invoke([HumanMessage("Hello")])

上記チュートリアルにも記載されていますが、上記はいずれも同じ処理が行われます。

入力方法が多岐に渡っているので、実際どんな入力がサポートされているのか確認してみましょう。

ドキュメントを読むとLanguageModelInputが想定されているようです。

ライブラリを見ていくと次のような形で定義されています。

LanguageModelInput = Union[PromptValue, str, Sequence[MessageLikeRepresentation]]

つまりPromptValue, str, Sequence[MessageLikeRepresentation]のいずれかが入力されることを期待しているということです。

先ほどの例がそれぞれどれに当てはまるのかというと

model.invoke("Hello")：str
model.invoke([{"role": "user", "content": "Hello"}])：Sequence[MessageLikeRepresentation]
model.invoke([HumanMessage("Hello")])：Sequence[MessageLikeRepresentation]

上記のようになります。

PromptValueは？というとプロンプトテンプレートを使った場合はこの入力に当てはまります。

model.invoke(StringPromptValue(text="Hello"))

実験

以下のコードは実行できるでしょうか？

model.invoke(("user","Hello"))

これは動作しましたが、上記の指定の中にはない形です。

実際どのように動いているのか気になったのでソースコードを確認してみました。

まず、invokeの実装から見てみます。今回気になった部分はinputの部分なのでそこにフォーカスしてみます。

self._convert_input(input)

入力はconvert_inputによって別の値に変換されています。そっちも見てみましょう。

確認したかった部分はここですね。

def _convert_input(self, input: LanguageModelInput) -> PromptValue:
    if isinstance(input, PromptValue):
        return input
    elif isinstance(input, str):
        return StringPromptValue(text=input)
    elif isinstance(input, Sequence):
        return ChatPromptValue(messages=convert_to_messages(input))
    else:
        msg = (
            f"Invalid input type {type(input)}. "
            "Must be a PromptValue, str, or list of BaseMessages."
        )
        raise ValueError(msg)

この関数ではLanguageModelInputをPromptValueに変換しています。

PromptValueはそのまま
文字列はStringPromptValueへ
Sequenceは入力をconvert_to_messagesで変換しChatPromptValueに

上の2つはすんなり理解できます。最後の関数も見てみましょう。

def convert_to_messages(
    messages: Union[Iterable[MessageLikeRepresentation], PromptValue],
) -> list[BaseMessage]:
    """Convert a sequence of messages to a list of messages.

    Args:
        messages: Sequence of messages to convert.

    Returns:
        list of messages (BaseMessages).
    """
    # Import here to avoid circular imports
    from langchain_core.prompt_values import PromptValue

    if isinstance(messages, PromptValue):
        return messages.to_messages()
    return [_convert_to_message(m) for m in messages]

この関数が呼び出される場合はPromptValueのインスタンスではなくSequenceのインスタンスのはずなので、そこを見てみます。下記の通りリストやタプルの各要素を変換しています。

def _convert_to_message(message: MessageLikeRepresentation) -> BaseMessage:
    """Instantiate a message from a variety of message formats.

    The message format can be one of the following:

    - BaseMessagePromptTemplate
    - BaseMessage
    - 2-tuple of (role string, template); e.g., ("human", "{user_input}")
    - dict: a message dict with role and content keys
    - string: shorthand for ("human", template); e.g., "{user_input}"

    Args:
        message: a representation of a message in one of the supported formats.

    Returns:
        an instance of a message or a message template.

    Raises:
        NotImplementedError: if the message type is not supported.
        ValueError: if the message dict does not contain the required keys.
    """
    if isinstance(message, BaseMessage):
        _message = message
    elif isinstance(message, str):
        _message = _create_message_from_message_type("human", message)
    elif isinstance(message, Sequence) and len(message) == 2:
        # mypy doesn't realise this can't be a string given the previous branch
        message_type_str, template = message  # type: ignore[misc]
        _message = _create_message_from_message_type(message_type_str, template)
    elif isinstance(message, dict):
        msg_kwargs = message.copy()
        try:
            try:
                msg_type = msg_kwargs.pop("role")
            except KeyError:
                msg_type = msg_kwargs.pop("type")
            # None msg content is not allowed
            msg_content = msg_kwargs.pop("content") or ""
        except KeyError as e:
            msg = f"Message dict must contain 'role' and 'content' keys, got {message}"
            msg = create_message(
                message=msg, error_code=ErrorCode.MESSAGE_COERCION_FAILURE
            )
            raise ValueError(msg) from e
        _message = _create_message_from_message_type(
            msg_type, msg_content, **msg_kwargs
        )
    else:
        msg = f"Unsupported message type: {type(message)}"
        msg = create_message(message=msg, error_code=ErrorCode.MESSAGE_COERCION_FAILURE)
        raise NotImplementedError(msg)

    return _message

ドキュメントにも記載されている通り、フォーマットに従った内容であれば下記の通り変換がされるようです。

メッセージクラスはそのまま
文字列はHumanMessageへ変換
Sequenceかつ要素数が2なら、1つ目の要素をロール、2つ目の要素を値にしたメッセージクラスへ変換
辞書型ならrole要素かtype要素をロール、content要素を値にしたメッセージクラスへ

ここで先ほどの入力がどうなっていたか見てみましょう。

model.invoke(("user","Hello"))

先ほどの入力ではSequenceであるタプルの中に文字列が含まれていたので、_convert_to_messageではHumanMessageへの変換がされていることになります。

つまり、ここで処理されているのは下記と同一だったわけです。

model.invoke([HumanMessage("user"),HumanMessage("Hello")])

ソースコードの確認は深い理解のためには重要ですね。

おまけ

今回の実験のためにいろいろ試していたのですが、その際、出力が微妙に異なるパターンがtemperatureが0に指定されているのにも拘らず発生してしまいました。誤差が大きいときでは100トークン前後の誤差が生じていました。

その原因としてはGPUでの計算のリアルタイム最適化の結果、演算順序が変動することで浮動小数点での誤差が発生してしまうためのようです。

これは生成したトークンから次のトークンを生成していく連鎖によって動作するLLMにとっては最終的に大きな誤差が生まれ得ることを意味しています。

これはGPUによる演算を最適化している都合上起こり得るものなので、回避は難しいです。

参考：The New World of LLM Functions: Integrating LLM Technology into the Wolfram Language (2025/1/30閲覧)

Tableau×Teams連携前のページ

SnowPro Advanced: Architect 合格体験記次のページ

ピックアップ記事

最速で理解したい人のためのIT用語集

ChatGPT

Open Interpreter＋VScode+Dockerで生成AIによるコード開発環境構築(Wi…

はじめにこんにちは、エクスチュアの石原です。皆さん、…
ChatGPT

LangChainって何？: 次世代AIアプリケーション構築その1

こんにちは、エクスチュアの石原です。近年、大規模言語モデル（…
ChatGPT

LangChainって何？: 次世代AIアプリケーション構築その3

こんにちは、エクスチュアの石原です。こちらは第3回の記事にな…
Python

pythonを使ったダミーデータ生成

最初になにか発見したことを総合研究所で発表したり、デモ資料を作ったり…
ChatGPT

LangChainって何？: 次世代AIアプリケーション構築その2

こんにちは、エクスチュアの石原です。こちらは第2回の記事にな…
Canva

Canva×生成AIで“映える”ダッシュボードモックを爆速で作った話

データエンジニアがCanva？Canvaって、おしゃれなプレ…

検索

検索:

カテゴリ

 Adobe Experience Cloud134

Ad Hoc Analysis1

Adobe Analytics117

Reoprt Builder1

セグメント5

ワークスペース4

計算指標3

Adobe Audience Manager1

Adobe Cloud Platform Auditor2

Adobe Dynamic Tag Manager4

Adobe Experience Platform3

Adobe I/O1

Adobe Launch4

Adobe Target3

Amazon Web Services11

Amplitude3

Azure2

Canva1

ChatGPT10

Data Catalog1

Databricks11

dbt5

Enterprise Data Warehouse1

Excel4

Firebase4

Firebase Analytics4

GA 360 Suite62

Google Analytics42

Google Analytics 411

Google Tag Manager20

Looker Studio (旧Google DataStudio8

Generative AI15

Claude3

GitHub Actions2

Google Cloud Platform77

Analytics Hub1

Application Integration1

Cloud Dataflow3

Cloud Dataproc1

Data Clean Room1

Dataform1

Google BigQuery47

Vertex AI3

VPC Service Controls1

IT用語集104

KARTE11

Kiro2

LangGraph1

Linux9

Looker9

Matillion4

MCP1

Metabase3

Mouseflow59

コンバージョンファネル2

セッションリプレイ6

ヒートマップ19

フィードバック分析2

フォーム分析2

NotebookLM1

ObservePoint24

Office3651

Pardot1

Python29

Qualtrics3

RevOps1

Segment1

Siteimprove1

Snowflake45

Cortex7

Data Clean Room9

dbt Projecs on Snowflake4

DBエンジニアが学ぶSnowflake2

Snowflake Postgres2

Snowflake資格2

Spread Sheets / GAS / GDS3

Squadbase1

Streamlit5

Tableau68

Tips6

Treasure Data4

TROCCO2

Visual Studio Code1

Web解析33

YOTTAA2

エクスチュアのB2Bマーケティング4

Salesforce1

Sansan3

Zapier2

データサイエンス8

ブログ41

プログラミング41

Google Apps Script(GAS9

マーケティング2

会社について3

未分類15

本棚1

海外カンファレンス16

Snowflake Summit10

海外情報15

Adobe Summit10

最近の記事

Looker Studioで日付フィルターの開始日・終了日の…

Streamlitでdbt-elementary風ダッシュボ…

Adobe WebSDK FPIDでECIDの復元を検証

dbt Projects on Snowflakeで作成した…

Dataformでtype:’increment…

LangChainのソースコードから実装を見てみる（ChatModelのinvoke編）

モデルの呼び出し方

実験

おまけ

ピックアップ記事

最速で理解したい人のためのIT用語集

関連記事

Open Interpreter＋VScode+Dockerで生成AIによるコード開発環境構築(Wi…

LangChainって何？: 次世代AIアプリケーション構築 その1

LangChainって何？: 次世代AIアプリケーション構築 その3

pythonを使ったダミーデータ生成

LangChainって何？: 次世代AIアプリケーション構築 その2

Canva×生成AIで“映える”ダッシュボードモックを爆速で作った話

LangChainって何？: 次世代AIアプリケーション構築その1

LangChainって何？: 次世代AIアプリケーション構築その3

LangChainって何？: 次世代AIアプリケーション構築その2