カスタマイズの階層
プロンプト・RAG・微調整・事前学習。コストの低い順に試す原則と、LoRA/PEFT、ツール利用、エージェント、評価とガードレールまで。
「自社の業務に合わせたい」というとき、選択肢は一つではありません。カスタマイズ手法は、軽量・低コストなものから、重く高コストなもの へと階層をなします。原則は「目的を満たす最も軽い手段から試す」こと。いきなり微調整に飛びつくのは、多くの場合過剰です。
カスタマイズの梯子
| 手法 | 変えるもの | コスト | 適する状況 |
|---|---|---|---|
| ① プロンプト設計 | 入力(文脈)のみ | 最小 | 振る舞いの調整、形式の指定。まず最初に試すべき層。 |
| ② RAG / 外部知識 | 参照する知識 | 小〜中 | 最新情報・社内文書に基づく回答が必要なとき。 |
| ③ 微調整 (Fine-tuning) | モデルの重み | 中〜大 | 特有の口調・形式・専門タスクを安定して再現したいとき。 |
| ④ 事前学習 (Pre-training) | モデルを一から | 最大 | 独自基盤モデルが必要な特殊領域。大組織向け。 |
微調整と効率化(PEFT / LoRA)
微調整(Fine-tuning) は、追加データでモデルの重みを更新し、特定タスクへの適応を図ります。全パラメータを更新する完全微調整は高コストなため、近年は一部のパラメータのみを効率的に学習する PEFT(Parameter-Efficient Fine-Tuning) が主流です。
その代表が LoRA(Low-Rank Adaptation) で、元の重みを凍結したまま、小さな低ランク行列を追加して学習します。学習対象が大幅に減るため、必要な計算資源とストレージが小さくなり、複数の用途別アダプタを切り替えて使うこともできます。
ツール利用とエージェント
モデル自体を変えずに能力を拡張する方向として、ツール利用(function calling / tool use) があります。モデルに「計算機」「検索」「データベース照会」などの外部機能を呼び出させ、その結果を踏まえて応答させる仕組みです。これを多段で自律的に繰り返し、目標達成まで計画・実行する構成が エージェント と呼ばれます。
標準化の動きとして、外部ツールやデータ源とモデルを接続するためのプロトコル(例:MCP, Model Context Protocol)も登場しています。エージェント設計では、各ツールの入出力を明確に定義し、失敗時の挙動を設計することが品質を左右します。
評価とガードレール
カスタマイズの成否は 評価 で測られます。出力は確率的に揺らぐため、代表的な入力に対する期待出力(評価セット)を用意し、変更前後で品質を比較する習慣が重要です。あわせて、不適切な入出力を抑える ガードレール(入力検証・出力フィルタ・禁止事項の明示)を設けることで、実運用での安全性を高められます。
- Prompt → RAG → Fine-tuning → Pre-training のコスト階層
- PEFT / LoRA(Hu et al., 2021)
- Function calling / Tool use、エージェント、Model Context Protocol
- 評価セット(eval)とガードレール設計