LLM用語集：主要概念と定義

イントロ

大規模言語モデルの世界は、テクノロジーの他のどの分野よりも急速に変化している。新しいアーキテクチャ、新しいツール、新しい推論形式、新しい検索システム、新しい最適化戦略が毎月登場し、それぞれが新たな用語層をもたらしている。

マーケター、SEO担当者、デジタル戦略家にとっての課題は、単にLLMを活用することだけではありません。発見そのものを形作る技術の言語を理解することです。

この用語集は雑音を排除します。 2025年に重要な核心概念を定義し、実践的な観点から解説し、AIO（AIオペレーショナル化）、GEO（地理的最適化）、そしてAI駆動型検索の未来へと結びつけます。これは単なる辞書ではありません——現代のAIエコシステムを形作る思想の地図です。

LLM、埋め込み、トークン、トレーニング、検索、推論、最適化に関連するあらゆる事柄の基礎的な参照資料としてご利用ください。

A–C: 核心概念

Attention

トランスフォーマー内部のメカニズム。文内の位置に関係なく、モデルが関連する部分に焦点を当てることを可能にする。これによりLLMは長い文脈全体における文脈、関係性、意味を理解できる。

重要性： 注意機構は現代のLLM知能の基盤である。注意機構の向上 → 推論能力の向上 → 引用精度の上昇。

AI最適化（AIO）

AIシステムがコンテンツを正確に理解・検索・検証・引用できるように構造化する手法。

重要性： AIOは新たなSEOであり、AI概要、ChatGPT検索、Perplexityにおける可視性の基盤となる。

アラインメント

モデルを人間の意図、安全基準、プラットフォーム目標と整合させるよう訓練するプロセス。

含まれる要素：

RLHF
SFT
構成的AI
選好モデリング

重要性： 整合性のあるモデルは予測可能で有用な回答を提供し、コンテンツをより正確に評価します。

自己回帰モデル

各トークンが前のトークンに影響を受けながら、1トークンずつ出力を生成するモデル。

重要性： 明瞭さと構造が生成品質を向上させる理由を説明します。モデルは意味を順次構築するためです。

バックプロパゲーション

誤差勾配を計算してモデル重みを調整する学習アルゴリズム。 LLMが「学習」する仕組みである。

バイアス

偏った訓練データや不均衡な訓練データの影響を受けたモデルの出力パターン。

重要性： バイアスは、AI生成回答におけるブランドやトピックの表現方法や省略に影響を与える可能性がある。

思考連鎖（CoT）

最終回答に飛びつくのではなく、問題を段階的に分解する推論手法。

重要性： 高度なモデル（GPT-5、Claude 3.5、Gemini 2.0）は内部思考連鎖を用いてより深い推論を生成する。

引用元（AI検索において）

AIシステムが生成した回答の下部に表示される出典情報。生成型検索における「ポジションゼロ」に相当する。

重要性： 引用されることが可視性の新たな指標となっている。

コンテキストウィンドウ

LLMが1回のやり取りで処理できるテキスト量。

範囲：

32k（旧モデル）
200k–2M (最新モデル)
フロンティアアーキテクチャでは1000万以上のトークン

重要性： 大きなウィンドウにより、モデルはウェブサイトや文書全体を一度に分析可能。AIOにとって極めて重要。

D–H: 機構とモデル

デコーダ専用トランスフォーマー

GPTモデルの基盤となるアーキテクチャ。生成と推論に特化している。

埋め込み

意味の数学的表現。単語、文、文書、さらにはブランドまでもがベクトルに変換される。

重要性： 埋め込みは、AIがコンテンツをどう理解するか、そして生成された回答にブランドが登場するかを決定します。

埋め込み空間／ベクトル空間

埋め込みが存在する多次元「マップ」。類似した概念はクラスターを形成する。

重要性： これがLLMの真のランキングシステムである。

エンティティ

機械が認識可能な安定した概念。例：

ランクトラッカー
キーワードファインダー
SEOプラットフォーム
ChatGPT
Google検索

重要性： LLMはキーワードマッチングよりもエンティティ間の関係性に大きく依存する。

少例学習／ゼロ例学習

最小限の例（少例学習）または例なし（ゼロ例学習）でタスクを実行するモデルの能力。

ファインチューニング

特定ドメインや動作に特化させるため、ベースモデルに追加で適用するトレーニング。

生成型エンジン最適化（GEO）

AI生成回答に特化した最適化。 LLMベースの検索システムにおいて信頼できる引用元となることに焦点を当てる。

GPU / TPU

大規模なLLMトレーニングに使用される専用プロセッサ。

幻覚

LLMが誤った、根拠のない、または捏造された情報を生成する現象。

重要性： モデルがより優れたトレーニングデータ、より優れた埋め込み、より強力な検索能力を獲得するにつれて、幻覚は減少する。

I–L: トレーニング、解釈、言語

推論

トレーニング完了後のLLMによる出力生成プロセス。

指示チューニング

ユーザー指示を確実に実行するようモデルを訓練すること。

これによりLLMは「有用」に感じられる。

知識のカットオフ

モデルが学習データを持たない日付。検索拡張システムはこの制限を部分的に回避する。

ナレッジグラフ

エンティティとその関係を構造化して表現したもの。 Google検索や現代のLLMは、理解の基盤としてこれらのグラフを利用する。

大規模言語モデル（LLM）

大規模データセットで訓練されたトランスフォーマーベースのニューラルネットワーク。言語の推論、生成、理解を行う。

LoRA（低ランク適応）

全てのパラメータを変更せずにモデルを効率的に微調整する手法。

M–Q: モデル挙動とシステム

専門家混合モデル（MoE）

複数の「専門家」ニューラルサブモデルが異なるタスクを処理し、ルーティングネットワークがどの専門家を起動するかを決定するアーキテクチャ。

重要性： MoEモデル（GPT-5、Gemini Ultra）は、大規模化においてはるかに効率的で高性能である。

モデルアラインメント

「整合性」を参照 — 安全性と意図の適合に焦点を当てる。

モデル重み

トレーニング中に学習される数値パラメータ。これらがモデルの挙動を定義する。

マルチモーダルモデル

複数の入力タイプを受け入れるモデル：

テキスト
画像
音声
動画
PDF
コード

重要性： マルチモーダルLLM（GPT-5、Gemini、Claude 3.5）はウェブページ全体を包括的に解釈できる。

自然言語理解（NLU）

意味、文脈、意図を解釈するモデルの能力。

ニューラルネットワーク

パターン学習に用いられる相互接続されたノード（ニューロン）の階層的システム。

オントロジー

ドメイン内の概念やカテゴリを構造化して表現したもの。

パラメータ数

モデル内で学習された重みの数。

重要性： パラメータが多いほど表現能力は高まるが、必ずしも性能が向上するとは限らない。

位置エンコーディング

トークンに付加される情報。これによりモデルは文中の単語順序を認識できる。

プロンプトエンジニアリング

LLMから望ましい出力を引き出すための入力の設計。

R–T: 検索・推論・学習のダイナミクス

RAG（検索拡張生成）

LLMが回答を生成する前に外部文書を検索するシステム。

重要性： RAGは幻覚を劇的に減らし、AI検索（ChatGPT Search、Perplexity、Gemini）を強化する。

推論エンジン

LLMが複数ステップの分析を実行可能にする内部メカニズム。

次世代LLM（GPT-5、Claude 3.5）には以下が含まれる：

思考の連鎖
ツール使用
計画
自己反省

人間からのフィードバックに基づく強化学習（RLHF）

人間の評価者によるモデル出力の評価を通じて行動を誘導するトレーニングプロセス。

再ランク付け

品質と関連性に基づいて文書を再順序化する検索プロセス。

AI検索システムは引用元選定に再順位付けを活用する。

セマンティック検索

キーワードではなく埋め込み表現に基づく検索。

自己注意

モデルが文中の異なる単語の重要性を相互に比較して評価する仕組み。

Softmax

ロジットを確率に変換するために使用される数学的関数。

教師あり微調整（SFT）

良質な行動の厳選された例を用いてモデルを手動で訓練すること。

トークン

LLMが処理するテキストの最小単位。以下のようなものがある：

単語全体
部分語
句読点
記号

トークン化

テキストをトークンに分割するプロセス。

トランスフォーマー

現代のLLMを支えるニューラルアーキテクチャ。

U–Z: 高度な概念と新興トレンド

ベクトルデータベース

埋め込みの保存と検索に最適化されたデータベース。 RAGシステムで多用される。

ベクトル類似度

ベクトル空間における2つの埋め込みの近さを測る尺度。

重要性： 引用選択と意味的マッチングは、いずれも類似性に依存する。

重み共有

層間で重みを共有することでパラメータ数を削減する技術。

ゼロショット汎化

モデルが、これまで特に訓練されたことのないタスクを正しく実行する能力。

ゼロショット検索

AIシステムが事前例なしに正しい文書を抽出する現象。

この用語集がAIO、SEO、AIディスカバリーにとって重要な理由

検索エンジンからAIエンジンへの移行が意味するもの：

発見は今や意味論的である
ランキング → 引用
キーワード → エンティティ
ページ要因 → ベクトル要因
SEO → AIO/GEO

これらの用語を理解すること：

AIO戦略を強化
エンティティ最適化を強化
AIモデルがブランドを解釈する方法を明確化
AIの幻覚現象を診断する
より優れたコンテンツクラスターを構築
Ranktrackerツールの使用方法をガイド
マーケティングの将来性を確保

LLMの言語を理解すればするほど、その内部を可視化する方法をより深く理解できるからです。

この用語集はあなたの基準点となる——新たなAI駆動型ディスカバリーエコシステムの辞書である。