til/…/applied-sciences/information-retrieval/ai-search-metrics/10-citation-consistency

10-citation-consistency.mdupdated 2026-08-01967 chars

AI検索評価 ⑩ 引用一貫性（Citation Consistency）— 先週と今週で同じドメインを引用しているか

引用一貫性とは、同じクエリに対してAI検索エンジンが週をまたいで同じドメインを引用し続けるかどうかを、Jaccard類似度（＝2つの集合の重複度を表す指標）で測る指標である。ランキングの変動の激しさを捉え、施策効果を検証するのに必要な観測週数の目安を与える。

定義と計算式

一貫性＝「第N週の引用ドメイン」と「第N+1週の引用ドメイン」の共通部分 ÷ 両者の和集合（Jaccard類似度）。
クエリごとに計算した値を平均する。エンジン×クエリ単位の内訳も分析する。
時系列に延長する場合は、週次のJaccard値の系列を作り、その分散を観察する。

なぜ重要か

ビジネス観点では、一貫性が高いほど安定したSERP（検索結果ページ）に近い挙動になり、施策効果を読みやすい。
一貫性が低いとノイズが大きく、ドメインの変動を実際の施策に帰属させにくくなる。
学術的な根拠は再検査信頼性（test-retest reliability、Cohen 1988年）であり、Krippendorffのα（＝評価者間の一致度を測る指標）で補完できる。
エンジンの検索方針が安定した特性（trait）なのか、変動する状態（state）なのかを判断する材料になる。

計算例（仮想シナリオ：77問×2週）

ChatGPT Search：0.78 —— 高い安定性。
Copilot：0.71。Gemini：0.65。
AI Overview：0.42 —— 先週引用したドメインの約60%が今週は入れ替わる。
AI Overviewについて施策効果を検証するには、分散を補正するため連続4週以上のデータが必要になる。

AIサーチプロジェクトでの活用

日次の縦断トラッキング（＝同一対象を継続して追跡する調査手法）の全クエリを対象に、週次で集計する。
エンジン×意図カテゴリ×週で集計し、変動トレンドのチャートとして可視化する。
C2「情報源信頼性バイアス」の時間的安定性の側面を構成する。
エンジンの検索ポリシーがtraitかstateかを区別する指標としても使う。

スコア0.42は週ごとに60%のドメインが入れ替わることを意味し、AI Overviewの施策効果を評価するには最低4週の連続データが必要になる。

関連ノート

148 notestil