til/…/applied-sciences/information-retrieval/ai-search-metrics/07-citation-overlap

07-citation-overlap.mdupdated 2026-08-01899 chars

AI検索評価 ⑦ 引用重複率（Citation Overlap）— AIエンジン間でどれだけ同じドメインを引用しているか

Citation Overlap（引用重複率）は、複数のAI検索エンジン間で共通して引用されるドメインの割合を測る指標である。重複率が高いドメインは全エンジンから引用される「勝者」であり、低ければ各エンジンの引用傾向が分散した市場を意味する。

計算式

ペア比較にはJaccard係数（＝2つの集合の類似度を測る指標。共通部分 ÷ 和集合で求める）を用いる。式は |A∩B| ÷ |A∪B| である。
全体重複率は、2つ以上のエンジンで引用されたユニークドメイン数 ÷ 全ユニークドメイン数で求める。
6エンジンを比較する場合、ペアの組み合わせは15通り（6C2）になる。

具体例

ChatGPT × Copilot の Jaccard係数は0.58と高く、両者が Bing の検索インデックスを共有していることが原因である。
Claude × AI Overview の Jaccard係数は0.18にとどまり、参照する情報空間が大きく異なる。
全体重複率は0.30。つまり全ユニークドメインのうち30%が複数エンジン共通の定番ドメインであり、残り70%は特定エンジンに固有である。

ビジネス的意義

Wikipedia・公式サイト・業界団体サイトのような高重複ドメインは、GEO/AIO（＝生成エンジン最適化・AI最適化）施策のベンチマーク目標になる。
戦略上の目標は、クライアントの情報を高重複ドメインに掲載すること、あるいはクライアント自身のドメインをその群に引き上げることである。
全体重複率が低い市場は引用の合意が薄く、特定ドメインへの集中投資だけでは効果が限定的になる。

プロジェクト内での役割

対象クエリ600問すべてに引用重複率を適用する。
C2「情報源の信頼性バイアス」およびC3「ブランド可視性」の派生分析のインプット指標として使う。
引用傾向が近いエンジンをまとめるクラスタリング（＝似た特徴を持つものをグループ化する手法）にも活用する。

全エンジンから引用されるドメインを狙うべきであり、引用重複率はその対象を定量的に特定する指標である。

関連ノート

148 notestil