Google I/O翌日に「Searchが会話ボットになった」——AI Overviewsのバグと精度問題が問いかける「AI検索の信頼性」

※本記事は2026/05/23時点での情報を基にしており、閲覧時点では内容や状況が変わっている可能性があります。

5月22日、Google I/O 2026でAI Searchへの全面転換を高らかに宣言した翌日、奇妙な報告が拡散した。検索ボックスに「disregard(無視する)」と入力したユーザーが、従来の辞書定義や検索結果ではなく、こんな返答を受け取ったのだ——「Understood. I have disregarded your previous message. How can I help you today?(了解しました。前のメッセージは無視しました。今日はどのようなご用件でしょうか?)」

同様の現象は「ignore(無視する)」「dismiss(却下する)」「stop(止める)」「start(始める)」「skip(スキップする)」「quit(やめる)」「look(見る)」「forget(忘れる)」など複数の「行動指示系ワード」でも確認された。AI Overviewsがこれらの単語を検索クエリとして処理するのではなく、自分への命令として解釈したのだ。

バグが最初に報告されたのは5月22日。Googleは5月23日に問題を公式に認め、USA TODAYへの声明で「AI Overviewsが一部のアクション系クエリを誤解釈していることを認識しており、近日中に修正をリリースする予定だ」と述べた。

一見すると笑い話のような一件だ。しかし昨日の記事(5月22日付け)でGoogleのAI Search全面転換の野心を報じた直後に起きたこのバグは、I/O 2026でGoogleが宣言した「AIエージェントが検索を代替する世界」の信頼性そのものを問う、タイミングの悪い皮肉として受け取られた。

これはバグか、それとも構造的問題か

「事実の誤り」ではなく「意図の誤解」

今回のバグが以前の問題と異なるのは、事実誤認ではなく「ユーザーの意図の根本的な誤解」である点だ。

2024年にAI Overviewsが「ピザにグルーを塗れ」「blinker fluid(存在しない自動車用品)は実在する」などと述べた問題は、情報の正確性の問題だった。修正も比較的明快だ——「そのURL(またはソース)が間違っている」というフィードバックで対処できる。

しかし今回の問題はより深い層にある。ユーザーが「disregard」という単語の意味を調べたいのか、自分が何かに対して「無視しろ」と命令しているのか——AIはこの文脈を読み取れなかった。検索クエリを「コマンド」として誤認識するという問題は、検索エンジンの根本的な役割——ユーザーの情報ニーズを理解すること——の誤解であり、テクニカルな修正より根の深い課題を示している。

長年Googleが提供してきた辞書機能は、単語を入力すれば即座にMerriam-Websterなどからの定義を表示するものだった。その機能がAI Overviewsに置き換えられたことで、今回の誤動作が生じた。

NYUコンピュータ科学教授が指摘した「信頼の侵食」

ニューヨーク大学タンドン工学部の准教授Chinmay Hegdeはこう警告する。「Googleはインターネット上の情報の最重要ソースであるはずだ。

その製品の質が低下すれば、ゆっくりとGoogleへの信頼を侵食していくことになる。」 今回のバグはすでに修正されると約束されているが、この指摘は今後も残り続ける問いだ。

「90%正確」という数字の本当の意味——2本の研究が示す現実

Oumistudio:約50%の回答が引用元で裏付けなし

今回のバグ報告と並行して、AI Overviewsの精度に関する研究が改めて注目を集めている。

AI研究スタートアップのOumiが行った研究では、各4,326クエリを対象にGemini 2とGemini 3それぞれのAI Overviewsを評価した。精度はGemini 2で約85%、Gemini 3で約91%だった。

一見すると「10回に9回は正確」は高い評価に見える。しかし2026年にGoogleが処理すると予想される5兆回以上の検索に適用すれば、残りの10%は膨大な量の誤情報として積み重なる。Popular Scienceは「毎時数千万件の疑わしい回答」、つまり毎分数十万件のエラーになると試算した。

さらに深刻なのは精度ではなく「裏付け」の問題だ。OumiはAI Overviewとその引用を精査し、「約半数のAI Overviewには引用元のソースで裏付けられていない事実が含まれている」と報告した。

つまり「回答が間違っている」より多いのが「回答が正しいかどうか、引用元では確認できない」という状態だ。ユーザーがその回答を読んでも、裏付けを辿ることができない情報が大量に流通している。

arXiv学術研究:主張の11%が引用元で非サポート

並行して発表された学術研究(arXiv掲載)では、2026年3月13日から4月21日の40日間にわたり、19カテゴリ・55,393クエリを対象に調査が行われた。

98,020の原子的主張(individual claims)を分解した結果、11.0%が引用元のページで裏付けられていないことが判明した。なお「省略」が最も多い失敗モードだった——明確な誤りではなく、重要な文脈や条件が抜け落ちているケースだ。

さらに、AIOに引用されたドメインの約30%が通常の検索結果の1ページ目には表示されていなかった。つまりAI OverviewsのソースはGoogleの通常ランキングとは異なる独自の選択メカニズムで選ばれているということだ。

FacebookとRedditが「情報源」になっている現実

この研究は情報源の質についても重要な知見を示した。AI Overviewsで2番目に多く引用されるのはFacebook、4番目はRedditだ。さらに、不正確な回答ではFacebookへの依存率が7%(正確な回答での5%に対して)と高く、質の低いコンテンツや文脈の乏しい投稿がAuthoritativeな要約として表示される可能性を示唆している。

この構造はGoogleのAI Searchが抱える根本的な課題を浮き彫りにする。SEOの観点から権威あるサイトとして見えるページを作り、フェイクの情報を詰め込めば、AIがそれを正確な要約として数億人のユーザーに届ける可能性がある。研究者とデジタル権利擁護者は、AI Overviewsは単なる時折のノイズではなく、グローバルスケールの偽情報の新たな経路になりうると主張している。

健康・医療クエリで顕在化した「信頼性の非対称性」

この問題はヘルスケア領域で最も深刻に顕在化している。調査によれば、AI Overviewsの健康関連引用で信頼性の高い医療ソースから引用されているのは34%のみで、病院サイトよりもYouTubeの方が多く引用されている。

Googleは2026年1月に特定の健康クエリに対してAI Overviewsを削除した——Guardianの調査により誤解を招く医療情報の提供が明らかになったためだ。

この措置は重要なシグナルだ。GoogleはAI Overviewsの展開を加速しながら、同時に最も精度要求が高い「医療」領域では後退した。ユーザーの命に関わる可能性がある情報での誤りは、他の領域とは比べられない信頼コストを生む。

昨日の記事で報じたように、出版社のオーガニックトラフィックが崩壊し、NPRが「絶滅レベルの危機」と呼ぶ状況が進む一方で、その代替として機能するはずのAI回答が「約50%は引用元で裏付けなし」という状態にある——これが2026年5月のAI Searchの現在地だ。

「AIに参照されるコンテンツ設計」——実践的な考え方

AI Overviewに引用されると何が起きるか

AI Overviewsに引用されている企業には明確な優位がある。AI Overviewsに表示されるブランドは91%多くの有料クリックと35%多くのオーガニッククリックを獲得しているとされる。ゼロクリックが増えるという問題とは別の話として、「AI Overviewsで引用される」こと自体が一種のブランドの権威付けとして機能し始めているのだ。

ただし昨日の記事で触れた構造的問題も現実だ——AI Overviewsに引用されるドメインの約30%が通常の検索1ページ目に表示されないという事実は、「SEOで上位表示する」こととは異なる軸でAIに引用されるための設計が必要であることを示している。

なぜ「原子的な主張の裏付け」が重要になるか

arXiv研究が明かした「省略が最も多い失敗モード」という発見は、コンテンツ設計に具体的な示唆を与える。AIがコンテンツを引用する際、「全体の主張は正しいが、重要な条件・文脈・制限が省略される」という形でユーザーに届くケースが最多だ。

これを防ぐためのコンテンツ設計として有効なのは、主張と根拠を切り離さないことだ。「〇〇という効果がある」という主張の直後に「ただし××という条件のもとで」「△△のデータに基づき」という根拠・条件・出典を明示する構造が、AIに省略なく参照されるコンテンツとして機能しやすい。

AI Search時代の「情報資産設計」の原則とは

昨日の記事で示した方向性を、今回の情報と組み合わせて、より具体的に整理してみたい。

1. 一次情報・独自データの明示:Facebookのような二次的・三次的ソースが引用されやすい現状で差別化するには、「自社調査」「独自インタビュー」「計測データ」という一次情報をページ内で明確にラベリングすることが重要だ。

2. 主張と根拠の「原子的」な構成:「〇〇はAである」という主張単独ではなく、「〇〇はAである。なぜなら[具体的根拠]。出典:[リンク/調査名]」という形で各主張を自己完結させる。

3. FAQ形式での文脈補完:「よくある誤解」「適用できる条件」「適用できないケース」をFAQ形式で補足することで、AIが省略しやすい「例外・条件」をページ内に組み込む。

4. 更新日と著者の専門性の明示:リアルタイムのファクトチェックシグナルがAI Overview引用確率を約89%高めるとされる研究が示すように、コンテンツの「いつ、誰が、何の根拠で書いたか」を明示することがAIの信頼評価に直結する。

5. 構造化マークアップの活用:FAQページ・HowTo・定義・比較表をStructured Dataでマークアップすることで、AIが情報を「解釈」するのではなく「読み取る」ことを可能にする。

6. 既存情報の言い換えからの脱却:Oumistudioが示したように、AIはソース品質と正確性がほぼ独立して評価している——つまり権威あるように見えるサイトを引用しても、その内容が他サイトの言い換えなら誤りも一緒に継承される。他の誰も書いていない情報こそが、AIに「引用価値がある」と判断される。

7. 医療・法律・金融の「高リスク領域」での徹底した出典明示:Googleが医療クエリで一時的にAI Overviewsを削除したように、これらの領域での誤引用リスクは特に高い。信頼性のある一次機関(学術論文・公的機関・専門団体)へのリンクを明示することが、AIによる「誤ったAuthority判断」を防ぐ設計となる。

「AI Search」への信頼は、まだ作られていない

今日起きた「disregard」バグとOumi・arXivの研究が突きつける現実は同じだ——GoogleはAI Searchへの全面転換を宣言したが、その信頼性はまだ「作られている最中」であり、完成してはいない。

昨日の記事で報じた通り、出版社のトラフィックはHubSpotで70〜80%、NPRが「絶滅レベル」と呼ぶほど崩壊しつつある。一方でその代替として機能するAI回答は、毎分数十万件の誤回答を生成し、約50%が引用元で裏付け不足という状況だ。

この二重の現実を前に、企業のコンテンツ責任者が今問うべき問いは一つだ——「自社のコンテンツは、AIが代替できない固有の価値を持っているか」。その問いへの答えが「ノー」であれば、AI Overviewsが吸収する前に、コンテンツの設計そのものを見直す時機にある。

※出典:Google’s AI Overviews can’t handle words like ‘disregard’ and ‘ignore’(Biggo Finance / 複数報道まとめ) / Searching for ‘Disregard’ Breaks Google(USA Herald) / Oumi’s Study Finds 50% of AI Overviews Untrustworthy(Oumi公式ブログ) / Measuring Google AI Overviews: Activation, Source Quality, Claim Fidelity, and Publisher Impact(arXiv / ResearchGate) / Google’s AI Overviews Pump Out Millions Of Wrong Answers Each Hour(TechTimes) / Study: Google’s AI Overviews show millions of wrong answers(Popular Science) / Google AI Health Search Accuracy(Primary Intelligence)

関連記事

SEOの次へ。BtoB企業が今すぐ向き合うべき"AI検索時代"の新しい露出戦略

feature

Pick Up

スキル習得を加速させる「動画マニュアル」の量産術|質の高いマニュアルの設計方法を解説

L&D(教育)

従業員インタビュー動画を活用~導入活用・案件削減・採用戦略のリード活用

HR(採用)

ITツール導入ツールを企業にワークフロー化、驚異コスト削減・導入動画プロダクションを提供

SaaS/IT

動画FAQ導入に~コンテンツ拡張で案件活用向上~企業の導入活用

CS(サポート)