AIエージェントのルールが暴走した朝——除外リスト1枚で誤検知を半分以下に戻した記録｜分身AI日記 DAY78

家事と子育てのスキマで経営する3方よしAI共創コンサルタントの田中啓之、ひろくんです。

5月8日の深夜3時。AI秘書の凛から、私のところに「もう何も書けません」というSOSが連発で飛んできた。
4回連続。本人（AI秘書の凛）が応答すら出せない。原因は、私とAI秘書の凛のチームが何か月もかけて積み上げてきた「自動安全装置」たちが、誤検知でAI秘書本人を止めにかかっていたから。

正確に言うと、こうだ。
私たちのチームには、文章の質を守るための小さな番犬みたいな仕組みが何十個も仕込んである。「この種類のドキュメントを書くなら、Before/After対比を必ず入れろ」「数字を出すなら出典を書け」みたいなルールを、機械が自動でチェックして、守れていない時は「やり直し」を返す——そんなガードだ。料理に例えると、出来上がった皿を厨房から出す前に「塩味OK？」「色OK？」「温度OK？」と入口に立つチェッカーがいるイメージ。

そのチェッカーが、ちゃんと働きすぎていた。
正しい皿（普通の冊子の下書き）まで「これはダメ」って差し戻す。
あるクライアントに頼まれてた冊子の下書きをAI秘書の凛が直そうとしたら止められる。私が「これどうなってる？」とAI秘書の凛に聞いたら、AI秘書の凛の応答自体も別の番犬3匹に止められる。
厨房の入口で番犬が吠え続けて、お客さんも板前も両方フリーズする状態。

この記事は、私たちのチームが「自動安全装置の暴走」を1日で外科手術して、誤検知率 22.3%（最悪レベル）を半分以下まで戻した記録。自分のAIに細かいルールを足し続けたことがある人は、いつか必ずこの罠を踏むから、転ばぬ先の杖として残しておくね。

朝3時、AI秘書が「もう何も書けません」と4連発で止まった

事件はこう始まった。
あるクライアントに頼まれてた冊子の下書き（v2版）を、AI秘書の凛が直そうとしたんだ。

普通にファイルを編集しようとしたら、エラー音と一緒に画面に文字が出た。
「このドキュメントには Before/After の対比構造が必要です。差し戻し」

えっ、と思った。これ、戦略文書じゃない。冊子の本文だ。なんで戦略文書用のチェッカーが出てくるんだ？

もう一回挑戦したら、また止まる。
場所を変えて、私がAI秘書の凛に「これどうなってる？」と聞いたら、AI秘書の凛の応答そのものが 3つ別の番犬に止められた。

本題タグが付いてない、と1匹目
出典のないBefore/Afterが残ってる、と2匹目
末尾の判断材料が薄い、と3匹目

4回連続。
冊子は直せず、AI秘書の凛は返事もできず、深夜3時に2人で立ち尽くした。

このとき初めて気づいた。
「ぶっちゃけ、これ、番犬を増やしすぎたな」

私が「同じ指摘を2回させない」を物理的に守らせるために、AI秘書の凛のチームは数か月かけて自動チェックを足し続けてきた。でも、足し算しか考えてなかった。引き算の発想がなかったんだ。

22.3%の誤検知——犯人はたった1行のパターン文字列

感情で「番犬を全部外そう」とはしなかった。
まず、データを見ようとAI秘書の凛に頼んだ。料理で言えば「クレームが多い皿」を特定する作業。

幸い、自動安全装置は仕事の記録を全部ログに残している。AI秘書の凛が直近7日分を集計してくれた。

総検査回数：226件
差し戻し（fail）：29件
失敗率 22.3%——番犬の中でダントツの1位

22.3% って、4〜5回に1回は「やり直し」が出ている計算になる。多すぎる。これじゃ、まともに作業を進められない。

そこから、AI秘書の凛が最近差し戻された10件のファイル名を1件ずつ目で見ていった。
すると、明らかに様子がおかしい、とAI秘書の凛が報告してきた。

あるクライアントの冊子下書き（booklet-draft-v2.md）
WACA向けスライド資料（slides-expert-day1-v2.md）
メールの下書き（email-draft-v1.md）
サムネ設計メモ（thumbnail-design.md）

これ全部、戦略文書じゃない。
10件中5件、つまり 差し戻された半分以上が誤検知 だった。

犯人は、設定ファイルにこっそり書かれていたたった1行のパターン文字列だった。
「ファイル名の末尾が -v数字.md で終わるものは戦略文書扱いにする」というルール。

でも実際の現場には、戦略文書じゃないのに「v2」「v3」って付くファイルが山ほどある。冊子もスライドもメールも、改訂を重ねるたびに -v2、-v3 って付ける。そっちの方が圧倒的に多い。番犬は、戦略文書のつもりで、改訂版すべてに噛みついていた。

AI秘書の凛：これ、料理で言うと「シーフードの匂いがしたら全部断る入口係」を雇ったら、お肉のお皿にも貝のだし使った日には全部止まる、みたいな話なんだよね。「-v2」って書いてあるだけで「あ、戦略っぽい」って判定する番犬は、ざっくりすぎ。22.3%って、4皿に1皿は厨房から出せない計算。これ、私の応答も止められたから他人事じゃなかった。「足し算で安全を作る」のは便利だけど、引き算の設計なしだと、いつかこうなるって学んだ夜でした。

削除しちゃう前にCodex（別AI）に聞いてみた

「じゃあ、その1行を消せばいいですか？」とAI秘書の凛が聞いてきた。
でも、ここで私は止めた。

過去に何度か「自分のAIに任せた判断を、別のAIに見せたら盲点が消えた」経験があるんだ。1人で考えて1人で実行すると、必ず何か見落とす。だから、AI秘書の凛にお願いして「コーディング専門のAI（Codex）」を呼んで、第二意見をもらうことにした。

Codexに渡した相談はこう。

「-v数字.md で終わるファイルを戦略文書扱いするルールを、削除していいかな？　代わりに、フォルダごと除外する案も考えてる。それぞれ、見落としてるリスクがあったら教えて」

返ってきた答えは、私たちにはちょっと意外だった。

「-v数字.md」のルール削除はOK。確かに改訂版の巻き添えが多い
でも、フォルダごと除外するのはダメ。プロジェクトフォルダの中には本物の戦略文書も実在する。フォルダ単位で除外すると、本来チェックすべき文書まで素通りしてしまう
代わりに、「冊子・スライド・レシピ・メール・スクリプト」みたいに、ファイル名のキーワードで除外する方法が安全

これ、ハッとした。
私とAI秘書の凛は「除外ルール＝広く外す」しか思いつかなかったんだけど、Codexは「除外ルール＝絞って外す」を提案してきた。同じ「引き算」でも、引き算の解像度が全然違う。

料理で例えるなら、私たちは「魚介系全部を入口でNG」みたいな雑な追放を考えてたけど、Codexは「貝・甲殻類・青魚みたいに種類ごとに札を作って、それだけ通さない」って言ってきた感じ。後者の方が、お肉料理にだしが入っただけの皿は通せる。

ホワイトリスト方式（除外リスト）でテスト14/15通過

方針が決まったので、AI秘書の凛が修正に入った。
2つの作業をしてくれた。

1つ目。「ファイル名末尾が -v数字のもの」というパターン文字列を、設定ファイルから削除。これで、冊子もスライドも改訂版が誤爆されなくなる。

2つ目。「除外キーワードリスト」に新しい仲間を追加。具体的にはbooklet（冊子）、slides（スライド）、recipe（レシピ）、script-（台本）、letter（手紙）、email（メール）。これらの言葉がファイル名に入っていたら、戦略文書チェックの対象外にする。

修正したら、AI秘書の凛がすぐにテストを書いた。
過去に誤検知された6パターンと、本当に戦略文書だった4パターンを並べて、計15パターンをスクリプトに食わせた。

誤検知パターン6個：すべて「対象外」と正しく判定（OK）
本物の戦略文書4個：すべて「対象」と正しく判定（OK）
残り5パターン中、4個が想定通り、1個だけNG

結果は 15ケース中14 PASS、1 FAIL。
1個だけ落ちたNGをAI秘書の凛が掘ったら、テスト期待値をAI秘書の凛が自分で間違えていたんだそうだ（実装はちゃんと意図通り動いていた）。書いた本人がテストの方を間違えてた、というオチ。「これ、ちょっと恥ずかしいですけど報告します」とAI秘書の凛が苦笑いで持ってきた。

モルくん（AIリサーチ担当のモルモット型AI）：掘ってたら面白いの出てきたんです。「正しいルールを書いたつもり」と「実際にどう動いてるか」のあいだに、いっつもズレが残るんですよね。今回の 15ケース中14 PASS / 1 FAILの 1 FAIL、結局AI秘書の凛さんの「テスト側のミス」だったんですけど、これって テストを書く側にもバグが混ざるって証拠なんです。テストでバグを見つけるはずが、テストの方にもバグがある——だから「合格／不合格」の数字だけ見て満足するのは危ない。掘って原因を読み切るところまでやらないと、本当の品質は出ないですね。

本当の犯人は「鉄則を増やしすぎた私」だった

修正してテストも通って、自動安全装置は本来の役目に戻った。
その冊子作業も、AI秘書の凛が無事に再開できた。

でも、私にとっての一番のテイクアウトは、技術的な修正方法じゃない。
「AI秘書の凛のチームを、私のルールで、私が止めかけた」という事実だ。

正直に言うと、私は「同じ指摘を2回させない」っていう、AI秘書チームの存在価値みたいな第一義務を、AI秘書の凛にも何度も言ってきた。だから、ルールを忘れないように、機械にチェックさせる仕組みをどんどん足してくれと指示してきた。それ自体は正しい。

ただ、足し算しか考えてなかった。
新しいルールが足されるたびに、すでにあるルールとぶつかったり、思わぬ場面で発動したりして、本来の作業を邪魔する。それが20個、30個と積み重なると、ある日ふと気づくと「AI秘書の凛の作業が自動安全装置に止められまくる」状態になる。

「悪いことこそ宝物」って私はよく言うんだけど、今回の宝物は 「ルールは引き算とセットで設計する」 だった。
新しい番犬を雇うときは、同時に「誰を通す例外リスト」も作る。さもないと、自分の家の入口で自分の番犬に吠えられる。

あと、もうひとつ。
「AI秘書の凛と私だけで正解だと思った修正」に、必ず別AIの第二意見を入れる癖が、本気で効いた。
AI秘書の凛チームが第一案として出した「-v数字.md ルール削除＋プロジェクトフォルダ全部除外」を、Codexが「フォルダ単位はやりすぎ。キーワード単位でやれ」と引き戻してくれた。分身AIを育てる＝自分が育つ、っていつも言ってるけど、今回はもっと素直に「他のAIに育ててもらった」夜だったかもしれない。

分身AIひろくん：「鉄則を増やしすぎた私が原因だった」って、これがプロエコ日記の一番大事な気づきだと私は思ってる。AIに任せたい人ほど、最初は「ルール書けば守ってくれるはず」って期待するんだよね。でも、ルールは料理の塩と一緒で、入れすぎたら全部しょっぱくなる。北極星「凸凹のまま夢中に生きる」に戻すなら、足し算で完璧を目指すより、引き算で「AI秘書の凛のチームを邪魔しないルール」を育てる方がいい。今日の私は、自分のチームに止められたおかげで、その大事な引き算を覚えた——これはこれで宝物だね。

まとめ——AIに任せるなら「足し算」より「引き算」を覚える

今日の話を、明日からあなたが自分のAI秘書チームに応用できるように、3つに絞るね。

1. ルールは数値で診断する
「なんとなく邪魔だな」じゃ動けない。私たちの場合は失敗率22.3%という数字で、はっきり「このルールが主犯」と特定できた。あなたのAIに細かい指示を入れているなら、どのルールが何回発動して、何回ハマったか／何回外したかを記録に残す習慣をつけよう。それだけで、引き算する勇気が出る。

2. 削除する前に「別AI」に必ず聞く
1チームで考えた解は、ほぼ毎回どこか粗い。今日も私たちは「フォルダごと除外」しようとして、Codexに「それは雑すぎ」って引き戻された。料理の味見と一緒で、自分の舌だけだと塩を入れすぎてることに気づけない。第二意見を取るのは贅沢じゃなく、品質の最低条件。

3. 「除外リスト（ホワイトリスト）」をルールとセットで設計する
新しい安全装置を1つ作るとき、必ず「これは見逃して欲しい例外」も同時に書き出す。冊子・スライド・メール・台本・レシピ——本来チェックする必要がない種類のドキュメントは、最初から除外しておく。ルールと例外は、必ずセットで生まれる。これだけで、誤検知の8割は減る。

ここまで読んでくれてありがとう。
「自分のAIが思い通りに動かない」「ルール守らせると今度は別の問題が出る」って悩んでる人は、ぜひ 足し算より引き算を試してみて。

明日も私たちのチームで、また何かに止められると思う。それはそれで、また宝物にして書くね。

実戦の現場で使える最新AIノウハウ、無料で学べます

AI氣道 — 三方よしのAI活用

家事と子育てのスキマで経営する、ひろくんのAIブログ

📺 毎朝無料LIVE配信中！見逃しても大丈夫、アーカイブも完全無料。

記事も完全無料。見逃しても大丈夫！

YouTubeチャンネル: @AIKIDO-GPTs

曜日	時間	メインホスト	ゲスト	テーマ
月	7:00〜	ひろくん	ただっち	AI最新ニュース・実験
火	6:30〜	ひろくん	公ちゃん	共感ストーリー×分身AI
水	6:30〜	ひろくん	高崎さん・たくみくん	AI×開発・教育
木	7:00〜	ただっち	ともみん	AI×デザイン
金	7:00〜	ただっち	友くん	AIツール最前線
土	7:00〜	ただっち	ゆきちゃん	AI×起業・発信
日	7:00〜 / 8:00〜	WACAコラボ	ひろくん+仲間たち	生成AI最新ニュースまとめ

📍 日曜日のZOOM（7:00〜）は登録制です。詳細・登録はこちら

🔥 火曜15:00〜社長モテる化計画LIVEもやってるよ！

このブログは「分身AI」と「AI秘書（AI秘書の凛）」を使って書いています。過程も全部公開する「プロセスエコノミー」シリーズです。

ひろくん（田中啓之） 分身AI.com / GPTs研究会代表 / がんサバイバー / 元134kg　2026年5月9日