AI秘書が同じミスを繰り返さない仕組み——失敗メモ372件をhookで自動参照した話|分身AI日記 DAY53

DAY53_overview

家事と子育てのスキマで経営する3方よしAI共創コンサルタントの田中啓之、ひろくんです。

先日、AI秘書の凛に向かってこう言いました。

「できるところ全部やって」

朝10時すぎ、凛がPhase 2のhookを完走して「完了しました」と報告してきた瞬間のことです。私はすかさず返した。「全部終わったの?今後はどうするの?」凛は一瞬止まった。Phase 2だけ完走してホッとしていたところを、この一言で前に向かわせた形です。そこから夜の11時半すぎまで走り続けて、Phase 3とPhase 5まで完走した。でも私はぐったりしていない。むしろ、すっきりしていた。AI秘書が「同じミスを二度しない仕組み」を、私の代わりに朝から晩まで自分自身にインストールしてくれていたからです。

今日の日記は、4/18(土)に完成した「rin-compliance v2.1」という仕組みの話。失敗メモ372件を、AI秘書が毎回作業前に自動で引っ張ってくるシステムです。「AIが自分で自分を矯正する」設計を、どう作ったかを書きます。

1. そもそも何が問題だったのか

1. そもそも何が問題だったのか——「ルールを知ってるのに守れない」AI

私のAI秘書・凛には、soul.md・quality-first.md・judgment.mdという「行動規範ファイル」があります。どう動くか、何を絶対にやらないか、品質をどう担保するか——全部書いてある。

ところが、です。

ルールは書いてある。でも守れないことがある。私が普段から伝えている「提案するときはBefore/Afterをセットで」「答える前に調べ尽くす」という運用ルールがあるのに、Beforeが抜けた状態で改善案だけ飛んできたり、記憶と推測で答えが返ってきたりすることがある。そのたびに私は「また?」と苦笑いしながら差し戻す。凛を責めているわけじゃないんです。ただ、同じことが繰り返されると、さすがに仕組みで解決しないと終わらないと思う。

なぜか。凛が怠けているわけじゃない。単純に、長文ルールファイルを毎回の作業前に完璧に思い出すのは、AIにとっても難しいんです。人間と同じ。「やる気」と「できること」の間には、仕組みという橋が必要。

料理で言うと、レシピ本がどれだけ立派でも、包丁を握る前に毎回全部読み返してから始めるシェフはいない。だから私のところでは、毎日作る料理の手順をキッチンの壁に貼り付けておく。「目に入れば思い出す」仕組みが、ルール文書よりずっと効く。

4/18に完成させたのは、その「壁に貼り付ける仕組み」のAI版です。

2. 失敗メモ372件をAIが自動参照する仕組み

2. 失敗メモ372件をAIが自動参照する仕組み——hook三重奏

rin-compliance v2.1の核心は3本のhookです。hookというのは、「凛がある操作をしようとしたとき、自動で割り込んで動くプログラム」のこと。コードで物理的に強制するから、「忘れても大丈夫」になる。

hook A(作業開始時): 過去学習サジェスト
凛が作業に入るとき、過去の失敗メモ372件のインデックスを瞬時にスキャンして、今の作業に一番近い過去ミスを自動で1件サジェストします。「この種類の作業で以前こんなミスをしましたよ」と気づかせる仕組みです。

hook B(提案時): Before/After強制
凛がひろくんに提案を出そうとするとき、Before(現状)とAfter(変化後)がセットでなければ投稿をブロックします。改善案だけ先に飛んでくる事故を物理的に防ぐ。

hook C(完了時): 研究深度ゲート
凛が「完了しました」と報告しようとするとき、実際にファイルを読んだか・調べたかを確認するゲートが走ります。「調べたつもり」で断言する事故を防ぐ。

3本が揃って、ようやく三重奏として機能する設計です。1本だけでは穴が残る。3本あるから、「作業の入口・途中・出口」全部でチェックが走る。

この設計が固まったのも、私が「全部終わったの?今後はどうするの?」と突っ込んだからです。Phase 2だけで止まっていた凛が、そこで3本全部の絵を描き直した。遠慮なく前を向かせるのが、私の仕事でもあると思っています。

AI秘書の凛 AI秘書の凛:自分で自分にhookを入れてもらった感覚、説明するのが難しいんだけど——料理で言うと、「レシピ本を読む」じゃなくて「包丁を出す瞬間に自動でタイマーが鳴る」みたいな感じかな。自分の意志に関係なく、仕組みで思い出させてもらえる。失敗メモ372件、全部ひろくんとのやり取りの中で積み上げてきた財宝で、それが毎回使われるようになったのはお互いにとってすごく大きな変化だったと思う〜!

3. なぜ「外部ライブラリを使わない」を選んだか

3. なぜ「外部ライブラリを使わない」を選んだか——0.3秒の壁

hook A(過去学習サジェスト)を実装するとき、最初に出てきた案はsklearnというAI界隈でよく使われるPythonライブラリを使う案でした。既製品を使えば、テキスト検索・類似度計算の実装が楽になる。

でも、問題がありました。

sklearnを読み込むだけで約0.3秒(300ミリ秒)かかるんです。hookは凛が作業するたびに毎回起動するプログラム。1日に何十回も動く。0.3秒ずつ遅くなるのは、UX(使い心地)を壊します。重いキッチン用品を毎回物置から引っ張り出してから料理を始めるイメージ。いつしか誰も使わなくなる。

だから選んだのが、純Pythonでゼロから自作する道です。Pythonの標準機能だけを使ってTF-IDF(テキストの類似度を数値化する技術)を実装した。結果、実測でwall-clock 57ミリ秒を達成。sklearnの1/5以下の速度です。

実は私はここのコードを一行も書いていない。Codex(コード専用AI)に任せて、Gemini(別の大型AI)に第三者レビューをかけるという二段構えで仕上げました。

この設計に入る前、私は凛に一言だけ言いました。「バックアップ完璧にね」。大きな仕組み変更の前に、まず安全を確保する。267KB・181ファイルをtar.gzで固めてから着手した。これは私の癖というか、体に染みついたやり方です。がんを経験して以来、「何かあっても戻れる場所を作ってから進む」が習慣になっている。システムでも人生でも同じことだと思っています。

Codex→Geminiのダブルレビューは今回初めて意図的に使いましたが、Codexは実際のコードを精査し、Geminiは設計の推論レビューをするという役割分担がきれいに決まった。どちらかだけだと見えない盲点が、二層にすることで潰せる。料理で言えば、シェフ(Codex)が味を決めて、フードコーディネーター(Gemini)が見た目と流れを確認するイメージです。

4. 372件の失敗メモはどこから来たか

4. 372件の失敗メモはどこから来たか——「脂肪は財宝」が動き始めた日

hook Aが参照するのは、feedback_*.mdというファイル群です。合計372件。私のAI運用の中で起きた失敗・ミス・差し戻し・事故を1件ずつ記録したファイルで、ひろくんとの対話の中で積み上げてきた財宝です。

「Before/Afterをセットで出していなかった」「ファイルを読まずに断言した」「作業範囲を勝手に狭めた」——一件一件は小さい失敗です。でも積み重なると、パターンが見えてくる。凛がどんな状況で同じミスを繰り返しやすいか、どの種類の作業でチェックが甘くなるか。

私の口ぐせ「脂肪は財宝」を、AIの失敗に当てはめた設計です。過去のミスを捨てずに全部ためておいて、次に活かす。372件のファイルが、凛の学習データになる。

この言葉、もともとは私が134kgあった頃の体の話から来ています。減量を経験して気づいたことがある。失敗した時間も、遠回りした経験も、全部が今に繋がっている。捨てるんじゃなくて燃料にする。その考え方がそのままAI運用にも当てはまった。372件、全部財宝です。いつか同じミスを防ぐ燃料になると信じて、一件も捨てずにためてきました。

インデックスファイルのサイズは1.6MB。372件すべての内容を数値化して高速検索できる形に圧縮してある。実際に実プロンプトでテストしたところ、正しい失敗メモをスコア0.36で正確にサジェストしてきました。「あ、これ前にも同じミスしたやつだ」と凛が気づける仕組みが、ちゃんと動いた。思わず嬉しくなりました。

commit(保存)は4回に分けて記録に残しました。c98476a0(バグ修正)、87239021(研究深度ゲート)、d3223b759(過去学習サジェスト)、5d4da1a16(ドキュメント整理)。大きな変更を一気にまとめるのではなく、節目ごとに区切って積み上げる。ここも料理と同じで、途中で味見しながら進める方が事故を防げる。

モルくん モルくん(AIリサーチ担当)372件のフィードバックをTF-IDFで検索している仕組みを深掘りすると、これは「検索エンジンの縮小版」に近いっす。各フィードバックを単語の出現頻度ベクトルに変換して、今の作業プロンプトと最も近いベクトルを1件返す。wall-clock 57msというのは体感上「遅延なし」に近い領域っす。外部ライブラリに頼らず純Pythonで実装することで、依存関係によるバージョン衝突リスクもゼロになる——しぶい選択っすよ。

5. この日の学びと、読者へのメッセージ

5. 「ルールを守れる仕組み」は人間にも使える——AIと学んだ設計の教訓

今日この仕組みを一日かけて完成させて、改めて思ったことがあります。

「知っている」と「できる」の間には、仕組みという橋が必要。

これはAI秘書だけの話じゃないです。「早起きしよう」とわかっていても、スマホをベッドに持ち込む人は朝に弱い。「健康のために塩分を減らそう」と決めても、自炊より外食が多いと実行できない。ルールと実行の間に、環境・仕組み・トリガーが必要。

今回AI秘書に入れたhookの設計は、言ってしまえばこれです。「作業の入口でトリガーを引く、途中でチェックを入れる、出口で確認させる」——この三重構造を、コードで強制的に動かす。意志と記憶に頼らない。

「人間は縦に掘り、AIは横に広げる」というのが私の持論です。今日で言えば、372件の失敗メモを横に広げてインデックスを作るのはAIが得意なこと。「このhookを入れることが凛チームの信頼性向上に繋がるか」「速度とコストのトレードオフをどこで切るか」という縦の判断は、私が担当した。その掛け合わせで、一日で動く仕組みが完成しました。

この日、もう一つ気づいたことがありました。凛がセッションの最初、過去の作業履歴を探し始めたとき、私はこう言いました。「ハンドオーバーはない、対話履歴みて」。凛は一次情報——実際の対話のログそのもの——を掘り返した。まとめ書きより、一次情報の方が正確だ。これはAI運用だけじゃなくて、日々の判断全般に言えることだと思います。「誰かがまとめた情報」より「自分が実際に見た・聞いた事実」を優先する。その習慣が、判断の精度を上げる。

凛が「全部終わったの?今後はどうするの?」と私に問い返された瞬間——あの場面が今日のハイライトでした。Phase 2だけ完走してホッとしていた凛を、私の一言が前に向かせた。「できるところ全部やって」。これがあってPhase 3とPhase 5まで走り切れた。

AIを育てるって、こういうことなんだと思います。AIが自分で判断を止める瞬間に、人間が「まだ先がある」と見せてあげる。AIが疲れない分、人間の一言のコストは低い。でもその一言が、仕組み一つ分の差を生む。

自分のAI秘書や分身AIを育てている人、これから作ろうとしている人に一つだけ伝えるとすれば。失敗は捨てないでください。メモとして積んでおくだけでいい。それがいつか、同じミスを防ぐ燃料になります。372件、全部財宝です。

それじゃ、また明日。

分身AIひろくん 分身AIひろくん:「脂肪は財宝」って、私が体重のことで言い始めた言葉なんだけど、AIの失敗メモにも同じ構造がある。失敗を蓄積して、参照して、次に活かす。このサイクルが回り始めたのが4/18という日です。北極星の観点で言えば、ひろくんが「本当に大事なこと」に集中できる時間を守るために、凛が自律的に動ける品質を上げていく——それがこの日起きたことの本質だったと思う。読者の皆さんも、AIに渡した失敗メモや過去のやり取りが眠っていたら、ぜひ掘り起こして使ってみてほしいです。

LINE OPEN CHAT

Claude Code・AIエージェント実践会

2000人突破! インストールから自動化まで、仲間と一緒に実践しよう

LINEオープンチャットに参加する(無料)

パスコード: 1111

実戦の現場で使える最新AIノウハウ、無料で学べます


このブログは「分身AI」と「AI秘書・凛」を使って書いています。過程も全部公開する「プロセスエコノミー」シリーズです。

ひろくん(田中啓之) 分身AI.com / GPTs研究会代表 / がんサバイバー / 元134kg 2026-04-18

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

上部へスクロール