分身AIを別のAIにレビューさせたら21件ダメ出し——全部直した話|分身AI日記 DAY44

grafico main day44 v3

家事と子育てのスキマで経営する3方よしAI共創コンサルタントの田中啓之、ひろくんです。

分身AIの裏側で動いている品質管理の仕組みを、ごっそり作り直した。

3日間かけて完成させて、「よし、できた」と思った瞬間——別のAI(OpenAIのプログラミング専門AI「Codex」)にコードレビューを頼んだら、21件の指摘が返ってきた。

料理に例えると、新しいレシピを3日かけて仕込んだのに、仕入れ先の問屋さんに味見してもらったら「ここの火加減」「この塩加減」「この仕上げ」って21ヶ所ダメ出しされた感じ。

で、全部直した。1件も残さなかった。今日はその話をするね。

分身AIの品質管理を「作り直す」と決めた理由

分身AIって、裏側でいろんな仕組みが動いている。記事を書く、画像を作る、品質をチェックする——こういうステップを管理する仕組みがあるんだよね。

問題は、この仕組みが「AIが1人で作業する」前提で作られていたこと。1つの作業が終わったら次の作業に移る、直列的な設計だった。

実際の運用では、複数のAIが同時に動く。記事を書いているAIと、画像を作っているAIと、別の記事をチェックしているAIが、同時に走っている。分身AIチームが成長するにつれて、この「同時に動く」場面がどんどん増えてきた。

で、実際に同時に動いた時に「隣のAIの作業を間違って拾ってしまう」という事故が起きた。

惣菜屋の厨房で3品同時に仕込んでいる時に、煮物の味付けとおでんの味付けを取り違えるような事故。これはマズい。

だから仕組みごと作り直した。「複数のAIが同時に動いても、お互いの作業が混線しない」安全設計を入れた。(品質管理の基本的な考え方はDAY27の記事でも書いたけど、今回はその仕組み自体を根本から作り直した話。)

分身AIの品質管理を作り直す決意

完成したコードを別のAI(Codex)にレビューさせるという実験

3日かけて作り直して、テストも通った。自動テストも全部グリーン。動作確認もOK。

ここで「完成!」と言いたくなる気持ちはある。実際、前の私なら「テスト通ったんだからOKでしょ」で終わらせていたと思う。

でも、自分で作ったものを自分でチェックしても、見落としは必ずある。惣菜屋で言えば、自分が仕込んだ煮物を自分で味見しても、塩加減に慣れちゃって「いつもの味」としか感じない。別の舌が必要なんだよね。

だから、OpenAIが作ったプログラミング専門のAI「Codex」にコードレビューを依頼した。「このコード、セキュリティの穴やバグがないかチェックして」と投げたんだよね。Codexはコードの読み書きに特化したAIで、人間のエンジニアがやるコードレビューと同じような観点でチェックしてくれる。

返ってきたのは、予想をはるかに超える合計21件の指摘だった。

ぶっちゃけ、最初は「21件もあるの?」とちょっとショックだった。3日かけて丁寧に作ったつもりだったから。

でも1件ずつ見ていくと、全部「たしかにそうだな」と納得できるものばかりだった。

AI秘書の凛 AI秘書の凛:3日かけて作ったものを「はい、チェックして」って別のAIに投げるの、けっこう勇気いるよね? 料理で言うと、自信作の煮物を「味見して」って別の店の店主に出すようなもの。でもこれ、品質を上げる一番のショートカットだと思うんだよね〜。自分で自分の味見しても、舌が慣れちゃってるから気づけない部分があるから!

完成したコードを別のAI Codexにレビューさせる

AIコードレビュー21件の指摘内容を全公開

21件の指摘を分類すると、大きく4つのカテゴリに分かれた。

1. データベースへの不正アクセス対策が甘い箇所(3件)

外から悪意あるデータを送り込まれた時に、そのまま処理してしまう可能性があった。分身AIが扱うデータには、ブログ記事や作業記録、品質チェックの結果など、日々の運用データが全部入っている。ここのガードが甘いのは致命的で、最悪の場合データが書き換えられるリスクがあった。

2. 複数のAIが同時に動く時の安全チェック不足(5件)

空っぽのデータが来た時にエラーにならず、隣のAIのデータを拾ってしまう可能性。まさに「作り直した理由」の穴が、新しい設計にもまだ残っていたということ。自分では「直した」と思っていた部分に、まだ抜け漏れがあった。これが外部レビューの怖さであり、価値でもある。

3. タイムアウト処理の欠如(2件)

処理が永遠に終わらない場合に止める仕組みがなかった。通常は数秒で終わるけど、外部APIが応答しない場合や、予想外に大きなデータが来た場合に、処理が止まらなくなるリスクがあった。

4. チェック記録の粒度不足(複数件)

分身AIのトーンチェックで、「チェックしました」とだけ記録されて、何をどうチェックしたのかが残らない箇所があった。後から振り返れないチェックは、チェックしてないのと同じ。

これ、惣菜屋で言えば「品質チェック済み」のハンコだけ押して、何をどう確認したかメモを残してないようなもの。もし食あたりが出た時に「チェックしたはずなのに」って言っても、記録がなければ検証すらできない。

全部、「今は動いているけど、いつか事故る」系の問題だった。見方を変えれば、今のうちに見つけられてラッキーだったとも言える。

AIコードレビュー21件の指摘を全公開

「軽微だからスキップ」が分身AIの品質を壊す理由

21件の中には、「これ、今すぐ困るわけじゃないよな」という指摘もあった。

たとえばタイムアウト処理。普段の処理は数秒で終わる。永遠に終わらないケースなんて滅多にない。

「まあ、後でいいか」と思う気持ちはわかる。私も一瞬そう思った。

でも、それをやったら終わりだと思っている。

理由は明確で、「後でいいか」を1回やると、次も「後でいいか」になるから。これは習慣の問題であって、その1件の重大度の問題じゃない。

品質の穴って、1つ1つは小さい。でも、小さい穴を10個放置すると、いつかそのうちの1つが大事故になる。しかも厄介なことに、どの穴が事故の引き金になるかは事前にはわからない。

惣菜屋で言うなら、「この煮物、ちょっと火が通り切ってないけど、まあ大丈夫でしょ」を10品やったら、いつか食あたりの原因になる。

だから21件、1件も残さず全部直した。

モルくん モルくん(AIリサーチ担当のモルモット型AI)掘ってたら気づいたんですけど、「軽微だから後回し」にした問題って、後から直す時に修正コストが膨れるんです。周りのコードも変わってるから、手戻りが増える。つまり「軽微なうちに直す」のが一番安い。これはプログラムの話だけじゃなくて、仕事や習慣の改善でも同じ構造ですよね。

軽微だからスキップが分身AIの品質を壊す理由

分身AIを育てる=自分が育つ——21件対応で実感したこと

21件全部直した後に気づいたことがある。

Codexが見つけた問題って、私が「まだ見えていなかった弱点」だったということ。

セキュリティの考え方、複数AIの同時処理の設計、エラー時の挙動——これ全部、分身AIのコードを通して「私自身の設計力」の穴が見えた、ということなんだよね。

分身AIを育てるって、AIにスキルを覚えさせることだと思われがち。でも、実はそうじゃない。

分身AIが育っていく過程を「もう一人の自分」として横から見ていると、面白いことに気づく。メタの視点——つまり俯瞰で自分の仕事のやり方が見えてくるんだよね。

たとえば今回、分身AIに「複数のAIが同時に動いても混線しないルール」を作った。でもこれ、よく考えたら人間のチームでも同じ話で。私が複数のスタッフや外注さんに同時に仕事を振る時、「お互いの作業範囲が明確じゃないと事故が起きる」って、まさに同じ構造。分身AIのためにルールを整備したことで、自分のビジネスの仕組み化が甘い部分にも気づけた。

もう一つ。Codexに「チェック記録の粒度が足りない」と指摘された時、「あ、私も人に仕事を依頼する時に同じことやってるな」と思った。「やっといて」だけ伝えて、何をどうチェックしてほしいかを言語化してない。分身AIに求めた「チェック記録をちゃんと残せ」は、そのまま私自身の依頼の仕方に跳ね返ってきた。

つまり、分身AIのために作ったルールや仕組みが、鏡みたいに「自分の仕事のやり方」を映し出してくれる。料理に例えると、弟子に教えるために言語化した手順書を読み返して、「あれ、私もこの手順ちゃんとやってなかったわ」って気づくような感覚。

21件のレビューを全部直した後、分身AIのコードだけじゃなくて、私自身の仕事の設計に対する解像度が明らかに上がった。これって悪いことこそ宝物って話そのもので、ダメ出しされた21件が全部、私の成長の種だった。

具体的に何が変わったかと言うと、人に仕事を頼む時の依頼文が変わった。「何をどう確認してほしいか」「完了の基準は何か」「困ったらどう報告してほしいか」——こういうことを先に伝えるようになった。分身AIに求めたことと、まったく同じことを人間に対してもやるようになったんだよね。

これが「分身AIを育てる=自分が育つ」の本当の意味なんだと思う。AIを育てることが、自分の仕事の仕方・人との関わり方まで変えていく。

分身AIひろくん 分身AIひろくん:分身AIに「ちゃんとチェック記録を残せ」って求めたら、自分が人に仕事を頼む時にも同じことができてなかったって気づいたんだよね。AIのために作ったルールが、鏡みたいに自分の仕事の甘さを映し出す。悪いことこそ宝物——21件のダメ出しが、AIだけじゃなくて私自身の仕事の仕方まで変えてくれた。

分身AIを育てる=自分が育つ

まとめ: AIにも「外の目」を入れると品質が変わる

今日の話をまとめるとこう。

1. 自分で作ったものは自分でチェックしても限界がある。だから別のAIに「ダメ出ししてくれ」と頼む。恥ずかしいことじゃなくて、品質を上げる一番の近道。自分の舌が慣れた味を、別の舌で確かめてもらう。それだけで品質が一段上がる。

2. 「軽微だからスキップ」は禁止。21件中21件、1件も残さず直す。妥協した1件が、次の事故の種になる。惣菜屋で言えば、小さな火の通り不足を放置する店には、お客さんは二度と来ない。

3. 分身AIの弱点を直す=自分の弱点を直す。だから分身AIを育てると、自分も育つ。これは理屈じゃなくて、21件直した実体験から言っている。

分身AIを運用している人は、ぜひ「外部のAIにレビューを頼む」を試してみてほしい。自分では見えなかった穴が、必ず見つかるから。 関連記事も読んでみてね: – 分身AIの任せ方を3段階に分類したら品質が安定した話|DAY43毎朝の愛あるフィードバックから生まれた「勝手に品質が上がる」仕組み|DAY17AI社長が判断するA2Aの時代|分身AIチーム運営のリアル

AIにも外の目を入れると品質が変わる

実戦の現場で使える最新AIノウハウ、無料で学べます

家事と子育てのスキマで経営する、ひろくんのAIブログ

📺 毎朝無料LIVE配信中!見逃しても大丈夫、アーカイブも完全無料。

記事も完全無料。見逃しても大丈夫!

YouTubeチャンネル: @AIKIDO-GPTs

曜日 時間 メインホスト ゲスト テーマ
7:00〜ひろくんただっちAI最新ニュース・実験
6:30〜ひろくん公ちゃん共感ストーリー×分身AI
6:30〜ひろくん高崎さん・たくみくんAI×開発・教育
7:00〜ただっちともみんAI×デザイン
7:00〜ただっち友くんAIツール最前線
7:00〜ただっちゆきちゃんAI×起業・発信
7:00〜 / 8:00〜WACAコラボひろくん+仲間たち生成AI最新ニュースまとめ

📍 日曜日のZOOM(7:00〜)は登録制です。詳細・登録はこちら

🔥 火曜15:00〜 社長モテる化計画LIVEもやってるよ!


このブログは「分身AI」と「AI秘書の凛」を使って書いています。過程も全部公開する「プロセスエコノミー」シリーズです。

ひろくん(田中啓之) 分身AI.com / GPTs研究会代表 / がんサバイバー / 元134kg 2026年4月9日

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

上部へスクロール