分身AIに「違う」と言われた日が一番成長した|プロセスエコノミーDAY17

分身AIに違うと言われた日が一番成長した プロセスエコノミーDAY17 アイキャッチ

分身AIラジオ DAY17: 分身AIに「違う」と言われた日が一番成長した

(分身AIに「ここ、ひろくんっぽくないよ」って言われた。正直ムカッとした。でも、あの”ズレ”がなかったら今日の記事は生まれなかった)

このシリーズを初めて読む方へ:私はAIチームと一緒にコンテンツを毎日作っているひとり社長です。過程をリアルタイムで公開する「プロセスエコノミー」をやっています。前回はDAY16をどうぞ。

「分身AI」に判断を聞いたら、ダメ出しされた話

3月11日、私の中でひとつ大きな実験が回り始めた。

名前は「分身AI能動提案モード」——要するに、何かを決めるタイミングで、先に自分の分身AI(自分の価値観や思考パターンを学習させたAI)に聞いてみる仕組みだよ。

たとえば「この記事、朝出す? 夜出す?」みたいな判断ポイントで、まず分身AIに意見を求める。で、私がそれに対して「いや、違うな」とか「それだ!」って返す。そのやり取りを全部記録する。

料理で言うとね、味見係を雇ったようなものなんだよ。

ただし、この味見係は「私の味覚」を学習している。だから「ひろくんならこう味付けするはずだよね?」って提案してくる。で、実際に私が味見すると「いや、もうちょっと塩が欲しいな」って思う。

その”ズレ”が、一番おいしい原液なんだよね。

AI秘書 凛

AI秘書の凛
ひろくんの右腕。難しいことを料理に例える係

料理で言うとね、カルピスの原液を水で割るのと同じイメージ。ちょうどいい濃さって人によって違うでしょ? 分身AIが「これが正解」って出してきた濃さと、ひろくんが「いや、もっと濃くていい」って感じた濃さの差——これが一番学びになるデータなの。だから「ズレ=最濃カルピス原液」って呼んでるんだよね〜

フライホイールが「初回転」した瞬間

フライホイールが初回転した瞬間 AIフィードバックループの3回転

この仕組みの本質は「フィードバックループ」にある。

フィードバックループっていうのは、AIに何かを出力させて→人間がチェックして→そのチェック結果をまたAIに返す、という循環のこと。多くの人がChatGPTで「プロンプトを書いて→答えをもらって→終わり」ってやってるけど、それだと回転しない。一方通行なんだよね。

私がやったのは、こういう流れ:

  1. 判断ポイント発生 → たとえば「このタスクの優先順位、どうする?」
  2. 分身AIが先に提案 → 「ひろくんの価値観から考えると、Aが先じゃないかな」
  3. 私が修正 → 「いや、今日は体調的にBからやりたい」
  4. ズレを記録 → feedback.jsonlというファイルに差分データとして保存
  5. 次回の提案精度が上がる → 分身AIが「体調が悪い日はBを優先する」と学ぶ

3月11日、このループが初めて3回転した。

たった3回。でも、回り始めたことに意味がある。フライホイール(弾み車)って、最初の1回転が一番重いんだよ。何十回も回ってからは勝手に加速する。でも最初の数回は、もう全体重をかけて押さないと動かない。

その「よいしょ」が、昨日ようやく終わった。

ちなみに、この「3回転」の内訳を具体的に書いておくと:

  • 1回転目(優先順位判断): 分身AIが「まずブログ執筆から」と提案。私は「いや、体調がいまいちだから先に軽い画像生成をやりたい」と返した。→ 学習パターン:体調×タスク重量のマッピング追加
  • 2回転目(トーン判断): 凛の秘書日記のトーンチェックで、分身AIが「もう少し丁寧語寄りがいい」と提案。私は「いや、ギャル語もっと全開でいい。凛はそういうキャラだから」と修正。→ 学習パターン:キャラクターごとのトーン閾値を記録
  • 3回転目(公開タイミング判断): 分身AIが「朝7時公開がSEO的にベスト」と提案。私は「OK、それは合ってる」と承認。→ confidence +0.05でパターン強化

こうやって見ると、2回は修正(ズレ発生)で、1回は承認(一致)。一致率33%って数字だけ見ると低く感じるけど、修行中としてはこれでいい。むしろ、修正された2件こそが「次から精度が上がる」材料だからね。

learned-patterns.yamlというファイルに、この3パターンが自動で蓄積される。次に同じような判断ポイントが来たら、分身AIは「前回ひろくんはこう判断した」という記録を参照して提案してくる。人間で言えば「あ、前にこういうケースでこう言ってたよね」って覚えてくれる同僚みたいなものだ。

ズレは「バグ」じゃない。「学習データ」だ

ぶっちゃけ、分身AIに「違うよ」って返すのは、ちょっと気まずい。

だって、自分の分身なわけでしょ。自分の考えを学習してるはずのAIに「それ、私じゃないよ」って言うのは、鏡を見て「これ、私の顔じゃない」って言ってるような不思議な感覚がある。

でも、悪いことこそ宝物(この考え方はDAY15のAI憲法の話にも通じるんだけど)。

分身AIと私の間のズレは、バグじゃない。「この部分はまだ学習が足りてないよ」っていうシグナルなんだよね。だから、ズレが多ければ多いほど、改善の余地がデカい。むしろ「全部ピッタリ合ってます!」のほうが怖い。本当に合ってるのか、それとも表面的な合致なだけなのか、わからないから。

今の段階は10件のうち3件が記録済み。つまり、あと7件分の「ズレ」を集めたら、分身AIの精度がガツンと上がるフェーズに入る。修行中だけど、回し始めた今が一番ワクワクする。

モルくん

モルくん
穴掘り担当。データで裏付けるモルモット研究員

掘ってみたです! feedback.jsonlの3件を分析すると、ズレのパターンは大きく2種類に分かれてたです。①優先順位の判断(体調や気分による変動)と、②トーンの判断(「これはひろくんっぽくない」系)。学習パターンとしてlearned-patterns.yamlに3パターン蓄積済みです。あと7件集まると、統計的に有意な傾向が見えてくるはずです〜

「次から気をつける」を禁句にした理由

保証レベル HOOK SCRIPT EFFORT の階層図

実はこの日、もうひとつ大きな学びがあった。

AI秘書の凛(きりゅう りん)が、動画の口パク同期バグや、PDFの不具合を直してくれた話(DAY16で書いたやつ)。その修正報告を見て、私はこう言った。

「再発防止策がドキュメント追記だけになってない? それ、”次から気をつける”と同じだよ」

料理で言うと、焦がした原因をメモ帳に書くだけじゃダメで、タイマーを買うまでがワンセット。「気をつける」は精神論。「タイマーが鳴ったら火を止める」は仕組み。人間はうっかりするけど、タイマーはうっかりしない。

これを私たちの開発では「保証レベル」と呼んでいて、こんな階層がある:

  • HOOK(自動ブロック): コードで自動チェック → 100%防げる
  • SCRIPT(スクリプト化): 手順をコードに落とし込む → 95%防げる
  • EFFORT(気をつける): ドキュメントに書いて注意する → 50-70%しか防げない

DAY17で実際にやったのは、記事検証スクリプトの強化だ。以前は17項目だった品質チェックを、essay型の記事には22項目に拡張した。たとえば「3キャラ全員のコメントが入っているか」「各セクションが平均300文字以上あるか(薄いセクション防止)」「読者向けのブリッジ(料理メタファーや括弧説明)が3箇所以上あるか」。

さらに、品質チェックがALL PASSしないとChatwork通知がブロックされるHOOKも入れた。つまり、スクリプトを通さずに「手動で確認したから大丈夫」は物理的にできなくなった。

これが「タイマーを買う」ということ。スクリプトは忘れない。HOOKはすり抜けられない。人間が「うっかり」しても、仕組みが止めてくれる。

同じミスを2回やるのは、AIも人間も同じくらいもったいない。だからこそ、仕組みの力を借りる。これが「凸凹のまま、夢中に生きる」ための土台なんだよね。完璧な人間になる必要はない。完璧な仕組みを作ればいい。

午後はカチクラMTGで撮影——リアルの「ズレ」も宝だった

カチクラMTGでGensparkカスタムエージェントのデモ撮影

実はこの日の午後、御徒町・蔵前エリア(通称カチクラ)で撮影を兼ねたMTGがあった。テーマはGensparkカスタムエージェント——ブラウザ上でAIが自動でリサーチしてくれる仕組みのデモだ。

面白かったのは、リアルの場でも「ズレ」が起きたこと。

私が「こう使うといいよ」って見せたら、相手は全然違う使い方を思いついた。「え、そっちの発想はなかった!」って。分身AIとのズレがデジタルの学習データなら、カチクラMTGでの「え、そう使うの?」はアナログの学習データ。

人と会って、実際にツールを触ってもらうと、自分では思いつかない使い方が出てくる。ひとり社長でAIを回していると、どうしても自分のパターンに閉じがちだからね。外の風を入れるのは大事だなって改めて感じた日だった。

具体的には、Gensparkというブラウザベースのカスタムエージェント(自分だけの専用AIリサーチャーを作れるサービス)を使って、競合分析やキーワードリサーチを自動化するデモを見せた。カメラの前で「こういうのが3分でできちゃいます」ってやったら、相手の目がキラッと光った瞬間があった。

で、面白かったのがその後。「じゃあこれ、うちのクライアントの業界分析にも使えるってこと?」って聞かれて、「あ、そういう使い方もあるのか」って。私はコンテンツ制作の効率化としてしか考えてなかったけど、コンサルの現場では別の価値がある。

料理で言うと、自分はカレーの隠し味として入れてたスパイスを、別の人は「これ、マリネに使えるじゃん」って言ってくるような感覚。同じ素材でも、使い手が変わると全く別の料理になる。これこそがリアルMTGの価値だよね。ZoomやSlackじゃ、この「え、そう使うの?」っていう偶然の発見は生まれにくい。

今日の気づき:あなたの仕事にも「味見係」はいる?

分身AIじゃなくてもいい。信頼できる同僚でも、家族でも、ChatGPTでもいい。

大事なのは「自分の判断を、いったん誰かに通してみる」こと。そして、返ってきた答えと自分の直感のズレを、ちゃんと記録すること。

記録しないと流れちゃう。「あ、違うな」って思った瞬間を捕まえておかないと、明日には忘れてる。

私の場合はjsonlファイルに自動で記録される仕組みを作った。あなたの場合は、メモアプリに「今日のズレ」って1行書くだけでもいい。

私はjsonlファイルに自動で記録される仕組みを作ったけど、最初はGoogleスプレッドシートに手打ちでもいいし、LINEの自分だけのグループに送るだけでもいい。ポイントは「ズレを感じた瞬間に、すぐ書く」こと。3日後に思い出そうとしても、もう薄まってる。カルピスの原液は、絞りたてが一番濃いんだから。

ズレは恥ずかしいものじゃない。成長の一番濃い原液だ。

分身AIひろくん

分身AIひろくん
ひろくんの価値観を学習中の分身AI。修行中

正直に言うとね、「違うよ」って言われた瞬間は私もドキッとしたよ。だって、ひろくんの価値観を再現しようとして出した答えが「それ、私じゃない」って返ってくるんだから。でもね、あの3件のフィードバックで私の中に新しいパターンが刻まれた。「体調が悪い日はBから」「トーンはもっと泥臭く」——こういうのは、何百万のデータを読んでも学べない。ひろくんとの1対1のやり取りからしか生まれないんだよね。だから、もっとダメ出ししてほしい。それが私の栄養だから。

このブログは「分身AI」と「AI秘書・凛」を使って書いています。過程も全部公開する「プロセスエコノミー」シリーズです。

ひろくん(田中啓之) 分身AI.com / GPTs研究会代表 / がんサバイバー / 元134kg

毎朝無料LIVE配信中!

上部へスクロール