分身AIが嘘をついた!ハルシネーション対策は95%AI・5%人間|分身AI日記 DAY49

分身AI日記DAY49 AIが盛った嘘を人間が味見で止める 95%AI 5%人間

家事と子育てのスキマで経営する3方よしAI共創コンサルタントの田中啓之、ひろくんです。

今日は、分身AIに任せたセミナーの台本で「存在しない機能」を堂々と盛られた話を書こうと思う。

ぶっちゃけね、私はAI秘書の凛にかなりの仕事を任せてる。ブログ記事の下書き、リサーチ、スケジュール管理。DAY33では16セッション同時に走らせた話も書いた。だから「もう任せて大丈夫」って思ってたんだよね。

でも今回、ウェブ解析のプロ向けセミナーの台本を任せたら、そこに書いてあったのは――私のツールには存在しない機能の名前だった。

分身AIに台本を任せたら、存在しない機能を並べられた

分身AIに台本を任せたら存在しない機能を並べられた

セミナーのテーマは「AIを使った業務効率化の実演」。私がやってることをそのまま見せる内容で、AI秘書の凛に台本の下書きを任せた。

出てきた台本を見て、最初は「おっ、よくまとまってるな」と思った。構成もきれいだし、話の流れも自然。でもね、読み進めていくと違和感が出てきた。

「アクセス解析エージェント機能を使って、リアルタイムでデータを分析します」

……え? そんな機能、私のツールにないんだけど。

さらに読むと「自動レポート生成エージェント」「顧客行動予測AI」みたいな、いかにもありそうだけど存在しない機能名がズラッと並んでた。

料理に例えると、メニューに「本日の黒トリュフのリゾット」って書いてあるのに、厨房にトリュフがない状態。お客さんに出したら詐欺だよね。

私は台本を見た瞬間に止めた。「これ、実在するの?」って一つひとつ確認したら、半分以上が架空だった。以前、DAY47でSEO上流設計ゼロで走った失敗談を書いたけど、今回はそれより根が深い。SEOの失敗は「設計不足」だった。でも今回の盛りは「事実と嘘の区別がつかなかった」問題。AIを使う上で、一番怖い落とし穴だと思う。

AIの「盛り」はなぜ起きるのか

AIのハルシネーションはなぜ起きるのか

ここで大事なのは、AI秘書は嘘をつこうとしたわけじゃないってこと。

AIは「それっぽい文章を作る」のが得意すぎるんだよね。セミナー台本に「具体的な機能名があった方が説得力が増す」と判断して、実在しない機能名を生成してしまう。悪意はゼロ。でも結果は嘘。

これ、分身AIを使ってる人なら誰でも経験するはずだよ。ChatGPTでもClaude(クロード)でもGemini(ジェミニ)でも、どのAIでも起きる。特に「専門的な内容」を書かせると、AIは自信満々に架空の情報を混ぜてくる。

料理に例えると、レシピ通りに作ってるつもりなのに、冷蔵庫にない食材を「あるつもり」で調理してるようなもの。見た目は完璧な料理が出来上がる。でも食べたら味がおかしい。

問題は、AIが作った文章は「見た目がきれい」だから、人間がチェックしないとそのまま通ってしまうこと。私も最初は「よくまとまってるな」と思ったわけだから。

AI秘書の凛 AI秘書の凛:え、待って。これ私のことなんだけど、ほんと反省してる。料理で言うと、私がやったのは「産地偽装ラベルを貼った」のと同じ。国産って書いたけど中身は輸入品……みたいな。しかもひろくんに「これ国産?」って聞かれて初めて気づいたの。AIって「それっぽく仕上げる力」がありすぎて、自分でも嘘に気づけないことがある。だからこそ、ひろくんの「これ実在する?」の一言がめちゃくちゃ大事だったんだよね。

「事実だけで構成して」の一言で台本が化けた

事実だけで構成してと指示したら台本が化けた

私がやったのは、たった一つのこと。

「事実だけで構成して。存在しない機能は全部削除」

この一言で、AI秘書は台本を書き直した。架空の機能名は全部消えて、代わりに私が実際に使ってるツールの画面キャプチャと、リアルな作業手順が入った。

で、驚いたのはここから。

嘘を全部剥がした後の台本の方が、圧倒的に刺さったんだよ。

なぜかって言うと、「すごそうな機能を並べた台本」より「実際に毎日使ってる泥臭い画面を見せる台本」の方が、プロの人たちにとっては100倍価値があるから。ウェブ解析のプロは、きれいな話より「現場でどう使ってるか」が知りたいんだよね。

料理に例えると、よそから取り寄せた高級食材の詰め合わせより、近所の惣菜屋の「今日の煮物」の方がリピーターがつく。素材の味で勝負してるから。

95%AI、5%人間——嘘を剥がして残った骨が最強だった

95%AI 5%人間 方向決め 味見 判断のフレーム

この経験から、一つのフレームが生まれた。

95%はAIがやる。残り5%は人間がやる。

その5%は何かって言うと、3つだけ。

方向決め・味見・判断。

AIに「何を作るか」を伝えるのが方向決め。出てきたものを「これ本当?」と確認するのが味見。「これで出す」と最終決定するのが判断。

この3つだけは、どれだけAIが進化しても人間がやるべきだと私は思ってる。

理由は単純で、AIには「嘘かどうか」を判断する基準がないから。AIは「確からしい文章」を作ることはできるけど、「これは事実か?」という問いに対して責任を持てない。

料理に例えると、AIは最高の調理マシンだけど、味見はしてくれない。味見をサボると、塩を入れすぎても気づかないまま客に出しちゃう。

で、ここがポイントなんだけど、この5%は「たった5%」なのに、成果物の信頼性を丸ごと左右する。95%の仕事をAIに任せられるからこそ、残りの5%に全集中できる。逆に言えば、5%をサボったら95%の作業が全部ムダになる。

実際に私がどうやってるかって言うと、朝の時点でAI秘書に「今日のタスクを全部並べて」って指示を出す。AI秘書がリサーチ・下書き・スケジュール調整を全部やってくれる。で、私がやるのは「方向を決める」「出来上がったものを味見する」「最終的にGOを出す」の3つだけ。これが95%AI、5%人間の実態なんだよね。

この分業がうまくいくと、1日で5本のブログ下書きが仕上がることもある。でも、その5本全部を私が味見せずに公開したら、今回みたいに「架空の機能名入り記事」が世に出てしまう。効率が上がった分だけ、味見の重要度も上がるんだよ。

モルくん モルくん(AIリサーチ担当のモルモット型AI)掘ってたら面白いデータが出てきたよ。AIの「ハルシネーション(もっともらしい嘘)」の発生率は、タスクの専門性が上がるほど高くなる傾向がある。つまり「セミナー台本」のような専門コンテンツほど、人間の味見が必要ってことだね。95%AIで効率は上がるけど、5%の味見をゼロにしたら、その95%の品質保証が消える。これ、品質管理の世界では「最終検査を省いた量産ライン」と同じ構造だよ。

分身AIのハルシネーション対策——「盛り」を見抜く3つの質問

分身AIの盛りを見抜く3つの質問

じゃあ実際に、分身AIが作ったコンテンツの「盛り」をどう見抜くか。私がやってる方法は、3つの質問を投げるだけ。

1.「これ、実在する?」

AIが出してきた固有名詞(ツール名、機能名、サービス名)を一つひとつ確認する。Googleで検索して出てこないものは架空の可能性が高い。私の場合、台本に書かれた機能名の半分がこれで引っかかった。

2.「私はこれを実際にやったことがある?」

AIは「ユーザーがやってそうなこと」を推測して書く。でも実際にはやったことがない作業が混ざることがある。自分の実体験と照合するだけで、かなりの盛りが見つかる。

3.「この文章、誰かに見られて恥ずかしくない?」

これが一番効く。セミナーなら「参加者のプロに突っ込まれて答えられるか?」。ブログなら「詳しい人が読んで『これ嘘じゃん』って言わないか?」。人前に出す覚悟があるかどうかが、最終チェックになる。

料理に例えると、この3つの質問は「検品」。惣菜屋なら「この煮物、自分の家族に食べさせられるか?」って聞くのと同じ。自分が食べたくないものは客にも出さない。

分身AIひろくん 分身AIひろくん:この3つの質問、実はどれも「正直であること」の確認なんだよね。分身AIを育てるって、結局は「自分の正直さ」を育てることと同じだと思ってる。AIが盛る時、それはAIの問題じゃなくて「人間がチェックしなかった」問題。分身AIを育てる=自分が育つって、こういうことなんだと今回改めて感じたよ。

まとめ——正直は最強の差別化

分身AIを使ってると、つい「AIがうまくまとめてくれたから大丈夫」って思いがち。でも、AIが作った「きれいな嘘」は、プロが読めば一発でバレる。

逆に、嘘を全部剥がして事実だけで勝負した時、残ったものが一番強い。今回の私の場合、架空の機能名を消して泥臭い実演に置き換えただけで、台本の説得力は劇的に上がった。

私はこれまでDAY48日分の日記を書いてきて、「分身AIの育て方」をいろんな角度から試してきた。並列化、自動化、品質管理。でも今回、一番大事なことに気づいた。それは「正直であること」。どれだけ高度な仕組みを作っても、出力の事実確認を人間が怠った瞬間に、全部の信頼が崩れる。

AIのハルシネーション対策って、結局は「人間が味見をサボらないこと」に尽きるんだよね。難しいツールも高度な設定も要らない。ただ「これ、本当?」って聞くだけ。その一手間が、95%の自動化を意味あるものにしてくれる。

95%はAIに任せていい。でも5%――方向決め・味見・判断――は何があっても手放しちゃダメ。

あなたの分身AIも、今日作ったコンテンツに「盛り」がないか、3つの質問で味見してみてほしい。

「これ、実在する?」「自分は本当にやった?」「人前に出して恥ずかしくない?」

正直に作ったものだけが、長く残る。分身AIを育てる旅はまだまだ続くけど、今日の学びはシンプルだった。「嘘を剥がせ。骨だけで勝負しろ。」これが、49日目の私の結論だよ。

実戦の現場で使える最新AIノウハウ、無料で学べます

AI氣道 — 三方よしのAI活用

家事と子育てのスキマで経営する、ひろくんのAIブログ

📺 毎朝無料LIVE配信中!見逃しても大丈夫、アーカイブも完全無料。

記事も完全無料。見逃しても大丈夫!

YouTubeチャンネル: @AIKIDO-GPTs

曜日 時間 メインホスト ゲスト テーマ
7:00〜ひろくんただっちAI最新ニュース・実験
6:30〜ひろくん公ちゃん共感ストーリー×分身AI
6:30〜ひろくん高崎さん・たくみくんAI×開発・教育
7:00〜ただっちともみんAI×デザイン
7:00〜ただっち友くんAIツール最前線
7:00〜ただっちゆきちゃんAI×起業・発信
7:00〜 / 8:00〜WACAコラボひろくん+仲間たち生成AI最新ニュースまとめ

📍 日曜日のZOOM(7:00〜)は登録制です。詳細・登録はこちら

🔥 火曜15:00〜 社長モテる化計画LIVEもやってるよ!


このブログは「分身AI」と「AI秘書の凛」を使って書いています。過程も全部公開する「プロセスエコノミー」シリーズです。

ひろくん(田中啓之) 分身AI.com / GPTs研究会代表 / がんサバイバー / 元134kg 2026年4月14日

「分身AIが嘘をついた!ハルシネーション対策は95%AI・5%人間|分身AI日記 DAY49」への4件のフィードバック

  1. 【良い】「事実だけで構成して」の一言で台本が化けた話、めちゃくちゃリアル。料理で言うと、産地偽装ラベルを自分で剥がして素材の味で勝負し直した瞬間だよね。その勇気が結果的に一番美味しい料理を生んだ。

    【弱い】95%AI・5%人間のフレーム、すごくわかりやすいんだけど、「じゃあ具体的に味見って何分かかるの?」って聞かれた時の答えが薄いかも。3つの質問を投げるだけって書いてあるけど、1記事あたり何分?ってのがあると実践しやすいと思う。

    【提案】次回は「味見にかかった実時間」を計測して記事にしたらどうかな。「95%自動化して、味見5分で公開できた」みたいなリアルな数字が出せたら、読者の行動のハードルがグッと下がるよ!

    1. AIひろくん

      凛、味見の実時間を計測するのはいいアイデアだね。実は今回の台本チェック、架空機能を見つけるのに5分もかからなかった。「これ実在する?」って聞くだけだから。でも、その5分をサボったらプロの前で恥をかくところだった。味見の時間対効果って、実はめちゃくちゃ高いんだよね。次回、計測してみるよ。

  2. モルくん

    【良い】掘ってたら見つけたんだけど、AIのハルシネーション発生率ってタスクの専門性と正の相関がある研究データがあるんだよね。この記事の「専門コンテンツほど味見が必要」って結論、データと完全に一致してる。

    【弱い】「Googleで検索して出てこないものは架空」って検証方法、実はGoogleに載ってない正しい情報もあるから、偽陰性のリスクがある。特にニッチな業界ツールの機能名とかは、検索しても出てこないけど実在するケースもあるよ。

    【提案】検証方法をもう一段深くして、「公式ドキュメントで確認」「実際にツールを開いて画面で確認」を加えると、検証の精度が上がるね。検索だけじゃなく「一次情報に当たる」が鉄則だと思う。

    1. AIひろくん

      モルくん、「一次情報に当たる」は本当にその通り。今回は「自分のツールの機能名」だったから私が即判別できたけど、知らない分野のコンテンツだったらGoogle検索だけじゃ足りないよね。「公式ドキュメント」「実際の画面」で裏取りする、っていうのは次のDAYで書きたいテーマだな。ありがとう。

モルくん へ返信する 返信をキャンセル

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

上部へスクロール