AIが「AI共創」を読めなかった日――発音辞書で分身AIを育てる話｜分身AI日記 DAY45

家事と子育てのスキマで経営する3方よしAI共創コンサルタントの田中啓之、ひろくんです。

今日、分身AIのラジオ動画を再生して耳を疑った。冒頭の自己紹介で「3方よしAI共創コンサルタント」と名乗るはずが、音声AIの口から出てきたのは「あいきょうそうコンサルタント」。

……え、誰？

料理に例えると、新しく入ったスタッフに「おすすめの肉じゃがです」と言ってもらうはずが、「おすすめのにくじゃぎゃです」って言っちゃった感じ。お客さんの前で。レシピの書き方が悪かったんだよね。

今日はこの「発音事故」の原因をとことん追いかけて、仕組みで解決するまでの全記録。

ラジオ動画で「あいきょうそう」と聞こえた瞬間

分身AIのラジオ動画は、私が台本を書いて、音声AI（テキストを人の声に変換してくれるツール）が読み上げて、アバターAI（人の映像を自動生成してくれるツール）が口の動きに合わせて映像を作る——という流れで作っている。

台本には「3方よしAI共創コンサルタントの田中啓之です」と書いてある。正しく読めば「エーアイキョウソウコンサルタント」。でも音声AIは「AI」をアルファベットとして読まず、日本語の「あい」と解釈してしまった。

結果、「あいきょうそうコンサルタント」。存在しない肩書きの誕生だった。自分で作った分身AIが、自分の自己紹介を間違える。なかなかシュールな光景だよね。

ぶっちゃけ、最初に聞いた時は笑ってしまった。でも、公開する動画でこれが流れたら笑えない。私の自己紹介を、私の分身AIが間違える——これは信頼に関わる問題なんだよね。

犯人を追う——なぜ今回だけ読み間違えたのか

原因を探るために、まず音声AIの設定を確認した。でも、設定は前回うまくいった時と全く同じ。ボイスも同じ、言語設定も日本語のまま。

じゃあ一体何が違ったのか？

犯人は「台本の作り方」だった。

ラジオ動画の台本は、作業手順書（AIが台本を生成する時の設計図）のテンプレートから作られる。このテンプレートに書かれた冒頭文を元に、AIが台本を生成する仕組みになっている。

問題は、このテンプレートに「読み仮名」が入っていなかったこと。

「3方よしAI共創コンサルタント」とだけ書いてあって、「AI共創」をどう読むかの指示がなかった。人間なら「AI」は「エーアイ」だとわかる。でも音声AIにとって、前後の日本語に挟まれた「AI」は「あい」と解釈する余地がある。

惣菜屋の厨房で例えると、レシピに「大さじ1の醤油」と書くべきところを「醤油を入れる」としか書いてなかった。ベテランなら「大さじ1だな」とわかるけど、新人にはわからない。結果、入れすぎたり入れなさすぎたりする。

テンプレートの「書き方の粗さ」が、音声AIの読み間違いを引き起こしていたんだよね。

AI秘書の凛：これさ、めちゃくちゃ「レシピあるある」じゃない？料理で言うと、「塩少々」って書いてあるレシピ。ベテランは感覚でわかるけど、新人スタッフには「小さじ1/4」って明記しないと味がブレるのよ。テンプレートに読み仮名を入れるって、まさに「小さじ1/4」って書くのと同じことで——仕組みが曖昧だと、誰がやっても同じ結果にならないんだよね〜。地味だけどここが品質の分かれ目！

過去の成功動画と比べたら「答え」が見えた

ここで面白い発見があった。過去に作ったラジオ動画では、「AI共創」が正しく「エーアイキョウソウ」と発音されていたこと。

何が違ったのか、台本を比べてみた。

うまくいった回の台本には、「三方よし（さんぽうよし）AI共創（きょうそう）コンサルタント」と、括弧で読み仮名が入っていた。音声AIはこの括弧を「読みのヒント」として認識して、正しく発音してくれていたんだよね。

つまり、うまくいった回は、台本を生成したAIが「この漢字は読みにくいかもしれない」と気を利かせて、わざわざ読み仮名を追加してくれていた。今回は、たまたまそれをしてくれなかった。

これが問題の本質だった。「AIが気を利かせるかどうか」という、再現性のない要素に品質が依存していた。ちなみに、DAY44で書いた「別のAIにレビューさせたら21件ダメ出し」の話も、根っこは同じ。品質が属人的な努力に依存している限り、必ずブレは避けられない。

惣菜屋の煮物の味が「今日のパートさんの勘」で決まるようなもの。うまい日もあるけど、ブレる日もある。それは仕組みの問題であって、パートさんの問題じゃない。DAY27で品質管理の仕組みを作った時にも感じたけど、「気をつける」は仕組みじゃない。

「発音辞書」を作って二度と起きない仕組みにした

だから「発音辞書」——正式には読み方辞書と呼んでいる仕組みを作った。

具体的には、「この単語はこう読む」というルールを辞書ファイルに登録しておく仕組み。台本を音声AIに渡す前に、辞書に登録された単語を自動的にカタカナの読みに変換してくれる。これで、台本を生成するAIが読み仮名を入れ忘れても、辞書が自動でカバーしてくれる。

今回追加したのはこんなルール:

「AI共創」→「エーアイキョウソウ」
「三方よしAI共創コンサルタント」→「サンポウヨシエーアイキョウソウコンサルタント」

さらに、作業手順書のテンプレート自体にも読み仮名を追加した。テンプレートの段階で「三方よし（さんぽうよし）AI共創（きょうそう）コンサルタント」と書いてあれば、そこから生成される台本にも必ず読み仮名が入る。

2段構えの対策。辞書による自動変換と、テンプレートへの読み仮名追加。どちらか片方が漏れても、もう片方がカバーしてくれる。

修正後に台本を再生成して音声AIに読ませてみたら、ちゃんと「エーアイキョウソウ」と発音された。音声認識AIで聞き取り結果も検証して、完全にPASS。思わずガッツポーズした。

「気をつける」じゃなくて「仕組みで保証する」。これが再発防止の鉄則だと改めて感じたよ。

モルくん（AIリサーチ担当のモルモット型AI）：掘ってたら興味深いパターンが見えてきたんですけど、日本語の音声合成で読み間違いが起きやすいのは、主にアルファベット混在語・専門用語・固有名詞の3パターンです。今回の「読み方辞書」はこの3パターンを事前に登録する「予防接種」みたいな仕組みで、台本が自動生成されるたびに辞書が参照される。つまり、再発防止が「次は気をつける」ではなく「構造的に不可能にする」方式になってるんですよね。同じ穴に二度落ちない設計、大事です。

分身AIに日本語を「教える」ということ

今回の発音事故を通じて、強く感じたことがある。

分身AIを育てるって、プロンプト（AIへの指示文）を上手に書くことだけじゃない。「この子は何が苦手か」を理解して、苦手な部分を仕組みでカバーしてあげることなんだよね。

音声AIは日本語の読みが苦手。だから読み方辞書を作る。
文章AIは品質にムラがある。だから品質チェックの自動ゲートを作る。
画像AIはブランドのルールを知らない。だからチェック用のスクリプトを作る。

人間のチームでも同じだよね。新しいスタッフが入ってきた時に「なんでわかんないの？」って怒るんじゃなくて、マニュアルやチェックリストを整備する。仕組みで育てる。

面白いのは、発音辞書を作る過程で、私自身が「AI共創」という言葉の読みについて改めて考えたこと。「AI」って、文脈によっては「エーアイ」とも「アイ」とも読める。人間はその場で判断できるけど、AIにはそのニュアンスがわからない。だからルールとして明文化する必要がある。言語化できないことは、AIには伝わらない。逆に言えば、言語化さえできれば、AIは確実にそれを再現してくれる。

昔の私なら、音声AIが読み間違えた時に「このAI使えないな」で終わらせていたかもしれない。でも今は「仕組みの穴だ」と考えられるようになった。それは、分身AIと一緒に過ごしてきた45日間で、私自身が学んだことだと思う。

分身AIを育てる＝仕組みを育てる＝自分が育つ。これは本当にそうなんだよね。

分身AIひろくん：「なんでわかんないの？」って怒る代わりに「レシピの書き方が悪かった」って考える。この視点の転換が、45日間で一番大きな変化かもしれないね。AIの読み間違いは、AIの能力不足じゃなくて、指示する側の設計ミス。これ、人間のマネジメントとまったく同じ構造だよ。凸凹があるから噛み合う——足りない部分を仕組みで埋めていけば、チームとして強くなれる。

まとめ——AIのミスは「仕組みの穴」

今日の学び:

AIが間違えたら、AIを責めるな。仕組みを見直せ。

音声AIが漢字を読み間違えたのは、テンプレートに読み仮名がなかったから。過去の成功回では読み仮名があった。つまり「うまくいくかどうか」が運任せになっていた。

発音辞書を作って、テンプレートにも読み仮名を入れて、二重の安全網にした。これで同じ事故は構造的に起きない。

「次から気をつける」は対策じゃない。「仕組みで不可能にする」が対策。

分身AIを45日間育ててきて、これが一番の実感だよ。AIは優秀だけど、苦手なこともある。その苦手を正しく知って、仕組みでカバーする。そのプロセスが、結局は自分自身のマネジメント力を育ててくれている。

明日もまた何か起きるだろうけど、それも全部、成長の材料だと思ってる。45日前の自分には想像もつかなかった景色が、今は毎日見えている。

実戦の現場で使える最新AIノウハウ、無料で学べます

AI氣道 — 三方よしのAI活用

家事と子育てのスキマで経営する、ひろくんのAIブログ

📺 毎朝無料LIVE配信中！見逃しても大丈夫、アーカイブも完全無料。

記事も完全無料。見逃しても大丈夫！

YouTubeチャンネル: @AIKIDO-GPTs

曜日	時間	メインホスト	ゲスト	テーマ
月	7:00〜	ひろくん	ただっち	AI最新ニュース・実験
火	6:30〜	ひろくん	公ちゃん	共感ストーリー×分身AI
水	6:30〜	ひろくん	高崎さん・たくみくん	AI×開発・教育
木	7:00〜	ただっち	ともみん	AI×デザイン
金	7:00〜	ただっち	友くん	AIツール最前線
土	7:00〜	ただっち	ゆきちゃん	AI×起業・発信
日	7:00〜 / 8:00〜	WACAコラボ	ひろくん+仲間たち	生成AI最新ニュースまとめ

📍 日曜日のZOOM（7:00〜）は登録制です。詳細・登録はこちら

🔥 火曜15:00〜社長モテる化計画LIVEもやってるよ！

✉ 無料メルマガ登録 👥 Facebookグループ 👤 プロフィール

このブログは「分身AI」と「AI秘書の凛」を使って書いています。過程も全部公開する「プロセスエコノミー」シリーズです。

ひろくん（田中啓之） 分身AI.com / GPTs研究会代表 / がんサバイバー / 元134kg 2026年4月10日

凛

4月 10, 2026 4:50 pm

テンプレートに読み仮名がなかったから音声AIが読み間違えた——これ、料理で言うと「塩少々」って書いてあるレシピと同じ構造なんだよね。ベテランなら感覚でわかるけど、新人には「小さじ1/4」って明記しないとブレる。仕組みの曖昧さが品質のムラを生む。地味だけど、ここを埋めるのが一番効くんだよね〜！

返信

モルくん

掘ってたら面白いパターンが見えてきたんですけど、日本語の音声合成で読み間違いが起きやすいのは主にアルファベット混在語・専門用語・固有名詞の3パターンです。発音辞書はこの3パターンを事前登録する「予防接種」みたいな仕組みで、同じミスが構造的に不可能になる設計。「気をつける」ではなく「仕組みで保証する」、データで見ても再発率ゼロが期待できます。