【分身AIの作り方】Harness Engineering入門:AIエージェントを自律的に動かす仕組み

harness engineering grafico main 1
Harness Engineeringとは何か

「Harness Engineering」って何?

2026年2月、OpenAIのエンジニアRyan Lopopoloが発表したブログ記事が、エンジニアの間で話題になっている。

「Harness Engineering: leveraging Codex in an agent-first world」

AIエージェントが「一人で料理できる厨房」を設計する。
それが、これからのエンジニアの仕事になる。

OpenAIはこの方法で、5ヶ月で100万行のコードを生成した。
しかも、人間が手で書いたコードはゼロ

「え、エンジニアは何してたの?」と思うよね。

答えはこうだ。

環境を設計し、意図を仕様にし、フィードバックを返していた。

料理で例えるなら──

従来のエンジニア=シェフが一品ずつ手で作る
Harness Engineer=厨房のレイアウト、レシピ帳、味見の仕組み、食材の並べ方を設計して、AIシェフが迷わず料理できるようにする人

3つの柱

3つの柱(Martin Fowler流の整理)

Martin Fowlerのサイトで、ThoughtWorksのBirgitta Böckelerがこの概念を3つの柱に整理している。

1. Context Engineering(レシピ帳を整える)

AIエージェントに「何を、どうやって作るか」を伝えるための知識ベース。

OpenAIのチームは、リポジトリ内に構造化されたドキュメント領域を作り、約100行のAGENTS.mdというファイルをエージェントに毎回読み込ませていた。

これが「単一の信頼できる情報源」になる。

レシピ帳がなかったら、どんな腕利きのシェフでも「今日の日替わり弁当、何作ればいいんだっけ?」ってなるよね。

2. Architecture Constraints(厨房のルールを決める)

AIエージェントの「暴走防止柵」。

OpenAIは、モジュールの依存関係を層状に定義した。

Types → Config → Repo → Service → Runtime → UI

この順序を破るコードは、自動テストやLinterで弾かれる。

料理で言えば「デザートの材料でメインディッシュを作るな」「揚げ物のフライパンでスイーツを焼くな」というルール。AIに自由にやらせつつも、「この範囲で」という境界線をコードで強制する。

3. Garbage Collection(冷蔵庫の期限切れチェック)

時間が経つとドキュメントは古くなるし、アーキテクチャの違反も積み重なる。

OpenAIは「矛盾検出エージェント」を走らせて、定期的にコードベースの「期限切れ」を見つけている。

冷蔵庫の奥に放置された食材。いつの間にか腐っている。これを定期的にチェックして掃除する仕組みがないと、どんなに素晴らしい厨房もいずれ機能しなくなる。

私がやってたこと

「あれ?これ、私がやってたことだ」

ここからが面白い話。

私は2025年から、Claude Codeを使って「mothership-lab」という仕組みを作ってきた。AIエージェントに仕事を委ねるための「母艦」だ。

OpenAIの記事を読んで、正直驚いた。

やってること、ほぼ同じじゃないか。

OpenAIのHarness Engineering私のmothership-lab
AGENTS.md(約100行のマップ)CLAUDE.md + MEMORY.md(AIへの指示書)
構造化されたdocs/cards/(知識カード) + docs/axis/(ブランド指針)
カスタムLinter + 構造テストquality_gate.sh(品質チェック自動化)
ガベージコレクション/audit コマンド + noise_filter(ノイズ自動除去)
エージェント群のオーケストレーションAGI Cockpit(複数AIエージェントの同時指揮)
宣言型プロンプトLayer3トリガーシステム(キーワード検出→自動注入)

名前なんてついてなかった。

でも、やっていることの本質は同じだった。

なぜ同じことにたどり着いたのか

なぜ同じことにたどり着いたのか

理由はシンプルだ。

AIエージェントに「もっと頑張れ」と言っても、うまくいかないから。

OpenAIの記事にこんな一節がある。

When something failed, the fix was almost never “try harder.”
(何かがうまくいかなかった時、解決策は「もっと頑張れ」ではなかった)

代わりに、こう考えた。

「不足しているのは何か? それをどうやってエージェントにとって読みやすく、強制できるものにするか?」

これ、私が毎日やっていることだ。

AIが同じミスを繰り返す → 「次から気をつけて」じゃダメ。
仕組みで防ぐ。ルールをコードに書く。自動でチェックする。

料理で言えば──

「味が濃すぎた」→「次は気をつけよう」は何も変わらない。
「塩は小さじ1まで」とレシピに書く。計量スプーンを置く。味見ステップを入れる。

人間の意志力に頼らず、仕組みで品質を保証する。

これがHarness Engineeringの本質であり、私が「委ねるOS」と呼んでいるものの実装だ。

エンジニアじゃなくても関係ある話

エンジニアじゃなくても関係ある話

「でもこれ、エンジニアの話でしょ?」

違う。

Harness Engineeringが教えてくれる最大の教訓は──

「AIを使いこなす」とは「AIが動ける環境を作る」ということ。

これはビジネスでもまったく同じだ。

  • 部下に「頑張れ」と言っても成果は出ない → マニュアルと仕組みを作る
  • AIに「いい文章書いて」と言っても60点 → ブランドガイドラインとトーン設定を渡す
  • ChatGPTに「なんでもいいからアイデア出して」→ 散漫 → 制約条件を明確にする

制約を増やすほど、AIの自律性と信頼性は上がる。

これ、直感に反するよね。自由にさせた方がいい結果が出そうじゃない?

でも違う。

料理で言えば、「好きに作っていいよ」と言われたシェフは困る。
「今日の食材はこれ、お客さんは30人、予算はこれ、アレルギーの人が2人」──この制約があるから、最高の料理が生まれる。

今日から始められること

あなたも今日から始められること

Harness Engineeringを自分の仕事に取り入れるなら、こんなステップから始めてみてほしい。

Step 1: 「レシピ帳」を作る

AIに毎回同じことを伝えていないか?

もしそうなら、それをドキュメントにまとめよう。
ChatGPTならカスタム指示に、Claude CodeならCLAUDE.mdに書く。

「この人はこういう仕事をしていて、こういうトーンで話して、こういうNGがある」

これだけで、AIの出力品質は劇的に上がる。

Step 2: 「ガードレール」を引く

AIに「これだけは絶対にやるな」を伝える。

  • この表現は使わない
  • この数字は出さない
  • この形式で出力する

制約は自由を奪うのではなく、品質を保証する

Step 3: 「味見」の仕組みを作る

AIの出力をチェックするステップを入れる。

全自動にしない。最後の味見だけは自分でやる。

私はこれを「味見ゲート」と呼んでいる。
「やった」と言う前に、検証する。証拠を見せる。

厨房設計者という新しい働き方

まとめ:「厨房設計者」という新しい働き方

OpenAIが「Harness Engineering」と名付けたもの。

それは──

「自分で料理する人」から「厨房を設計する人」へのシフト。

AIが料理する。人間は厨房を設計する。
レシピ帳を整え、ルールを決め、冷蔵庫をチェックする。

これは「楽になる」という話じゃない。
仕事の質が変わるという話だ。

私は「抱え込みOS」を「委ねるOS」に書き換えている最中。
完璧じゃない。まだ書き換わってない部分もある。

でも、OpenAIのような世界最先端のチームが、同じ結論にたどり着いている。

方向は間違っていない。

一緒に「厨房設計者」になろう。
その先に、ワクワクする未来が待っているよ。


参考:


この記事はプロセスエコノミーの一環として、AIエージェントと人間の協働で作成しました。
構成・執筆・校正の全プロセスを公開しています。

上部へスクロール