Deep AI News|尾原和啓 × 池田朋弘(イケとも)
「毎日使ってるツール変わってます」
これは決して誇張ではない。2025年春、AIツールの進化速度は人間の認知能力をはるかに超える勢いで加速している。尾原和啓(以下、尾原)とイケともこと池田朋弘(以下、池田)の二人は、このポッドキャスト収録日時点で「この3週間だけでも相当やばい」と口をそろえた。
本稿は、AIの最前線を走り続ける二人が、実際に「今どれを、なぜ使っているか」を本音で語った対談を、詳細に記事化したものだ。単なるツールレビューではなく、AIとの付き合い方の哲学まで踏み込んだ内容になっている。
池田が率直に語る。
「ちょっと前まで ChatGPT Thinking メインだったのが、深いのは Claude Code。昨日から Codex が入り、早いのは Grok が入り、ちょっと見解が割れそうなやつは Perplexity のモデル表議会が入り──もう全部入れ替わってておかしなことになってますよね」
これは、ツールへの「浮気」ではなく、それぞれの特性を見極めたうえでの意図的な分業体制だ。整理すると以下のようになる。
池田が特に推すのが Perplexity の「モデル評議会」という機能だ。
「3つの最新AIツールで同時に比較した上で、共通点と差分を出してまとめるツールが最近出まして。見解が分かれそうなときには結構使えるんですよ」
これに対し尾原も実は同じアプローチを取っていた。
「ハルシネーション回避のために4つのウィンドウを開いて同じことをボーンと依頼して、そこの結果のデフを取るみたいなことをやってた」
これをシステムとして実装したのが Perplexity のモデル評議会であり、現在は Claude 4.6 Opus、Gemini 5.4 Thinking、GPT-3.1 Claude Thinking といったトップクラスのモデルを走らせてくれる。
「出方も結構よくて、明らかにコンセンサス取れてるのが出てきて、次にちょっと揺れてるところが出てきて、最終見解こうですってフォーマットになってる」(池田)
尾原はAIの知識限界についてこう指摘する。
「Gemini や Claude って、やっぱり最初のプレトレーニングした『最新』っていっても2024年〜2025年にバイアス入っちゃうときがある。その点で言うと、最新はXでみんなが技術解説をポストしてるっていうところもあって、Grok が最新技術系については強い」
Grok の有料版(バージョン4.2相当)では、エージェントチーム的な4人のモデルがそれぞれ役割分担して結果を出す仕組みになっており、精度が高い。
「エージェントごとにコンテキストを分割して、それぞれのコンテキストの中で一回調査をしてくれて、合わせてくれるから、物事を多方面から見て共通語を出してくれる」(尾原)
尾原はここ数週間の最大の変化として Claude Cowork の進化を挙げる。
以前は「OpenCrow」という方法でスケジュール先のお客様に関する会社調査・業界調査を自動実行し、その Deep Research 結果を複数の AI でマージして NotebookLM に掘り込み、ポッドキャストと講演資料を自動生成していた。
「朝起きると5つくらいポッドキャストが入ってて、それを聞きながらウォーキングマシンすると、運動しながら次の講演のネタが拾えるみたいなことができてたんですけど、今回 Claude Cowork に移行した」
Claude Cowork には「スケジュール」という機能があり、そこには2種類のモードがある。
「一つのスケジュールが『何日に実行します』というもの。二つ目が『何分おきに何か確認しに行って、何かがあったら動きます』というもの──これをOpenCrowでは『ハートビート』と呼んでいたんですが、Claude Coworkでも実装されています」(尾原)
これにより、「毎日朝5時にDeep Researchをカレンダーから見て勝手に発注してNotebookLMでプレゼン資料を作ります」といったことや、「Slackの特定チャンネルに投稿があったら、その投稿を起動材料としてDeep Researchをかけて資料を作ってくれる」といったことが、MCP設定だけで簡単に実装できるようになった。
「Claude Cowork はエラーが結構出るんで、Claude Code のエラーが少ない」(池田)
この観点から二人の実用的な棲み分けが見えてくる。
尾原はこう整理する。「Claude CodeのほうがスキルをPythonにしてくれてプログラム実行するようなスキルにしてくれるケースがしっかりしてるので、動作の安定性でいうと Claude Code 側からスキル化したほうが安定性高い」
尾原が興奮気味に語るのが、Claude Cowork・Claude Code のスキル共有文化だ。
「友達で今スキルのやりとりがむちゃくちゃ激しくなってきて。千水さんが NotebookLM(NanoBana 2)を使ったプレゼンテーション資料を作るスキルを作ってくれて、もらった尾原がそれを NotebookLM と適切に分担し合いながら磨くようなものを作って、もう一度千水さんに戻すみたいな形で1、2パスみたいな形でスキルを磨き合える」
昨年末の予言「今年スキルを交換し合っていくコミュニティが熱くなります」が、予想より速く実現しつつあるという。
スキルが増えてくると、AIが「どのスキルを使えばいいか」を迷い始める問題が生じる。
「スキルをいっぱいにすると混雑してくるんですよ。プラグイン化しておくと、そのプラグインの範囲の中でスキルを選んでくれるので、変な迷いが少なくなっちゃう」(尾原)
池田はさらに高度な運用をしている。「プラグインが6個あって、6個はマーケットプレイスとしてGitHubに入ってるんで、アップデートしたらそこだけアップデートができる」
尾原が今最も注目するパラダイムシフトが「Memory OS」だ。
「アメリカでは Memory OS という言い方をするようになってきていて、複数の AI モデルを横並びに使っていくと、一番大事なのはコンテキストマネジメントになる。コンテキストとはその時のシチュエーションに合わせた、自分の中にあるメモリ・記憶から、そのモデルを使うシチュエーションに合わせた文脈に合うものを渡すということがアジャイルなコンテキストマネジメントなわけです」
さらに「ロングウィンドウ」という概念も。長期にわたっても破綻しないどころか、自己修復・自己学習する仕組みのことを指す。
「自分がプロンプトを実施した後にプロンプトで学んだことを learned.md みたいな形で収録し、じゃあこの learned.md のうちグローバルのルールに格納したほうがいいのか、プロジェクト対応のルールに格納したほうがいいのか──適切な形でルール化していく」(尾原)
池田が採用しているのが Supabase をデータのハブとして使う構成だ。
「非構造化データも構造化データも全部突っ込んでいって後から活用しようと思って。今、多分50テーブルくらいあって、Xのデータ全部追う、イベントサイトのデータ全部追うのは全部、毎日あるエッジファンクションという機能でデータを持ってきて全部貯めていって、Claude Code で分析する」
非構造化データはベクトル化して後から様々な検索ができ、構造化データは Claude Code で SQL を書いてもらって後から集計できる。ReflitでUIを作り、MCPがあるところからは普通に保存し、ないところはコピーペーストでスマホのPWAアプリに入れる──という仕組みで「どこからでも取り出せる」体制を構築。
尾原は Supabase を「データのハブ」として使い、Obsidian、Notion、Cursor の中に入っている文書ファイルを同期するハブとしても活用している。
「TwitterでブックマークしたものとかKindleでここがいいねってインデックス取ったところとかが、動的にObsidianのほうにアップデートされるようになってるんですけど、このアップデートされたものを一回Supabaseのほうに集約して、Supabaseのほうから必要なものはCursorのほうにダイナミックに読みに行く」(尾原)
尾原がイケともに問いかける。「Claude in Chrome の右下に矢印にぺぺぺーんって光ったようなマークがついていて、ここでクリックするとその後ブラウザ上で実際やった操作を覚えてくれてスキル化してくれるんですよ」
これは Visual Basic の頃の「マクロ記録」の現代版だが、根本的に違う点がある。「今回スクショを取ってスクショの中にあるものを判断して動くから、UIが多少変わってもちゃんと修正してついてきてくれる」(尾原)
この「Teach Claude」機能が Claude 4.6 になってから安定性が劇的に上がったという。
池田はこの機能の応用可能性をすぐに見抜く。「特定の一人だけそうしてあげて、柔軟にやってくれたらいい。スキルで硬くして、精度上げたいところだけ頑張ればいいだけだって──めちゃくちゃいい」
尾原はさらに整理する。「この部分だけは画面収録でスキル化をして、それ以外のところは Claude Code で固くPython化してもらって再現性上げる──そういう形で柔軟にできる」
APIがないツールも Claude in Chrome で操作し、Supabase を通してデータを持ってきて掘り込ませることもできるようになる、と尾原は予測する。
池田が Codex を試したのは「昨日から」というタイミング。にもかかわらず、その感想は熱烈だった。
「Claude Code より能動意識に行きますね。コンテキストを維持してバンバン作ってくれて本当に動く」
そして Codex の最大の強みとして挙げるのが「長時間処理」だ。
「昨日AIに作らせた Codex が相当長時間で処理できるのがあって、プレイライトインタラクティブとか画像生成機能とかもスキルで読み出せるので、ものすごい長い時間で作るゲーム作ってくれって言ったら、クロネコのミスっていう昔のカードのクイズゲームっぽい感じのブラウザでできるゲームを2時間半くらい作ってくれて、一発で」
カードのレベル定義、デッキ、10話分のストーリー──すべて含めて2時間半。これは Claude Code も含め現在のエージェント系ツールの中でも際立った性能だ。
尾原はここで重要な概念を提示する。「ハーネスマネジメント」だ。
「要は射体ですよね。遠くまで行くための射体の設定であり、カーナビの設定みたいな。そのファイルマネジメントがすごくうまくなってきてる。これはどっちかというとAIのモデルの進化というよりかは、マルチAIエージェントがそれぞれ自分たちの指示書とか旅の行き先りというのをみんながアップデートし合って、柔軟に自己ぶれないように旅を貫通するみたいな」
Codex は GPT 5.4 との相性もよく、現在25万トークン相当の処理を、サブエージェントも使ってバンバン回してくれる。
Codex の重要な側面は「無料でも使える」ことだ(現時点ではキャンペーン中)。
「チャットアプリから次のステップとして Codex──ここが初心者がエージェンティックアプリを試す一番の入口なんじゃないかと」(池田)
尾原はその意味を補足する。
「妄想を要望に分解してくれて、要望が1個1個のマルチエージェントに命令してくれるから、もうAIが上司でOKなんですよね」
単発チャットという世界から、マルチエージェントでしかも「こっちが願望を提供したところ、むしろ妄想を伝えると要望に分解してくれる」世界へ──これが今起きているパラダイムシフトだ。
池田が提案するオンボーディングパスはこうだ。
「チャットアプリから次 Codex か Claude Code──Claude は有料しかいけないんで Codex 無料でできるのはそっちであり、次 Cursor とか IDE に行くといいステップで能力が上がってきます」
従来、エージェント系ツールの入口は Cursor や IDE(統合開発環境)だったが、「黒いターミナルが人を拒絶する」「やれることが多いからみんな迷っちゃう」という問題があった。
Codex は機能が絞られており、「初心者がエージェンティックアプリ──つまり ChatGPT を普通に使ってみてイマイチとか言ってる人向けに、本当の力を試しましょう」という位置づけに適している。
尾原の実践として興味深いのが「Mac mini を置いてMac mini側で勝手に24時間稼働してくれている」という使い方だ。
「バックグラウンドの処理がうまくなってきてるので、専用の可動パソコンを用意してそこでリモート実行するのが一番ですけど、そうじゃなくても普通にサラリーパーソンの方が自分のパソコンで裏に動かしといてほっとけばそこで勝手に自活してくれてる」
この濃密なマニアック対談の最後に、尾原は教育への思いを語る。
「教育においてAIはカンニングだみたいなバカみたいなことを言う人が多すぎる。違う。むしろAIのほうが問いかけがうまいし、待ってくれるし、もっと言うとあなたがつまずいてしまったこのつまずきがなければずっと順調だったつまずきまで戻ってくれて、つまずきから学び直しをしてくれる」
収録時点で池田は「中高生向けのAIを家庭教師にしよう」という活用本を出版。AIで教育している人と共著で書かれたこの本は、「楽するんじゃなくて、こういうふうに学べますか、を綴ってある」内容だという。
この対談の締めくくりに尾原はこう言う。
「来月使えるかどうかは全く問題ない。ニュースってそういうもんで、楽しんでいただければ」
そして池田も「また1ヶ月後は全然変わっているでしょうから」と同意する。
これが今の時代のリアルだ。特定のツールへの執着ではなく、変化に乗り続ける「サーファー的姿勢」こそが求められる。
本稿でまとめた二人の実践は、AIツールの使い方というより、「変化の時代に知的生産性を最大化するための哲学」として読んでほしい。
| キーワード | 概要 |
|---|---|
| モデル評議会(Perplexity) | 複数AIのコンセンサスを同時取得する機能 |
| ハートビート | 定時実行ではなくイベント検知で動くスケジューラー |
| Memory OS | 複数AIを横断するコンテキスト管理の概念 |
| ロングウィンドウ | 長期運用でも破綻しない自己修復型AIシステム |
| ハーネスマネジメント | マルチエージェントへの指示書・旅程管理 |
| Teach Claude | ブラウザ操作を録画・スキル化する Claude in Chrome 機能 |
| Supabase | 全AIツールのデータハブとなるデータベースサービス |
| プラグイン化 | 複数スキルをユースケース別にまとめてAIの迷いを解消 |
Deep AI News|尾原和啓 × 池田朋弘(イケとも) 収録:2025年春