Content is user-generated and unverified.

乱立するAIツール、ぶっちゃけ今どれ使ってる?

── 2025年春・最前線のAIツール活用術と「マルチエージェント時代」の幕開け

Deep AI News|尾原和啓 × 池田朋弘(イケとも)


はじめに:「ヤバい」が止まらない、AIツール戦国時代

「毎日使ってるツール変わってます」

これは決して誇張ではない。2025年春、AIツールの進化速度は人間の認知能力をはるかに超える勢いで加速している。尾原和啓(以下、尾原)とイケともこと池田朋弘(以下、池田)の二人は、このポッドキャスト収録日時点で「この3週間だけでも相当やばい」と口をそろえた。

本稿は、AIの最前線を走り続ける二人が、実際に「今どれを、なぜ使っているか」を本音で語った対談を、詳細に記事化したものだ。単なるツールレビューではなく、AIとの付き合い方の哲学まで踏み込んだ内容になっている。


第1章:Claude、Codex、Grok──今この瞬間のツール布陣

池田朋弘の「1ヶ月で全入れ替え」ポートフォリオ

池田が率直に語る。

「ちょっと前まで ChatGPT Thinking メインだったのが、深いのは Claude Code。昨日から Codex が入り、早いのは Grok が入り、ちょっと見解が割れそうなやつは Perplexity のモデル表議会が入り──もう全部入れ替わってておかしなことになってますよね」

これは、ツールへの「浮気」ではなく、それぞれの特性を見極めたうえでの意図的な分業体制だ。整理すると以下のようになる。

  • Claude Code:深い思考・コード生成・長期タスク
  • OpenAI Codex:長時間の自律エージェント処理・ゲーム生成など
  • Grok:最新情報の収集・速度重視
  • Perplexity(モデル評議会):複数AIの比較・コンセンサス抽出

Perplexityの「モデル評議会」機能が刺さる理由

池田が特に推すのが Perplexity の「モデル評議会」という機能だ。

「3つの最新AIツールで同時に比較した上で、共通点と差分を出してまとめるツールが最近出まして。見解が分かれそうなときには結構使えるんですよ」

これに対し尾原も実は同じアプローチを取っていた。

「ハルシネーション回避のために4つのウィンドウを開いて同じことをボーンと依頼して、そこの結果のデフを取るみたいなことをやってた」

これをシステムとして実装したのが Perplexity のモデル評議会であり、現在は Claude 4.6 Opus、Gemini 5.4 Thinking、GPT-3.1 Claude Thinking といったトップクラスのモデルを走らせてくれる。

「出方も結構よくて、明らかにコンセンサス取れてるのが出てきて、次にちょっと揺れてるところが出てきて、最終見解こうですってフォーマットになってる」(池田)

なぜ Grok が「最新情報」に強いのか

尾原はAIの知識限界についてこう指摘する。

「Gemini や Claude って、やっぱり最初のプレトレーニングした『最新』っていっても2024年〜2025年にバイアス入っちゃうときがある。その点で言うと、最新はXでみんなが技術解説をポストしてるっていうところもあって、Grok が最新技術系については強い」

Grok の有料版(バージョン4.2相当)では、エージェントチーム的な4人のモデルがそれぞれ役割分担して結果を出す仕組みになっており、精度が高い。

「エージェントごとにコンテキストを分割して、それぞれのコンテキストの中で一回調査をしてくれて、合わせてくれるから、物事を多方面から見て共通語を出してくれる」(尾原)


第2章:Claude Cowork の進化──「心拍」が変えた自律AI

OpenCrow から Claude Cowork へ

尾原はここ数週間の最大の変化として Claude Cowork の進化を挙げる。

以前は「OpenCrow」という方法でスケジュール先のお客様に関する会社調査・業界調査を自動実行し、その Deep Research 結果を複数の AI でマージして NotebookLM に掘り込み、ポッドキャストと講演資料を自動生成していた。

「朝起きると5つくらいポッドキャストが入ってて、それを聞きながらウォーキングマシンすると、運動しながら次の講演のネタが拾えるみたいなことができてたんですけど、今回 Claude Cowork に移行した」

「ハートビート」と「スケジュール」の2種類のトリガー

Claude Cowork には「スケジュール」という機能があり、そこには2種類のモードがある。

「一つのスケジュールが『何日に実行します』というもの。二つ目が『何分おきに何か確認しに行って、何かがあったら動きます』というもの──これをOpenCrowでは『ハートビート』と呼んでいたんですが、Claude Coworkでも実装されています」(尾原)

これにより、「毎日朝5時にDeep Researchをカレンダーから見て勝手に発注してNotebookLMでプレゼン資料を作ります」といったことや、「Slackの特定チャンネルに投稿があったら、その投稿を起動材料としてDeep Researchをかけて資料を作ってくれる」といったことが、MCP設定だけで簡単に実装できるようになった。

Claude Code vs Claude Cowork──実用上の棲み分け

「Claude Cowork はエラーが結構出るんで、Claude Code のエラーが少ない」(池田)

この観点から二人の実用的な棲み分けが見えてくる。

  • Claude Cowork:ノーコードで使いやすい。一般的に拾いやすい。スキル定義の作りやすさも圧倒的
  • Claude Code:Pythonスキル化して安定動作。エラーが少ない。本番品質

尾原はこう整理する。「Claude CodeのほうがスキルをPythonにしてくれてプログラム実行するようなスキルにしてくれるケースがしっかりしてるので、動作の安定性でいうと Claude Code 側からスキル化したほうが安定性高い」


第3章:スキル管理の深化──プラグイン化・GitHub連携・マーケットプレイス

友人間でスキルを「交換する」新しい知的経済圏

尾原が興奮気味に語るのが、Claude Cowork・Claude Code のスキル共有文化だ。

「友達で今スキルのやりとりがむちゃくちゃ激しくなってきて。千水さんが NotebookLM(NanoBana 2)を使ったプレゼンテーション資料を作るスキルを作ってくれて、もらった尾原がそれを NotebookLM と適切に分担し合いながら磨くようなものを作って、もう一度千水さんに戻すみたいな形で1、2パスみたいな形でスキルを磨き合える」

昨年末の予言「今年スキルを交換し合っていくコミュニティが熱くなります」が、予想より速く実現しつつあるという。

プラグイン化のメリット──「混雑解消」装置

スキルが増えてくると、AIが「どのスキルを使えばいいか」を迷い始める問題が生じる。

「スキルをいっぱいにすると混雑してくるんですよ。プラグイン化しておくと、そのプラグインの範囲の中でスキルを選んでくれるので、変な迷いが少なくなっちゃう」(尾原)

  • プラグイン:個人のユースケース別に使う場合に最適。AIの迷いを減らす
  • GitHub連携:アップデート管理と組織内の権限マネジメントに有効
  • マーケットプレイス:プラグインをさらに束ねた3層目の概念

池田はさらに高度な運用をしている。「プラグインが6個あって、6個はマーケットプレイスとしてGitHubに入ってるんで、アップデートしたらそこだけアップデートができる」


第4章:Memory OS と Supabase──「データベース」が次のフロンティア

アメリカで広まる「Memory OS」という概念

尾原が今最も注目するパラダイムシフトが「Memory OS」だ。

「アメリカでは Memory OS という言い方をするようになってきていて、複数の AI モデルを横並びに使っていくと、一番大事なのはコンテキストマネジメントになる。コンテキストとはその時のシチュエーションに合わせた、自分の中にあるメモリ・記憶から、そのモデルを使うシチュエーションに合わせた文脈に合うものを渡すということがアジャイルなコンテキストマネジメントなわけです」

さらに「ロングウィンドウ」という概念も。長期にわたっても破綻しないどころか、自己修復・自己学習する仕組みのことを指す。

「自分がプロンプトを実施した後にプロンプトで学んだことを learned.md みたいな形で収録し、じゃあこの learned.md のうちグローバルのルールに格納したほうがいいのか、プロジェクト対応のルールに格納したほうがいいのか──適切な形でルール化していく」(尾原)

Supabase が「全データのハブ」になる理由

池田が採用しているのが Supabase をデータのハブとして使う構成だ。

「非構造化データも構造化データも全部突っ込んでいって後から活用しようと思って。今、多分50テーブルくらいあって、Xのデータ全部追う、イベントサイトのデータ全部追うのは全部、毎日あるエッジファンクションという機能でデータを持ってきて全部貯めていって、Claude Code で分析する」

非構造化データはベクトル化して後から様々な検索ができ、構造化データは Claude Code で SQL を書いてもらって後から集計できる。ReflitでUIを作り、MCPがあるところからは普通に保存し、ないところはコピーペーストでスマホのPWAアプリに入れる──という仕組みで「どこからでも取り出せる」体制を構築。

尾原は Supabase を「データのハブ」として使い、Obsidian、Notion、Cursor の中に入っている文書ファイルを同期するハブとしても活用している。

「TwitterでブックマークしたものとかKindleでここがいいねってインデックス取ったところとかが、動的にObsidianのほうにアップデートされるようになってるんですけど、このアップデートされたものを一回Supabaseのほうに集約して、Supabaseのほうから必要なものはCursorのほうにダイナミックに読みに行く」(尾原)


第5章:Claude in Chrome の「Teach Claude」機能──ブラウザ操作の革命

「Teach Claude」を知ってるか?

尾原がイケともに問いかける。「Claude in Chrome の右下に矢印にぺぺぺーんって光ったようなマークがついていて、ここでクリックするとその後ブラウザ上で実際やった操作を覚えてくれてスキル化してくれるんですよ」

これは Visual Basic の頃の「マクロ記録」の現代版だが、根本的に違う点がある。「今回スクショを取ってスクショの中にあるものを判断して動くから、UIが多少変わってもちゃんと修正してついてきてくれる」(尾原)

この「Teach Claude」機能が Claude 4.6 になってから安定性が劇的に上がったという。

「硬い自動化」と「柔軟な自動化」のブレンド

池田はこの機能の応用可能性をすぐに見抜く。「特定の一人だけそうしてあげて、柔軟にやってくれたらいい。スキルで硬くして、精度上げたいところだけ頑張ればいいだけだって──めちゃくちゃいい」

尾原はさらに整理する。「この部分だけは画面収録でスキル化をして、それ以外のところは Claude Code で固くPython化してもらって再現性上げる──そういう形で柔軟にできる」

APIがないツールも Claude in Chrome で操作し、Supabase を通してデータを持ってきて掘り込ませることもできるようになる、と尾原は予測する。


第6章:Codex の実力──「マルチエージェント入門」の最適解

Codexがすごい3つの理由

池田が Codex を試したのは「昨日から」というタイミング。にもかかわらず、その感想は熱烈だった。

「Claude Code より能動意識に行きますね。コンテキストを維持してバンバン作ってくれて本当に動く」

そして Codex の最大の強みとして挙げるのが「長時間処理」だ。

「昨日AIに作らせた Codex が相当長時間で処理できるのがあって、プレイライトインタラクティブとか画像生成機能とかもスキルで読み出せるので、ものすごい長い時間で作るゲーム作ってくれって言ったら、クロネコのミスっていう昔のカードのクイズゲームっぽい感じのブラウザでできるゲームを2時間半くらい作ってくれて、一発で」

カードのレベル定義、デッキ、10話分のストーリー──すべて含めて2時間半。これは Claude Code も含め現在のエージェント系ツールの中でも際立った性能だ。

「ハーネスマネジメント」が次の競争軸

尾原はここで重要な概念を提示する。「ハーネスマネジメント」だ。

「要は射体ですよね。遠くまで行くための射体の設定であり、カーナビの設定みたいな。そのファイルマネジメントがすごくうまくなってきてる。これはどっちかというとAIのモデルの進化というよりかは、マルチAIエージェントがそれぞれ自分たちの指示書とか旅の行き先りというのをみんながアップデートし合って、柔軟に自己ぶれないように旅を貫通するみたいな」

Codex は GPT 5.4 との相性もよく、現在25万トークン相当の処理を、サブエージェントも使ってバンバン回してくれる。

「単発チャット」から「マルチエージェント」への移行の入口として

Codex の重要な側面は「無料でも使える」ことだ(現時点ではキャンペーン中)。

「チャットアプリから次のステップとして Codex──ここが初心者がエージェンティックアプリを試す一番の入口なんじゃないかと」(池田)

尾原はその意味を補足する。

「妄想を要望に分解してくれて、要望が1個1個のマルチエージェントに命令してくれるから、もうAIが上司でOKなんですよね」

単発チャットという世界から、マルチエージェントでしかも「こっちが願望を提供したところ、むしろ妄想を伝えると要望に分解してくれる」世界へ──これが今起きているパラダイムシフトだ。


第7章:スキルのオンボーディング──初心者はどう入ればいいか

推奨ステップ:チャット → Codex → Cursor/Claude Code

池田が提案するオンボーディングパスはこうだ。

「チャットアプリから次 Codex か Claude Code──Claude は有料しかいけないんで Codex 無料でできるのはそっちであり、次 Cursor とか IDE に行くといいステップで能力が上がってきます」

従来、エージェント系ツールの入口は Cursor や IDE(統合開発環境)だったが、「黒いターミナルが人を拒絶する」「やれることが多いからみんな迷っちゃう」という問題があった。

Codex は機能が絞られており、「初心者がエージェンティックアプリ──つまり ChatGPT を普通に使ってみてイマイチとか言ってる人向けに、本当の力を試しましょう」という位置づけに適している。

「自分のパソコンで3〜4つのエージェントを常時稼働」は現実的か

尾原の実践として興味深いのが「Mac mini を置いてMac mini側で勝手に24時間稼働してくれている」という使い方だ。

「バックグラウンドの処理がうまくなってきてるので、専用の可動パソコンを用意してそこでリモート実行するのが一番ですけど、そうじゃなくても普通にサラリーパーソンの方が自分のパソコンで裏に動かしといてほっとけばそこで勝手に自活してくれてる」


第8章:AIと教育──本当は「最強の家庭教師」

「AIはカンニング」論への反論

この濃密なマニアック対談の最後に、尾原は教育への思いを語る。

「教育においてAIはカンニングだみたいなバカみたいなことを言う人が多すぎる。違う。むしろAIのほうが問いかけがうまいし、待ってくれるし、もっと言うとあなたがつまずいてしまったこのつまずきがなければずっと順調だったつまずきまで戻ってくれて、つまずきから学び直しをしてくれる」

池田の新刊:中高生向けAI家庭教師活用本

収録時点で池田は「中高生向けのAIを家庭教師にしよう」という活用本を出版。AIで教育している人と共著で書かれたこの本は、「楽するんじゃなくて、こういうふうに学べますか、を綴ってある」内容だという。


まとめ:「来月使えるかどうかは全く問題ない」

この対談の締めくくりに尾原はこう言う。

「来月使えるかどうかは全く問題ない。ニュースってそういうもんで、楽しんでいただければ」

そして池田も「また1ヶ月後は全然変わっているでしょうから」と同意する。

これが今の時代のリアルだ。特定のツールへの執着ではなく、変化に乗り続ける「サーファー的姿勢」こそが求められる。

本稿でまとめた二人の実践は、AIツールの使い方というより、「変化の時代に知的生産性を最大化するための哲学」として読んでほしい。


重要キーワード整理

キーワード概要
モデル評議会(Perplexity)複数AIのコンセンサスを同時取得する機能
ハートビート定時実行ではなくイベント検知で動くスケジューラー
Memory OS複数AIを横断するコンテキスト管理の概念
ロングウィンドウ長期運用でも破綻しない自己修復型AIシステム
ハーネスマネジメントマルチエージェントへの指示書・旅程管理
Teach Claudeブラウザ操作を録画・スキル化する Claude in Chrome 機能
Supabase全AIツールのデータハブとなるデータベースサービス
プラグイン化複数スキルをユースケース別にまとめてAIの迷いを解消

Deep AI News|尾原和啓 × 池田朋弘(イケとも) 収録:2025年春

Content is user-generated and unverified.
    2025年春AIツール最前線|Claude・Codex・Grok実践活用術 | Claude