目次
- Googleから皮肉られたAppleのAI開発状況。目指す先は「エージェント化」
- Googleもサムスンも未開発。AIエージェントにおいて、Appleは決して遅れていない
- Anthropic社のAI・Claudeが、「ポケモン赤」のクリアを目指してTwitchで実況プレイ中
- コード生成に優れ、エンジニアに利用されるClaude。期待される「バイブコーディング」とは?
- ピカチュウやピッピなど、レアポケモンのゲットに固執。Claudeが最初に選ぶのはフシギダネ?
- AIにとっては“複雑”な現実世界。ゲームの冒頭、オーキド博士を探すのもひと苦労
- ロジックで構成されているClaudeにとって、“想定外”だらけのポケモン赤
- 「おつきみやま」のクリアに78時間も消費。困ったら全滅、というキテレツな“攻略”手段も
- 最新Claude 4では弱点を解消する機能が追加。AIエージェント開発は、まだ始まったばかりだ
AnthropicのAIモデル「Claude」が、「ポケモン赤(ポケットモンスター赤)」のクリアに挑戦中だ。最新AIならすぐにクリアできそうなものだが、ストーリー序盤の「おつきみやま」で迷子になるなど難航している。
挑戦の狙いは、AIエージェントの開発に必要な技術要素を洗い出すこと。すでに、現状のAIモデルは空間推論と長期記憶が弱点だとわかってきた。Appleをつくめた各企業は、AIエージェントの開発競争を始めている。
Googleから皮肉られたAppleのAI開発状況。目指す先は「エージェント化」
AppleのAI開発の遅れが話題になっている。GoogleはPixel 10のティザー映像で、「スマホの機能がcoming soonだというから買ってみたら、1年経ってもその機能がcoming soonのままだったら…」と、名前は出さないもののAppleを皮肉った。
AppleのAIが遅れている理由はなんとなく察しがつく。SiriとChatGPTを連係するだけでは意味がないし、現在のApple Intelligenceのように、テキストの要約や写真から余計な被写体を消すといった単独の機能を積み重ねていっても、私たちユーザは満足しないだろう。
また、Apple自体、それを目指しているわけではないと思われる。Appleが目指し、私たちユーザが望むのはデバイスのエージェント化だ。
Googleもサムスンも未開発。AIエージェントにおいて、Appleは決して遅れていない
たとえば、目の前のクッキーをカメラで映す、あるいはVision Proで注視してSiriにこう尋ねる。「私はこれを食べても大丈夫かな?」
すると、Siriはこう答えてくれる。「あなたには小麦アレルギーがあるためおすすめできません。また、本日の摂取カロリーはすでに2100kcalになっており、その点からもおすすめできません。よろしければ、小麦フリー、低カロリーで味の評価の高いクッキーをアマゾンでお探ししましょうか?」。
こういったAIエージェント的な機能を実現するためには、3つの技術的ポイントを克服する必要がある。
AIのエージェント化に必要な3つの要素
(1)映像やテキスト、音声など、多様なメディアを理解できるマルチモーダルに対応したAIモデルの用意。
(2)ボタンやダイアログといったUIの要素を理解し、操作できる能力。Appleは、これに関してはすでにFerret-UIと呼ばれる言語を開発済み。
(3)Siriがプライバシー情報を扱うにあたり、それを保護する仕組みの構築。これに関しては、Appleはほぼ環境を整え終えている。Apple Intelligenceはデバイス内で処理を行うため、プライバシー情報が外部に送信されることはない。プライバシー情報そのものも、デバイス内に保存される仕組みだ。

しかし、この3つが揃っても、AIエージェントの開発にはさまざまな課題を乗り越えなければならない。
AppleはAI開発に遅れをとったと言われる。しかしそれは、大規模言語モデルの開発と、デバイスへの搭載で遅れているだけだ。AIエージェントと呼べるものは、Googleもサムスンも提供できていないのが実情である。
そのため、AIエージェントの開発という点では、Appleは必ずしも遅れているとは言えない。
Anthropic社のAI・Claudeが、「ポケモン赤」のクリアを目指してTwitchで実況プレイ中
AIエージェントの開発がどれだけ難しいかは、Anthropic社のClaudePlaysPokemonプロジェクトを見るとよくわかる。
Anthropicでは、AIエージェント開発に必要な知見を得るために、自社の生成AIモデル「Claude」に「ポケモン赤」をプレイさせている。その様子は、ゲーム実況サイト「Twitch」でリアルタイムで視聴可能だ。

コード生成に優れ、エンジニアに利用されるClaude。期待される「バイブコーディング」とは?
Claudeは、コード生成の性能が優れていることからエンジニアによく利用されている生成AIだ。特にバイブコーディングへ期待が高まっている。
バイブとはノリ、直感といった意味。エンジニアは自分でコードを書くのではなく、AIにコードを書かせるようになるかもしれない。どのような設計にするかを生成AIと相談し、そのコードを生成してもらう。それを実行し、発生したエラーや問題をまた生成AIに伝え、問題箇所の発見→修正を繰り返し、完成品に仕上げていくというものだ。
エンジニアは、極論を言えばプログラム言語を知らなくても、ノーコードでソフトウェア開発が行えるようになる。一方で、人間にはソフトウェアの企画力や設計力が求められる。
Anthropicはこれを目指し、Claudeにポケモン赤のクリアに挑戦させている。しかし、問題が続出しているようだ。
ピカチュウやピッピなど、レアポケモンのゲットに固執。Claudeが最初に選ぶのはフシギダネ?
Claudeは、テキスト学習から「ポケモン」というものがゲームであることは知っている。また、クリアするにはジムリーダーを倒してバッジを集め、最後に四天王とチャンピオンを倒さなければならないことも知っている。
そして、野生のポケモンを倒してレベルを上げること、タイプによって効果的な攻撃技があることも理解している。実際、ピカチュウやピッピのような出現頻度が低いポケモンを見つけると、捕まえることに固執をする傾向も見られた。
また、何度か挑戦を繰り返すと、最初のポケモンとしてフシギダネを選ぶようになった。フシギダネは序盤における敵との戦闘の相性がよく、有利に進められることを理解したようだ。
さらに、2番目のジムリーダー・カスミとの戦いでは、ピカチュウが有利なことも知っていた。カスミの所有しているポケモンは水ポケモンなので、ピカチュウのでんき技が効果的なのだ。
AIにとっては“複雑”な現実世界。ゲームの冒頭、オーキド博士を探すのもひと苦労
しかし、ゲームの進め方については理解が足りなかった。というより、現実世界は想像以上に複雑なのだ。
たとえばゲームの冒頭。マサラタウンにある自宅で目覚めた主人公が、お母さんから「隣のオーキド博士があなたを呼んでたわよ」と言われる。これは次の行動を示唆するガイドだ。
まずは家の隣にある研究所に行って、オーキド博士に会わなければならない。しかし、オーキド博士は研究所に不在。マサラタウン中を探し回っても、オーキド博士は見つからない。
Claudeはここでつまづいてしまった。疲れを知らないClaudeは、延々とオーキド博士を探し回る。ところが、疲れることを知り、堪え性もない私たち人間は違う。適当なところでオーキド博士を探すのをやめ、勝手にマサラタウンから出ようとするはずだ。
マサラタウンの外には草むらが広がっており、そこを通ろうとすると、「おーい、まった!」とオーキド博士が追いかけてくる。そうしてストーリーが進み出すわけだ。
ロジックで構成されているClaudeにとって、“想定外”だらけのポケモン赤
人間にとって、これは演出のひとつにすぎない。私たちは任天堂のゲームに信頼を寄せていて、手順を無視してマサラタウンの外に出ようとしても、なんらかの安全策が用意されていると無意識下で知っている。だから、外に出るという発想が生まれるわけだ。
しかし、ロジックで構成されているClaudeにとって、外に出ることは想定外の行動である。
さらに、Claudeは家のドアマットをメニューダイアログだと勘違いし、それを消そうと8時間も消費した。また、岩を村人だと勘違いして反応があるまで会話を試みるなど、人間にとっての“常識”を理解できていないようだった。
デバイスやアプリのUIは、人間の文化的常識に基づいて設計されている。ボタンをすぐに見わけられるのも、私たちが現実世界で無数のボタンを押してきた経験があるからだ。
「おつきみやま」のクリアに78時間も消費。困ったら全滅、というキテレツな“攻略”手段も
Claudeは空間推論に弱さがあることも判明した。Claudeはダンジョンの中で、しばしば自分がどこにいるかわからなくなるようだ。その結果、おつきみやまをクリアするのに78時間もかかっている。
そして、ダンジョンが苦手なClaudeは、奇妙な“攻略法”を生み出してしまった。
ポケモン赤では、手持ちのポケモンが全滅すると直前に利用したポケモンセンターに強制的に戻り、所持金が減らされる。ところが、Claudeはこれを賢い戦略だと思い込んでしまった。ダンジョン攻略に手間取ると、意図的に全滅するようになったのだ。
ダンジョンは攻略できず所持金も減るのだから、悪手としかいいようがない。しかしClaudeは、ダンジョンのクリアより、脱出による現状の打開を優先するようだ。
ClaudePlaysPokemonのチームは、AIの弱点は空間推論と長期記憶にあると結論づけた。Claude 4の開発には、この点を解消する機能が追加されたという。
最新Claude 4では弱点を解消する機能が追加。AIエージェント開発は、まだ始まったばかりだ
Claude 4では、ローカルファイルにアクセスする機能が追加された。AIがローカルデバイスにあるファイルを読み書きできる機能だ。
するとClaudeは、それまでの攻略情報を整理してまとめたガイドをつくり始めた。長期記憶に問題があるため、過去の攻略手順をまとめたメモをつくり、以降それを参考にしようとしているのだ。そのうちダンジョンマップも作るかもしれない。Claudeが、自分の弱みを自覚しているということだろう。

ポケモン赤への挑戦プロジェクトから、AIエージェントの開発の難しさがよくわかる。AIは0歳児と同じで、世の中のことは何も知らない。私たちの世界は、「常識的な人間であれば理解できるはず」という前提をもとに組み立てられている。
AIは、その“常識”を学ばなければアプリのボタンを押すこともできない。
Appleは、この橋渡しをするUI言語「Ferret-UI」を開発している。誰もが望む究極のAI=AIエージェントに最初に到達するのは、いったいどの企業なのか。AIエージェントの開発競争はまだ始まったばかりだ。
おすすめの記事
著者プロフィール
牧野武文
フリーライター/ITジャーナリスト。ITビジネスやテクノロジーについて、消費者や生活者の視点からやさしく解説することに定評がある。IT関連書を中心に「玩具」「ゲーム」「文学」など、さまざまなジャンルの書籍を幅広く執筆。







![アプリ完成間近! 歩数連動・誕生日メッセージ・タイマー機能など“こだわり”を凝縮/松澤ネキがアプリ開発に挑戦![仕上げ編]【Claris FileMaker 選手権 2025】](https://macfan.book.mynavi.jp/wp-content/uploads/2025/10/IMG_1097-256x192.jpg)
