WWDC26で発表された高性能AIモデル、「Most powerful on-device model」とは何か

＼楽天ポイント4倍セール！／

Apple iPhone 17 Pro 256GB (SIMフリー)：最大120Hz のProMotion を採用した6.3 インチディスプレイ、A19 Pro チップ、飛躍的に向上したバッテリー駆動時間、センターフレームフロントカメラを搭載したPro Fusion カメラシステム；シルバー

ポチップ

「Most powerful on-device model」とはなにか？

この「Most powerful on-device model」が何を示すのかについて、WWDC26の中では明示されていない。しかし「Apple Machine Learning Research」の中で、「AFM 3 Core Advanced, our most powerful on-device model.（AFM 3 Core Advancedは当社の最も強力なオンデバイスモデルです）」と述べている。つまり「Most powerful on-device model」とは「AFM 3 Core Advanced」を指している、ということだ。

「AFM 3 Core Advanced」は、Appleの第３世代基盤モデル「Apple Foundation Models 3」の１つ。「Apple Foundation Models 3」は全５種で構成されており、このうちApple製品上に搭載される基盤モデルが２種類、クラウドサーバであるPCC（Private Cloud Compute）上の基盤モデルが３種類用意されている。

「Apple Machine Learning Research」では、iPhoneやMacなどのデバイス上で動く「AFM 3 Core」と「AFM 3 Core Advanced」、そしてPCC上で動く「AFM 3 Cloud」、「ADM 3 Cloud」、「AFM 3 Cloud Pro」の５種類の基盤モデルが紹介されている。「AFM 3 Core Advanced」と「AFM 3 Cloud Pro」は、AFM 3で新たに加わった基盤モデルだ。

このうち「AFM 3 Core Advanced」を動かせるデバイスが、「Most powerful on-device model」に記載されたApple製品ということになる。その要件は搭載メモリが12GB以上であること、そしてAppleシリコンが一定以上の世代（製品によって変わる）である、ということだ。

この要件は「AFM 3 Core Advanced」を動かすためのメモリ領域が追加で必要になることと、その動作にNeural Engineにも一定以上のレベルが求められることを意味している。

Apple(アップル)

¥179,801 （2026/06/15 18:17時点 | Amazon調べ）

＼楽天ポイント4倍セール！／

Apple 11インチiPad Pro(M4):Ultra Retina XDR ディスプレイ – Nano-textureガラス、2TB、横向きの 12MP フロントカメラ/12MP バックカメラ、LiDAR スキャナ、Wi-Fi 6E + 5G 携帯電話通信(eSIM)、Face ID、一日中使えるバッテリー – シルバー

ポチップ

「AFM 3 Core Advanced」に組み込まれた驚くべき技術

「AFM 3 Core Advanced」の要件を満たすApple製品でも、そのほとんどの処理は「AFM 3 Core」で行われる。つまり「AFM 3 Core Advanced」は“AFM 3 Coreと同時に使われる”モデル基盤だ。このためSiriやApple Intelligenceの動作環境を超える要件が求められる。

しかし「AFM 3 Core」が30億パラメータクラスの基盤モデルであるのに対して、「AFM 3 Core Advanced」は200億パラメータクラス（つまり大幅に賢い）の基盤モデルのため、そのままではデバイス上に常駐させることは不可能だ。

そこでAppleが「AFM 3 Core Advanced」で採用したのが、IFP（Instruction-Following Pruning）と呼ばれるテクノロジーである。これはモデル全体はSSD（NAND）に置いたまま、必要に応じてモデルの一部をメモリ（DRAM）上に移して（ルーティングして）実行する。

その際に「トークン単位」ではなく「プロンプト単位」でルーティングを行うのがポイントだ。これによって完全オフラインかつプライバシーを確保した状態で高度なAI処理を行うことができる。

「Apple Machine Learning Research」では、「AFM 3 Core Advanced」がIFP（Instruction-Following Pruning）をどのように利用して、限られたメモリ上での実行を実現しているかを図で示している。IFPは常に必要となる重み（モデルの一部）を常駐させ、それ以外の重み（エキスパート）は必要に応じてメモリにルーティングして処理することで、全体で200億パラメータのうちメモリ上に置く重みを10〜40億パラメータまで削減する。
画像：Apple Machine Learning Research

Apple(アップル)

¥264,471 （2026/06/15 18:19時点 | Amazon調べ）

＼楽天ポイント4倍セール！／

Apple 2026 MacBook Pro 18コアCPU、20コアGPUのM5 Proチップ搭載ノートパソコン：AIのために設計、16.2インチLiquid Retina XDRディスプレイ、48GBユニファイドメモリ、1TBのSSDストレージ – スペースブラック

ポチップ

「AFM 3 Core Advanced」が提供する「アドバンテージ」とは

WWCD26のキーノート内で発表された「AFM 3 Core Advanced」の能力は大きく分けて２つある。１つは「Expressive Voices」で、これはSiriなどの音声合成品質を大きく向上させるものだ。具体的には下記の改善点が挙げられている。

・General Voice：案内や読み上げが自然に聞こえる
・Conversational Voice：会話がより人が話しているイメージに近くなる
・Cadence：間の取り方やリズムが自然になる
・Intonation：話し方に抑揚がついて単調さが減る
・Expressiveness：感情やニュアンスが乗りやすくなる
・Clarity：聞き取りやすさが改善される
・Naturalness：機械的な読み上げ感が減って自然に聞こえるようになる

実際の聞こえ方については、英語ではあるが「Apple Machine Learning Research」の中にサンプル音声が置かれているので、実際に聞き比べることができる。

もう１つは「High-Accuracy Dictation」で、これは人の会話を理解して言語化（テキスト化）する能力を大きく向上させるものだ。具体的には…

・Punctuation: 句読点が自然な位置に入る
・Casing: 大文字小文字の使い分けが正確になる
・Layout: 段落や見た目が自然になる
・Meaning Capture: 言いたいことの意味が変わりにくい
・Disfluency Handling: 「え〜」や「あの〜」といったフィラー（口癖）や会話の詰まりをうまく処理する
・Style: 文章が自然になる

といったように、より人が「自然でわかりやすい」と感じられる文章に変換されるようになる。

つまり「Expressive Voices」と「High-Accuracy Dictation」の組み合わせによって、Siriなどとの対話が自然で正確なものになり、より人と話しているイメージに近くなる、という内容だ。

WWDC26キーノートの「Siri AI」のセッションの中で、Siri Voiceを「私たちが耳にする感情豊かで人間らしい声や、優れた聴覚」と表現している。これはすなわち「AFM 3 Core Advanced」によってもたらされる「Expressive Voices」や「High-Accuracy Dictation」のことを示している。 — WWDC26のキーノート内「Siri AI」のセッションで、Siri Voiceを「私たちが耳にする感情豊かで人間らしい声や、優れた聴覚」と表現した。これはすなわち「AFM 3 Core Advanced」によってもたらされる「Expressive Voices」や「High-Accuracy Dictation」のことを示している。
画像：Apple

Apple(アップル)

¥509,800 （2026/06/19 12:35時点 | Amazon調べ）

＼楽天ポイント4倍セール！／