PCCでより重要な「TurboQuant」の役割
iPhoneなどのデバイス上だけでは難しい処理とは、たとえば大規模な世界知識が必要、より高い計算能力が必要、といった場合だ。そんなときには、パーソナルクラウドコンピュートが利用される。
Apple Intelligenceではユーザのリクエストがデバイス上で処理できるか、PCCに送って処理が必要かを「オーケストレーション」アルゴリズムによって判断する。

画像:Apple
PCCではより大きなLLM(大規模言語モデル)を動かし、膨大なユーザからのリクエストを同時に処理する必要がある。そこではさらに多数の大きなKVキャッシュが必要になり、膨大なメモリとシステムリソース、そして電力が消費される。
となると、すべてのユーザからのリクエストに応えつつ実現可能な規模のシステム構成を実現するには、TurboQuantのようなメモリ圧縮技術が欠かせない。でなければPCCの運用コストはAppleにとって、そして世界にとっても大きな負担となるからだ。
おそらく、AppleはGoogleとのAI基盤に対する提携において、Geminiの基盤技術のみならずTurboQuantなどの圧縮技術の採用も見通していた可能性がある。
すべてのAppleデバイスユーザがより強力で賢いAI基盤を利用できるようになるためには、その消費リソースを低減するための圧縮技術は欠かせないキーパーツだ。新しく生まれ変わるSiriやApple Intelligenceがどんな世界を私たちに見せてくれるのか、それは2026年6月のWWDC 26で明らかになるだろう。


おすすめの記事
著者プロフィール








