Mac業界の最新動向はもちろん、読者の皆様にいち早くお伝えしたい重要な情報、
日々の取材活動や編集作業を通して感じた雑感などを読みやすいスタイルで提供します。

Mac Fan メールマガジン

掲載日: 更新日:

Apple Musicの「空間オーディオ」が圧倒的な臨場感を実現できる理由

著者: 今井隆

Apple Musicの「空間オーディオ」が圧倒的な臨場感を実現できる理由

画像:Apple

※本記事は『Mac Fan』2022年4月号に掲載されたものです。

読む前に覚えておきたい用語

Appleによる空間オーディオとは?

私たちが普段、スピーカやヘッドフォン/イヤフォンなどで聴いている音楽や動画などの一般的なオーディオコンテンツは、家庭用のオーディオ機器やテレビなどのビデオ機器で再生することを前提に編集されている。

音楽や効果音などは多くの場合、複数のマイクを使ってそれぞれの音源から個別に(マルチトラック)収録され、それをミキサーなどで音源の位置や音質などを調整することで、ステレオ音源(2チャンネル)やサラウンド音源(5.1チャンネルや7.1チャンネルなど)などの「チャンネルオーディオ」に編集(ミックスダウン)される。

ミックスダウン時に想定されている再生環境は、ステレオ音源であれば一般的な家庭用スピーカだったり、サラウンド音源であれば映画館のオーディオ環境や家庭のサラウンド再生環境だったりする。このように従来のオーディオコンテンツは、ユーザの実際の再生環境を想定してあらかじめ編集されたものだ。

スピーカ再生(図左)の場合、スピーカからの直接音と部屋の反響音などが混じってユーザの左右両方の耳に届くが、ヘッドフォン再生(図右)の場合は左右それぞれの再生音が混じらず直接両耳に入るため、音場がユーザの頭内に形成されてしまう。

一方、Apple Musicの「空間オーディオ」で使用される「Dolby Atmos」はこれとはまったく異なり、音源データと音源の位置情報で構成されていることから「オブジェクトオーディオ」と呼ばれ、それを再生時に再生デバイスの特性に合わせてレンダリング(生成)する。

Apple Musicなどに採用された「空間オーディオ」では、あたかもユーザの周りを音が取り囲んでいるような臨場感を体験できる。これは音源の位置情報などから音場空間をDSPでシミュレーションすることで実現されている。


たとえば一般的な音楽ソースの場合、前面に配置されたステレオスピーカで再生することを前提に編集されているため、これをヘッドフォンやイヤフォンで聴くと頭の中に音像が結ばれ(頭内定位)、現実とは大きく異なるオーディオ体験となる。オブジェクトオーディオでは音源とその位置を情報として持っているため、これを再生時にヘッドフォンなどで自然なオーディオ体験ができるよう、再生デバイス側で音場空間を形成することができる。

音場の形成技術とは?

人が音を聞くとき、音源から直接耳に入る「直接音」だけでなく、周りのさまざまな物体から反射して届く「間接音」が混じった合成音を聞いている。また、左右の耳に届く音の量や質、到達時間差や位相差などから音の来る方向を敏感に感じ取ることができる。こうして人の脳には、音源とそれを取り巻く立体的な空間イメージである「音場」が形成される。


空間オーディオは、再生デバイスがユーザの再生環境に合わせて音場を作り上げる技術だ。たとえば、デバイスの内蔵スピーカから再生する場合には、各スピーカからの音がユーザの両耳に少し変化して届くが、その変化はスピーカの配置やユーザとの位置関係で決まる。空間オーディオはユーザのデバイス環境で自然な臨場感が得られるように、音場をリアルタイムに演算して生成する。

当然スピーカの配置やユーザとの距離はデバイスによって異なることから、再生デバイスの特性に合わせて音場形成のための演算パラメータを変更しなければならない。空間オーディオに対応するデバイスが限られているのは、再生するデバイスのオーディオ特性に合わせて音場形成を最適化する必要があるからだ。


音場形成はAirPodsシリーズのようなヘッドフォンやイヤフォンでは特に重要だ。これらのデバイスは再生音をダイレクトにユーザの耳に届けることから、スピーカでの再生とは異なり、部屋の反響など再生環境の影響を受けない。さらにスピーカ再生とは異なり、左チャンネルの音は左耳に、右チャンネルの音は右耳にしか届かない。

これこそがヘッドフォンで音場の違和感(頭内定位)が発生する原因だが、逆に言えば環境の影響を受けにくいことから空間オーティオの効果を最大限発揮できる。再生されるオーディオデータに適切な間接音を演算生成し合成することで、広大な屋外空間やコンサートホールなど、さまざまな音場空間を再現することができる。

ステレオ再生(図中)はユーザの正面に配置した2つのスピーカで音場を再現する。サラウンド(図右)は3つ以上のスピーカを用いて臨場感を増す方式で、図はフロントセンター、リアの左右、サブウーファを加えた5.1チャンネルの構成例。


Apple製品で空間オーディオが再生できるようになった背景には、DSP(Digital Signal Processing)性能の大幅な向上によるところが大きい。空間オーディオの再生時には、すべての音源オブジェクトから反射音を含む環境音をリアルタイムで計算してレンダリングしなければならない。再生環境が最近のアップルシリコン搭載デバイスに限定されているのは、このためだ。

リアルタイムに音場を形成する

ヘッドフォンやイヤフォンなどのウェアラブルデバイスで空間オーディオのリアリティを得るうえで欠かせないのが、ヘッドトラッキング技術だ。私たちが日頃体験している自然界の音場は、自分の姿勢や向いている方向に左右されない。つまり正面から聞こえている音は、自分が左を向けば右側から聞こえるはず。しかし、ヘッドフォンでは常に自分が向いた方向に音場が形成される。これは不自然だ。中でも動画コンテンツの再生では、映像と音源の方向が一致しないことから違和感が大きい。


空間オーディオでは、その技術を用いて音場を自在かつリアルタイムに任意の方向に移動できる。つまりユーザがどの方向を向いているかを検出できれば、ユーザの動きに合わせて音場空間を固定することができる。ヘッドフォンがユーザの頭部の動きをモーション(角速度)センサで検出し、これを再生デバイスにフィードバックすることで音場をリアルタイムに補正する技術が「ダイナミック・ヘッドトラッキング」である。

ユーザが長い時間顔を向けている方位を認識して音場を形成し、顔を動かした場合や再生デバイスを移動したときに、その角度や方向をセンサで検出して音場全体を逆方向に動かす仕組みだ。これによって映像と音声の方向を一致させ、ヘッドフォンでの視聴における違和感を低減し、コンテンツに没頭できる音場空間を作り出している。

iPhoneやiPadなどで映像つきのコンテンツを視聴している場合、「ヘッドトラッキング」に対応したデバイス(AirPodsシリーズなど)では、ユーザが頭を動かしたりデバイスを移動しても音場がリアルタイムに映像に合わせて追従する。


空間オーディオは、Apple Musicなどのコンテンツサービスを通じて提供されており、Apple IDを持つユーザなら無料トライアルが可能だ(Apple Musicは最大1カ月)。手元にAirPods Proなど空間オーディオ対応ヘッドフォン/イヤフォン、あるいはiPhoneやiPadシリーズなどの対応デバイスがあれば、誰でも簡単に空間オーディオを体験することができる。ハイファイやハイレゾとは異なる、新しいオーディオ表現の世界をぜひ体験してみてほしい。

AirPods Proのロジックボード上には、ノイズキャンセリング機能を実現する強力なDSPを内蔵した「Apple H1」プロセッサのほか、加速度センサやヘッドトラッキングを実現するためのジャイロ(角速度)センサなども搭載されている。

おすすめの記事

著者プロフィール

今井隆

今井隆

IT機器の設計歴30年を越えるハードウェアエンジニア。1983年にリリースされたLisaの虜になり、ハードウェア解析にのめり込む。

この著者の記事一覧