頭部伝達関数の概要とそれによる IID, ILD の「前後・上下のくべつができない」という問題の解決,頭部伝達関数を使用した 3D 化のさまざまな計算法,頭部伝達関数の測定についてのべる.
HRTF と HRIR
ITD, ILD だけによる音の立体化には「前後・上下のくべつができない」という問題がある.この問題を解決するため,HRTF (Head-Related Transfer Function) を導入することができる. これは,耳殻,人頭および肩までふくめた周辺物によって生じる音の変化を伝達関数として表現したものである. HRTF の例を図 1 にしめす. この図は CIPIC データベースにおけるダミーへッドによる測定データにもとづき,音源が正面 (方位角 (azimuth) 0°),右横 (方位角 90°),背面 (方位角 180°),左横 (方位角 270°) にあるときの右耳の音特性をえがいたものである.
HRTF は線対称な音源に対してもことなるため,音源の特性があらかじめわかっているときには前後・上下のくべつが可能である. たとえば図 1 においては音源が正面にあるときと背面にあるときとの差がしめされている. しかし,耳殻や人頭などの形状は被験者 (subject) ごとにことなるため,前後・上下のくべつを正確にするためには被験者ごとにことなる HRTF を用意する必要がある. HRTF を被験者にあわせることによって,より正確なくべつができることが実験的にしめされている [Beg 00]. なお,HRTF においては ITD, ILD もそのなかにくみこまれているため,これらを独立にあつかう必要はない.
HRTF ということばは図 1 (1) にしめしたような周波数領域における表現に対してつかわれるが,これをフーリエ変換して時間領域において表現したものを HRIR (Head-Related Impulse Response) という. これは,1 個のインパルスを発生させたときの応答特性である. 図 1 (2) には図 1 (1) の HRTF に対応する HRIR の例もしめした.
(2) HRIR
図 1 HRTF と HRIR の例 (CIPIC データベースの small pinna 右耳のデータによる)
2. HRTF による 3D 化の計算法
HRTF または HRIR を使用してある音源からのモノーラル信号を 3D 化するには,その音源の方向によってことなる,すなわち方位角ごと仰角ごとにことなる HRTF (または HRIR) を選択し,ちょうどその方向のものがなければ補間をおこない,そうしてえられた HRTF によってもとの信号とを入力して複数のチャネル (たとえばバイノーラルにおいては左耳のためのチャネルと右耳のためのチャネル) に関してフィルタリング計算をおこない,結果としてえられた複数チャネルの信号をヘッドフォンまたはスピーカーによって再生する. RAT (Robust Audio Tools) における計算においても HRTF を使用しているが,これは音源が正面にあるときの HRTF だけを使用していたので,方向ごとにことなる HRTF を使用する本来の計算法とはことなっている.
HRTF または HRIR のデジタル・フィルタとしての表現法およびその計算法としてはつぎの 3 つの方法がある.
- 1) FIR (有限インパルス応答) の時間領域における計算
- HRIF はデジタル・フィルタとしては標本化周波数 8 kHz のばあいで 20~30 のフィルタ長をもつ FIR (有限インパルス応答) として表現される. HRTF を再生音に反映させるためには入力信号に関するフィルタのたたみこみ (convolution) 計算が必要である.
- 2) FIR (有限インパルス応答) の周波数領域における計算
- 時間領域における計算より計算量をへらすために開発された方法であり,入力信号を高速フーリエ変換 (FFT) してから HRTF をかけあわせ (たたみこみではなく単なる積の計算をおこなえばよいので計算量ははるかにすくない),高速フーリエ逆変換によって時間領域の信号にもどす方法である.
- 3) IIR (無限インパルス応答) による計算
- 計算を時間領域でおこないながら計算量を減少させるために IIR を使用する方法も多数の研究において提案されている [Huo 97].
第 1 の方法においては,時間領域においてたたみこみ計算をおこなうとフィルタ長の 2 乗の計算量を必要とする. そのため,標本化周波数が 8 kHz のときはよいが音楽再生で通常使用されている 44.1~48 kHz にすると膨大な計算を必要とする. これに対して第 2 の方法においては,データ長を n とすると n log n に比例する計算量ですむ. そのため,オーディオ製品などにおいてはこの方法が多用されている. たとえば,W. Gardner らによる Wave Arts 社の製品 Wave Surround [Wav] においても周波数領域における計算法が使用されている. しかし,フーリエ変換は時間を捨象するため周波数領域において信号を加工すると容易に因果律に反する効果がとりこまれる. また,遅延をさけることが困難である.
3. HRTF の測定結果とその利用法
比較的最近まで,なまみの人間の HRTF を正確に測定することは困難だった. また,特定の頭部・耳殻などの形状に依存しない結果をえるためには人間をつかった測定はかならずしも適切ではない. そのため,おおくの研究において HRTF はダミーへッドを使用して測定されてきた. その代表例が Gardner [Gar 94a] が MIT メディア研究所においておこなった測定結果である. 音響測定用のダミーヘッド・マイクロフォンとしては KEMAR (Knowles Electronic Manikin for Acoustic Research) とよばれるものがもっとも有名であり,Gardner も KEMAR を使用している. 一方,被験者ごとの HRTF の測定例としてもっとも有名なのはカリフォルニア大学の CIPIC データベース [Alg 01] である.
参考文献
- [Beg 00] Begault, D. R., “3-D Sound for Virtual Reality and Multimedia”, NASA/TM-2000-XXXX, NASA Ames Research Center, April 2000, http://human-factors.arc.nasa.gov/ihh/spatial/papers/pdfs_db/ Begault_2000_3d_Sound_Multimedia.pdf
- [Alg 01] Algazi, V. R., Duda, R. O., Thompson, D. M., and Avendano, C., “The CIPIC HRTF Database”, Workshop on Applications of Signal Processing to Audio and Acoustics, IEEE, 2001.
- [Gar 94a] Gardner, B. and Martin, K., “HRTF Measurements of a KEMAR Dummy-Head Microphone”, MIT Media Lab Perceptual Computing – Technical Report #280, 1994.
- [Huo 97] Huopaniemi, J. and Karjalainen, M., “Review of Digital Filter Design and Implementation Methods for 3-D Sound”, Preprint 4461, 102nd Convention Audio Engineering Society, 1997.
- [Wav] WaveSurround User Manual, Wave Arts.