数年前まで,あたらしい音声メディアをつくるという目標にむかっての研究を中心として仕事をしてきた. それによって研究としては成果をあげてきたが,実用になるものをつくることはいまのところできていない. その理由はいろいろあるとおもうが,そのなかでもおおきな理由は人間の耳をいかすメディアをつくることがむずかしいということだとおもう.
これはおおきな問題なのでもっとしっかり論じるべきだが,ここではとりあえず,いまおもいつくことを書いてみたい.
いまの電話では人間の耳をいかすことができない. そのためにコミュニケーションがうまくいかないことがしばしばある. その問題を解決するために,あたらしい音声コミュニケーション・メディアをつくりたい. それが,まだありもしないメディアに voiscape というなまえをつけて研究をはじめた動機だった.
voiscape のアイデアは比較的単純であり,既存の技術をインテグレートすることでつくれるはずだった. しかし,やってみると,人間の感覚は微妙なものであるのに対して現在われわれが手にしている技術はすごく粗いものであり,うまくあわせることがむずかしいことがわかってきた. そんなことはずっと音の研究をやっているひとにとってはあたりまえのことなのだろうが,私にとっては,やってみてはじめてはっきり意識するようになった.
技術の粗さゆえにうまくいかなかったところは,つぎのようなところである. このなかで 「両耳聴の個人差」 は研究的な課題であってよくとりあげられるが,実際にはそれ以前の 「サウンド機能の失敗」 や 「増幅率の調整」 がよりおおきな問題であるようにおもえる. 「話者どうしの環境のちがい」 も重要だが,あまり問題にされていないようにおもわれる.
- サウンド機能の失敗
- 電話機であれば音がでなくなることはまずないが,あたらしいメディアの実験の際や,PC ベースの実用化をかんがえると,しばしば音がでなくなるという事故が発生しうる.
あたらしい機器を導入する際にはサウンド・ドライバなどで問題がおこりうるし,すでに調整ずみのはずの機器でも,たまたまミュートしているために音がでない,あるいはちいさいということがしばしばおこる.
ミュート機能やボリウムは 2 カ所以上にあることがおおい (たとえばコントロール・パネルと PC 本体の機械的なボリウムなど) し,受信側と送信側の両方にあるので,それを全部さがしだして調整しなければならなくなる. これはしろうとには困難な仕事である. しかも,いったん調整しても,なんらかの原因でふたたびくるってしまうことがある. - 増幅率の調整
- 距離感や方向感を実現するコミュニケーション・メディアとしては,相手の声のおおきさがうまく調整されなければならない.
ところが,それをさまたげるさまざまな原因が存在する.
まず,口とマイクとの距離が一定でないしマイクによって感度がちがうので,マイクがひろう音のおおきさが一定にならない.
また,途中の機器によって音量がかわってしまう.
もっとも単純なばあいでも,送信側と受信側のコンピュータのサウンド機能に依存する.
このように増幅率の調整が必要になる機器においては,増幅率を自動調整する機能がつかわれることがおおい. しかし,自動調整することによって距離感はうしなわれてしまう. - 話者どうしの環境のちがい
- 騒々しい環境としずかな環境とのあいだでコミュニケーションするとき,認知的に困難な状況が発生する.
騒々しい環境にいるひとは大声で話をするが,それをそのまましずかな環境につたえると耳がいたい.
しかし,その音をちいさくしてしまうと,距離感が不正になる危険がある.
逆にしずかな環境にいるひとは小声で話をするので,騒々しい環境にいるひとには増幅しないときこえない.
しかし,増幅するとやはり距離感が不正になるおそれがある.
1 対 1 でのコミュニケーションにおいてはまだよいが,多対多のコミュニケーションをめざすメディアにおいては,2 人以上の話者のあいだの音量やノイズのちがいなどが認知的な問題をひきおこすのではないかとかんがえられる. - 両耳聴の個人差
- HRTF (頭部伝達関数) は個人ごとにあわせれば方向感や距離感をかなりただしく再生することができることがしられている. しかし,平均的な HRTF をそのままつかうと,くるいが生じる. これはよくしられている現象である.
- 他のアプリケーションとの音量差 (2008-10-21 追記)
- これは voiscape そのものの問題とはいえないが,voiscape とくらべると他のアプリケーションのほうがずっと音量がおおきいことがおおい. そのため,voiscape のために音量をおおきくしていると,他のアプリケーションをつかったときに不快になる. これは,通常の音声アプリケーションはダイナミック・レンジがせまいことに起因しているとかんがえられる. voiscape においては距離感をだすために十分なダイナミック・レンジを確保する必要があるため,どうしても音量がおさえがちになる.
すでに事業化されている Polycom RealPresence のような会議室に固定するタイプのビデオ会議システムにおいては,機器や環境を固定することによって,上記の問題のおおくを解決している. しかし,携帯電話がつかわれるような環境でつかえるようにしようとすると,解決がむずかしくなる.
認知的な問題や両耳聴の問題は研究としてとりあげやすい. しかし,それだけでなく信頼性のあるサウンド機能や増幅率を容易に調整できるしくみの開発ができなければ,人間の耳をいかしたメディアをつくることはできず,これまでどおり電話のユーザ・インタフェースをつかいつづけざるをえないとかんがえられる.