オーディオ・音響分野専門家に訊くvol.3-2<br> オーディオ評論家麻倉怜士が切り込む 8K SOUND「ZE8000」を生んだfinalの研究体制Part.2 『犯人は接着剤?!』

オーディオ・音響分野専門家に訊くvol.3-2
オーディオ評論家麻倉怜士が切り込む 8K SOUND「ZE8000」を生んだfinalの研究体制Part.2 『犯人は接着剤?!』

オーディオ・音響分野専門家に訊くvol.3-3
オーディオ評論家麻倉怜士が切り込む 8K SOUND「ZE8000」を生んだfinalの研究体制Part.3 『視覚的な音!? 8K SOUNDって何?』
Reading オーディオ・音響分野専門家に訊くvol.3-2 オーディオ評論家麻倉怜士が切り込む 8K SOUND「ZE8000」を生んだfinalの研究体制Part.2 『犯人は接着剤?!』 1 分 Coming Soon


音に関連した多様な分野で活躍される方々をお招きし、弊社チーフサイエンティストの濱﨑が、「音」についての様々なテーマについてお話を伺う企画です。第3回目は、オーディオ・ビジュアル評論家の麻倉怜士氏をお招きし、弊社社長の細尾も加わり、ZE8000を生み出したfinalの音響研究開発について、鼎談いたしました。パート2は、『犯人は接着剤?!』です。


麻倉怜士氏

・ご経歴
オーディオ・ビジュアル/音楽評論家。津田塾大学&早稲田大学エクステンションカレッジ講師(音楽学)。UAレコード合同会社主宰。ハイレゾシーンでは普及の指導的立場にある。日本経済新聞社、プレジデント社(雑誌「プレジデント」副編集長)を経て、オーディオ・ビジュアル/音楽評論家として独立。津田塾大学では2004年から2023年まで音楽理論、音楽史を教えていた。2015年から早稲田大学エクステンションカレッジ講師(音楽)。HIVI、モーストリー・クラシック、PEN、ゲットナビなどの音楽雑誌、オーディオ・ビジュアル雑誌、ライフスタイル雑誌に音楽、映像、メディア技術に関する記事多数執筆。ネットではアスキーネット「麻倉怜士のハイレゾ真剣勝負」、AVウォッチ「麻倉怜士の大閻魔帳」を連載。音楽専門局「ミュージック・バード」では、2つレギュラー番組を持つ。CD、Blu-ray Discのライナーノーツも多い。著書は「高音質保証!麻倉式PCオーディオ」(アスキー新書)、「究極のテレビを創れ!」(技術評論社)、「ソニーの革命児たち」(IDGジャパン。アメリカ、韓国、中国、ポーランド、 チェコ版も)など数十にのぼる。

麻倉怜士氏



麻倉:私がZE8000を聴いてみた印象ですが、実に自然なんです。人為的に何かを強調したり、輪郭を強めたり、ドンシャリにしたりというところがまったくない。それからアンビエントというか、微小信号がものすごくよく出てくる。音がジャンと鳴った後のホールトーンが“こんなに入っていたの?”と思うほど出てきました。音の立ち上がりが早いというか音が明確に出る。明確と言ってもしゃきっとしているのとはちょっと違っていて、これまでのTWSイヤホンでは、強調的にシャキシャキという感じを作っていたような製品が多いのですが、これはすごく輪郭が立っているんだけど強調感は見えない。  特にベースがいいですね。これまでベースの音階感は、どうしても人工的な感じで強調されていました。低音は出ているけれど、ベースの音の中身がわからないというのが、多かったんです。でも、このZE8000はちゃんとわかる。しかも、そこに立体的なベースの体積感がある。なおかつ音階感が良く出ている。そこに私は感動しました。こういう音を成り立たせている技術的なファクターを、いくつか教えていただけますか?

濱﨑:一つは、先ほど(Vol.1を参照)もお話した、防水するために空気室を閉口すると低域が盛り上がってくるというところです。ここで出てくる話がマスキング[1]です。マスキングは、低い周波数帯域の音がより高い周波数帯域の音の聞こえを邪魔するので、低域が上がってくると、中域、高域が聴こえにくくなります。じゃあ何をするかというと、高域を上げていく。一般的に言われるドンシャリが生まれるわけです。ところが、いまおっしゃったベースの録音では、マイクロホンを立てたりライン出力もらったりして、音を作っていくわけですね。いわゆる重低音の解像度を高めていく作業を行っています。  麻倉先生がおっしゃった音階を聞き分けやすくするには、例えばウッドベースであれば、弦を指で弾くときのアタック感が大切なのですが、これがじつは中高域の特性に影響されるんです。録音では、音階がうまく聴こえるように調整していくんですが、せっかくそういうふうに調整されたものを、ドンシャリ過ぎる特性で聴いてしまうと音階が聴こえにくくなってしまいます。あるいはちょっとつま弾き感が強くなりすぎるということがこれまでは問題だったんです。

麻倉:不自然です。

濱﨑:それをZE8000では、低域が盛り上がるから高域も上げようみたいな“マスキングを回避するために周波数特性をいじることは止めましょう”としたことが大きな要因ではないでしょうか。

細尾:デジタル信号処理をやろうというときに、最初はPCをベースにいろんな実験をしていました。それで行っていると非常に素晴らしい効果はあるのですが、それは量産には活かせないんですよね。というのは、普通ドライバーユニットを量産するときの誤差は、頑張っても低域のアロウワンス(誤差許容量)は±3dBくらいになってしまうのです。これは、生産からすると常識で、それを±1dBにしてくれといっても、そんなユニットはとてもできないんです。そこを解決するために、2016年くらいから試行錯誤していました。その中で、振動板とエッジの接着に接着剤を使わないという製造方法に至ります。

麻倉:接着剤が犯人だった!

細尾:そうです。ドライバーユニットには接着剤が多量に使われるんです。いくら振動板に軽くて優れた素材を使おうと、一番重いのは接着剤。あとはエッジのところに、ボイスコイルからの引き出し線も接着剤で貼り付けてしまうんですね。ここは断線防止にどうしても必要なのです。そうすると振動板は正確にピストンモーションしなければいけないのに、一部に接着剤が付いているから、当然ローリング運動するわけです。ここをちゃんとやらないと、ということなんですが、そんな簡単にできなくて。それで4年~5年掛かりました。

麻倉:それは製造上の常識だと。それはもう当たり前なんですね。

細尾:当たり前です。

麻倉:その誤差を受け入れなかった。

細尾:そうです。いままで他社さんでも同じことを考えられた人がいるかもしれませんが、結局その補正に信号処理を使っている場合が多いと思います。じつは信号処理はプラスのことに使うんじゃなくて、ダメなところを補正するためにも使います。部品すべてに誤差がありますから、細かく補正すればするほど、その誤差の影響で補正すればするほど悪くなるんですね。製造に携わる方には「これで信号処理をやったら音が悪くなるよ」とおっしゃる方が多いです。

麻倉:それを徹底的に見直すというところに時間が掛かったわけですか?

細尾:そうです。接着剤なしに振動板を作るというのは、アイデアとしてはすぐ出るんです。でも、実際にそれができるまでには何年もかかってしまったし、生産機械そのものを替えることになりました。

麻倉:それを何年かかっても達成した。

細尾:そうですね。何年も掛かったものが、偶然、ZE8000の開発に活かされたということになります。

麻倉:振動板の革新と信号処理というか電気系統の革新が並行して走っていて、それが一緒になったと。

細尾:そうです。信号処理で周波数特性をいじるとき0.2dBですとか、そのぐらいほんのわずかな単位でいじるのに、ユニット製造で3dBの誤差があったらもう話にならないわけです。そこが結構難しくて。  また、いわゆるドライバーユニットを作る人たちは“メカ屋さん”と呼ばれる機械系の人たちです。信号処理とは、また別の分野になるので、普通の会社だと同じ目的に合わせて、一緒に改良するというのは、組織的にもかなり難しいことなんですね。それが実現したのは、会社が小さかったからというのと、私はどちらかというとメカの方と商品の全体像を考えています。そして、濱﨑はデジタル信号処理。2人いれば、かなり細かいところまで調整できる。そこが今回よかったところではありますね。

振動板断面図
振動板とエッジ(特殊シリコン製)は一体成型。コイルへの配線も空中配線を採用。正確なピストンモーションを妨げる要素を徹底的に排除している


写真右が代表取締役社長 細尾 満



麻倉:もう一つZE8000を聴いて感動したのは微小信号。製品によってはホールトーンみたいな音が、すぐになくなってしまうんです。これはスピーカーでもよくあることなのですが、ZE8000はものすごく細かな音まで出ているので、この音はどういう正体を持っていて、どういうふうに空気の中に消えていくのかという様子が、目に見えるようにわかります。イヤホンだからどうしても頭内定位になるんですが、頭内定位といっても音場の深さとか広さもよくわかる。ものすごく細かなところまで、きちっと位相管理されていて、しかも微小信号のところまで再生する性能が高いからだと思います。おそらく、その要因の一つとして、いまおっしゃったようなドライバーの改良が大きく影響しているのでしょう。

細尾:そうですね。歪みは従来品に比べて10分の1以下になっています。しかも、普通は100Hz以上の値なんですが、ZE8000は100Hz以下の歪率も10分の1から20分の1になっています。明らかにそこが寄与していると思います。

麻倉:なんというか音源の持っている音色がそのまま出ています。これまで聴いてきたTWSイヤホンとはまったくレベルの異なる音色再現なので、最初は戸惑うんだけど、よくよく聴いてみるとこっちが正しいと。正しいと思ったら、今度は自分の持っている音源をいろいろ聴いてみたくなる。  それでびっくりしたのは、私は大学で音楽を教えていて、そのときにMP3の音源を使うことが結構あるんです。それをチェックする時、他のイヤホンで聴くと、明らかにリニアPCMよりMP3は良くないんですけども、これは圧縮された音源であっても結構聴かせてくれるんですよ。その辺の音色に対する表現力にはちょっとびっくりしました。  先ほどの話はドライバーユニットでしたが、信号処理で特に力を込めたのはどういう点でしょうか?

濱﨑:そうですね。ZE8000における信号処理の研究開発は、湯山というデジタルオーディオ信号処理のエンジニアと一緒にやってきたんですが、彼とZE8000の開発が終わって話をしたのは、ちょっと言い方が悪いですけれど「信号処理を機械系、音響系の尻拭いに使わなかった初めてのケースだ」としみじみと2人で話したんです。細尾が言ったように、これまでは、どちらかというと音響アコースティックのところに限界点があって、例えば接着剤という問題で低域の歪みが多い。そこで信号処理を精緻にやっても、ドライバーの特性誤差によって音質が変わるので精緻にやった意味がありません。  ですから、ドライバーのアロウワンスが上がったので、真っ白の紙の上に自分たちがやりたいような信号処理を本当に0.1dBぐらいの刻みでやれたことが製品に展開できた。本当に音色を良くするためだけに、信号処理で徹底的に追い込めたんです。これは以前大手メーカーに勤めていた湯山も初めてだと言っていますし、私もとても面白い初めての体験でした。

麻倉:つまり、リニアリティの低いドライバーを前提にして“信号処理で助けましょう”みたいな感じだったのを、初めて信号処理の独立性というか、やりたいことができたと。

濱﨑:信号処理開発ではそこが一番大きかったんじゃないですかね。

麻倉:信号処理の一つのセオリーに逆補正があります。こういう特性であれば、逆の信号を使うことで直していく。それがより精密になったということですか?

濱﨑:そうですね。基本はデジタルフィルターという信号処理を使っています。FIR(有限インパルス応答)フィルター[2]IIR(無限インパルス応答)フィルター[3]を組み合わせて調整していくわけです。この処理を精緻に行なうことができたということです。あとは当然出てくる問題として、信号処理のアルゴリズムを追い込んだとき、どこまでバッテリーの容量をその処理に使えるか、使っているチップがどこまでの処理を許してくれるかという制限があるわけです。何をどこまでどう扱えば一番良いのか。この信号処理の調整に結構苦労しています。それが実現できたということも大きいと思いますね。

細尾:この開発では、私たちが目指す特性をはっきりと共有できていました。先ほどの逆補正をかけた調整でも、いくらそれをやったとしても目指す特性がないと方向が定まりませんから。

麻倉:目標の特性は、これまでとは大きく違ったんですか?

細尾:あまりに違うので、自分たちもこれでいいのだろうかというのはかなり自問自答したところでした。

技術主幹 濱﨑 公男



麻倉:さて、濱﨑さんはこの会社に入られて、ZE8000の開発で特にこだわったのはどういうところでしょうか。

濱﨑:イヤホン、ヘッドホンには、基本的な理屈があるんですね。スピーカーで聴いたときと同じ状態をイヤホン、ヘッドホンで再現する。それが従来の理屈です。それを今回、ある意味では、我々はスピーカーとの比較を止めたんです。あくまでも“イヤホンに最適な特性は?”ということを求めました。その結果、お客様にも戸惑いが生じたのかもしれません。それがプラスに受け止められれば、麻倉さんが感じられたような音の良さに行きつくんです。

麻倉:これまでのスピーカーの鳴り方や音場感を先生としてきたのが、今回はイヤホンの中ですべて完結する。具体的にどういう違いが出てくるんですか?

濱﨑:スピーカーを先生にするということは、スピーカーから音がどういうふうに耳に伝播してくるかというところを考慮するわけですよね。頭で回折しますとか、外耳や肩で反射するとか。

麻倉:頭部伝達関数注[4]ですね。

濱﨑:ええ。これは何をやっているかというと、いわゆるHATS(ヘッド・アンド・トルソ・シミュレーター[5])と呼ばれる、人の鼓膜部分にマイクを仕込んだマネキンを使いまして、それで頭部伝達関数を採るわけですよね。ところが、そのHATSによる頭部伝達関数は、私とも違うし、麻倉先生とも違う、いわばたくさんの人の平均値なのです。

麻倉:標準のマネキンなわけだ。

濱﨑:今まではそうする以外にありませんでした。それを今回はわきに置いて、“人間が音を聴くときに、何に着目をしているか”ということをスタートにしました。そこが大きな違いです。

麻倉:つまり、前提条件なしに耳で聴くことにこだわって、耳で聴いたときの最適な音を調整して見つけていくということですか。

濱﨑:最適な音に調整はしてないんですよ。あくまでも理屈ありきで、その理屈でいけるかどうかというやり方をしています。今回の開発で、ここに関わるある理屈を見つけましたので、もうちょっとエビデンスが揃ったら、きちっと学会で発表したいと思っています。現時点ではまだ十分なエビデンスがないので、堂々と言えないんですが、その理屈でZE8000はできています。ですから、その理屈のみで成り立っているのがZE8000の音なので、誰かが良いあんばいにEQで補正するということは一切していないんですよ。つまり、その理屈を皆さんに問うたということになります。

麻倉:学会で発表される前ということでリミットはあるでしょうが、どういう理屈なんですか?

濱﨑:一つはマスキングに対して、イヤホン、ヘッドホンの振幅周波数特性で補正していないということが大きなポイントです。それをやらなくても、人が音を自然に感じられるような特性を作れるはずだということです。この考え方を出発点として、研究によって生み出した理屈をZE8000で採用しました。

麻倉:私はずっとスピーカーを聴いてきましたが、ZE8000が他と違うなと感じるのは、映像でいうディレクターズ・インテンションが判ることです。これまでテレビは元の画像に対して強調していました。一番わかりやすいのは輪郭強調です。SDの時代は、プリシュートとオーバーシュートが両方出てしまうので白線が滲んだように広がってしまう。でも、輪郭を強調することで、そこそこしゃっきり見えるのが480Pの世界。それがフルHD、4Kとなってくると、輪郭をつけなくても、きちっとしたディテールが出る。だから、いまは輪郭を強調するというのはもう犯罪です。
テレビの世界は言ってみると、ものすごいアーティフィシャルな人為でもの作りをした世界から、自然な世界へ急速に移行しています。しかも、単に情報量の多さではなくて、つい最近のHDRでは光の情報量も違ってくる。要するに我々が眼で見ている世界そのものをテレビの中に再現しましょうということに対して頑張ってきているわけです。
考えてみると、低音でマスキングが起きるから、高音を信号処理でシャキッとさせなきゃいけない、その結果、素の音とはまったく違う人工的にでも輪郭を強調する音を作る。しかし、ZE8000で感じるのは、自然なので輪郭強調の必要がなくなった。それで何が出てくるかというと感情が出てくるんですよね。
私はUltra Art Recordというレーベルを運営しているんですが、そのレーベルで情家みえさんの曲集を作っています。その曲集の中で私がよくかけるのは1曲目の『Cheek To Cheek』。これは能天気で明るい曲で、情報量もたくさんあるし、歌は上手いし、山本 剛さんのピアノもちょうどいい感じなので、非常に良いリファレンスとして使っています。逆にリファレンスとしてあまり使わないのが、5曲目『You Don’t Know Me』です。オリジナルはエディ・アーノルドというアメリカのカントリー歌手が作った結構楽しい曲で、少年が女の子に恋をして、でも恋していることを君は全然わかってくれない、だから『You Don’t Know Me』。ところがレイ・チャールズがこの曲をカバーしているのですが、それは悲しみの極致みたいなアレンジになっている。このアルバムで情家みえさんは、レイ・チャールズ・バージョンを歌っているんですよ。これを2017年にポニーキャニオン代々木スタジオで録音したとき、特にマスタリングした時にはみんな泣いたというくらい感情がほとばしる曲です。情家さんの歌も素晴らしいのですが、山本 剛さんのピアノも悲しみの感情×2乗みたいな感じになっています。
感情というものは上位概念で、これを再生するには、まずはきちんとオーディオ特性がなければ駄目です。でも、オーディオ特性だけあっても駄目。ものすごく奥から引き出すものなんです。それがZE8000ではすごく感じられたんですね。そんな音が聴けたTWSイヤホンは初めて。そういう意味でもびっくりしたということです。
物理特性を徹底的に追求すると、特にリニアリティが影響していると思うんですね。きちんとリニアリティを作ったときに、新しい地平が出てきたというか、単に音楽を音として聴かせるのではなく、音楽を感情として聴かせられることができた初めてのTWSイヤホンだと思いました。

濱﨑:いま映像のお話があったので、ちょっと観念的な話になってしまうんですが、私たちがNHK技術研究所で8Kディスプレイを作ったときに、8Kカメラでオーケストラを撮ったことがあるんです。そのカメラは、ずっとパンもしなければズームもしない。そして、音は22.2chの3D音響で録音再生する。するとだんだんフルートがソロをすれば、フルートに自然と目がいくようになるんですよ。その方がすごく感動するんですよね。確かに音楽番組の様に指揮者のバックショットも見たいとは思うものの、この方が音楽に浸っていける。同じようなことで、ボーカルをこう強調しましょう、ベースをこう強調しましょうと、いわゆる過度な音作りをしてしまうと、若干感動する部分が抑えられてしまう。おそらく聴く人それぞれに、この部分を聴きたいとか、あるいはこういった気持ちにあう音楽を楽しみたい、ということを持ってらっしゃるからだと思うのです。
トランスデューサーは本当にフラットにして、あとはどこに着目するか、何を聴きたいかというのは、ユーザーさんにおまかせしようと。メーカー側がこう聴いてくださいと何かを強調するようなことは、止めた方がより感動してもらえるという考え方を持っています。

麻倉:まさにそうですね。回路で何かをやって新しいものを人工的に作っていくんじゃなくて、ソースが持っている感動量や情報性をありがままに、伝える。私はよく“情緒性”と言うんですけども、情緒と情報という日本語を考えると面白いんですよね。英語ではエモーションとインフォメーションと全然違う言葉なんだけれど、日本語で言うと情緒と情報は、「情け」が入っているのです。情けを報じるのがインフォメーションで、心を伝えるエモーションが情緒。その違いがよく出てくるんですね。つまり、オーディオの聴き方というのは、何が鳴っているのか、誰がやっているのか、みたいなことは情報性なんだけれど、情報性だけでは感動しない。やっぱり感動は情緒性や演奏家のエモーションなんですね。演奏家のエモーションが伝わるためには、まさにリニアリティがたいへん大事。心に届くまでの通路に障害物があったり、何か変なものがあったりすると、情緒性は消えていくんですよね。だからZE8000のすごさというのは、経路でまったく色付けや加工しないで、大元が持っている情報性、情緒性というのが、そのまま出てくることから来ています。
これはどちらかというとハイエンド・オーディオ世界の考え方です。ハイエンドの世界に行けば行くほど、トーン・コントロールがなくなっちゃうんです。大元の感動量が、何もダメージを受けないで聴けるというのが一つのハイエンドだとすると、ZE8000はそういう意味では非常にハイエンド的な考え方、ハイエンド的な聴き方ができる。いろんな音源を聞いてみると、その音源の良さというか、特徴とか“きっとこの曲はこういうことを伝えたいんだな”みたいなところがダイレクトに感じられる。そこが、おそらく技術開発を頑張ってやった成果じゃないかと思うんです。だからね、これだけ突出して音が変わると結構ユーザーさんも戸惑うんじゃないかと思うのです。

細尾:そうですね。ただ戸惑われているユーザーさんは、比較的イヤホンがお好きな方に多くて。従来のイヤホンの音は、先生がおっしゃるように輪郭線が描かれているところがある。それはスピーカーをベースにしているからなのか、いわゆる平均化されたHATSというものをベースにしているからなのか、どうしても輪郭線が必要だった。ただし、輪郭線が悪いわけではなくて、それはそれですごく楽しい世界ですし、そういった方向の技術革新も私たちは続けてやっていこうと思っているんです。
私たちはそもそもE3000の頃から、どのあたりが本当なんだろうかっていうのはあって、D8000というハイエンド・ヘッドホンを創ってみても、いわゆるお約束に乗ってない特性なんですね。ですが、非常に高い評価を得ました。私たちの仮説は正しいんじゃないかと結構自信になりました。ただD8000はアコースティックだけで、あの音を出そうとしたので物量投入が必要になり、50万円近いものになっていました。今回のZE8000は、割とハイエンドの音を民主化できたんじゃないかと思っています。いままでスピーカーで聴かれてきた人達や、イヤホンのマニアでない音楽ファンには、素直に受け入れられている感じがあります。時間をかけて聴いていただくことによって、戸惑いは解決することになるのかなと思ったりしています。

麻倉:これまでスピーカーで聴いていた人は、まだイヤホンの世界にはあまり来ていないでしょう。あえて来る必要はないとさえ思っている。だけども、これを聴いてみると“スピーカーの世界の延長だね”みたいなのがすごくあるので、イヤホン・ファンを広げるということにも繋がっていくのではないでしょうか。

麻倉:もう一つ、輪郭の話でとても面白いのは、絵画を見てみると輪郭が重要な役割をしているのは日本画ですが、最近で言うとそれがアニメの世界なんですよ。アニメの世界は、輪郭とフラット・サーフェスでできているわけですが、それも一つの芸術であって。逆に西洋絵画は輪郭がないんですね。輪郭がなくて、要するにディテールと階調だけで、あと色の違いだけで、バックと対象物と描き分けている。だから、輪郭が決して悪いわけではない。ただ途中で輪郭を付けるんじゃなくて、輪郭があるものはそのまま輪郭が出てくる、輪郭がないものは輪郭がなくても、ちゃんと立体的な音像で出てくる。そこがZE8000の画期的なところだと思います。だから、輪郭がなくてはならないという人は、最初は戸惑うと思うけれど、本当の音はこうだと発見する新しい方向もあると思いますね。



>>続きを見る:Part 3『視覚的な音!? 8K SOUNDって何?』


<<用語解説>>

[1]マスキング
マスキングとはヒトの聴覚における現象のひとつです。ある音が別の音を聴き取りにくくする現象のことを指します。聞き取りにくくする音をマスカーと呼びます。 マスキングが生じる要因のひとつとして、内耳における基底膜が鼓膜に到来する音波によって励振する過程から説明することができます。これによると、マスカーが純音の場合、マスカーの周波数より高い周波数の純音をマスキングしやすいことが理解できます。この現象は、交通騒音などに代表される低音のエネルギーが大きい環境音によって、ヒトの声が聞こえにくくなることで経験できます。また、録音された音楽を再生して聴く場合に、ベースやキックドラムなどの低音が大きすぎると、ボーカルや高音楽器が聞こえにくくなり、音楽のバランスを壊してしまう現象でも経験することができます。 マスキングは、ロッシーコーデックの聴覚特性として利用されるなど、デジタル信号処理においては重要な聴覚現象となっています。また音楽録音を行ううえでも、マスキングを理解することが重要です。

[2]FIR(有限インパルス応答)フィルター
FIR(Finite Impulse Response、有限インパルス応答)フィルターは、オーディオ信号処理においてよく使用されるデジタルフィルターの一種です。 FIRフィルターは、有限長のインパルス応答を持つフィルターで、入力信号に対して遅延、重み付け、加算などの処理を施すことによって、出力信号を求めます。FIRフィルターは、線形位相応答を持つため、入力信号の位相が変化することなく周波数特性を変えることができるのが特長です。 FIRフィルターは、周波数特性を正確に設計できるため、オーディオ信号処理において非常に重要な役割を果たしています。目標とする周波数特性が明確な場合は、FIRフィルターが多くの場合用いられています。例えば騒音を軽減するための逆フィルター処理や、スピーカーによる音再生環境での受聴点の周波数特性を任意の特性に補正する場合などがその例です。 FIRフィルターは、IIR(Infinite Impulse Response、無限インパルス応答)フィルターに比べて安定性が高く、位相特性が線形であるため、位相歪みの影響を受けにくいという特徴があります。 ただし、FIRフィルターはIIRフィルターに比べて、同じ周波数特性を得るためには、より多くの計算量が必要であり、入力したオーディオ信号と出力されるオーディオ信号との間にFIRフィルターのタップ数に応じた遅延が生じます。映像信号とオーディオ信号の同期(リップシンク)が必須な場合や、ゲーム等のインタラクティブ性が要求される音環境では、FIRフィルターを用いる場合は特にその遅延量に注意する必要があります。

[3]IIR(無限インパルス応答)フィルター
IIR(Infinite Impulse Response、無限インパルス応答)フィルターは、オーディオ信号処理においてよく使用されるデジタルフィルターの一種です。IIRフィルターは、過去の出力値や入力値に基づいて、現在の入力値をフィルタリングするためのフィードバック構造を持つフィルターです。 IIRフィルターは、FIR(Finite Impulse Response、有限インパルス応答)フィルターと比較して、同じ周波数特性を得るために必要な計算量が少ないため、入力されるオーディオ信号と出力される信号との間の遅延が少なく、かつ実装が簡単という特徴があります。また、高次フィルターの設計には、IIRフィルターがFIRフィルターより適している場合があります。しかし、IIRフィルターは、位相特性が非線形であるため、位相歪みが生じやすいという欠点があります。 IIRフィルターは、オーディオ機器のイコライザー(EQ)によく用いられています。FIRフィルターによるイコライザーではリアルタイムに音を確認しながらパラメーターを変えるということが難しいため、リアルタイムに音を確認しながら操作することが要求されるオーディオ機器のイコライザーにはIIRフィルターが用いられることが多いようです。

[4]頭部伝達関数
頭部伝達関数(Head-Related Transfer Function, HRTF)とは、人に到来する音波が、人の頭部周りの身体形状よってどのように変化するかを示す伝達関数のことです。したがって、到来する音波を発生する音源の位置に応じて、頭部伝達関数は変化します。 HRTFは、空間音響に関わるオーディオ信号処理において、重要な役割を果たしています。例えば、複数のスピーカーを三次元配置した3Dオーディオ再生環境で聴取できる音の空間印象と近似した空間印象をヘッドホンやイヤホンで再現するためのバイノーラルレンダリングなどに、この頭部伝達関数が用いられています。 HRTFを求めるには、ヒトを無響室の中に入れて、その周りに配置した様々な方向のスピーカーから測定信号を発生させ、ヒトの外耳道入り口あるいは鼓膜近傍に配置したマイクロホンで測定します。近年は、ヒトの身体形状を画像やスキャン情報から求め、その形状から境界要素法等によってHRTFを算出することも行われています。

[5]HATS
HATSは、Head and Torso Simulator(頭部と胴体のシミュレーター)の略称で、音響測定において用いられる人の頭部と胴体のみのマネキンのことを指します。HATSは、人の平均的な頭部、耳介、胸部の形状の模型であり、ヒトが任意の音場に入った時に鼓膜に到来する音波を推定するために用いられます。したがって、外耳道や耳介については特に精度高く模倣されています。一般には、鼓膜に相当する測定用の全指向性マイクロホンと外耳道を模したシミュレーターで形成される人工耳が頭部の左右に設置されており、このマイクロンを用いてさまざまな測定を行うことができます。 HATSは、オーディオ機器や音響システムの開発・評価において重要な測定機器のひとつであり、イヤホンやヘッドホンの研究開発にも用いられています。

一覧へ戻る