オーディオ評論家 麻倉怜士が切り込む 8K SOUND「ZE8000」を生んだfinalの研究体制 Part.3 『視覚的な音? 8K SOUNDって何?』

オーディオ評論家 麻倉怜士が切り込む 8K SOUND「ZE8000」を生んだfinalの研究体制 Part.3 『視覚的な音? 8K SOUNDって何?』

オーディオ評論家 麻倉怜士が切り込む 8K SOUND「ZE8000」を生んだfinalの研究体制 Part.1 『定説を疑う』 Reading オーディオ評論家 麻倉怜士が切り込む 8K SOUND「ZE8000」を生んだfinalの研究体制 Part.3 『視覚的な音? 8K SOUNDって何?』 1 分
音に関連した多様な分野で活躍される方々をお招きし、弊社チーフサイエンティストの濱﨑が、「音」についての様々なテーマについてお話を伺う企画です。第3回目は、オーディオ・ビジュアル評論家の麻倉怜士氏をお招きし、弊社社長の細尾も加わり、ZE8000を生み出した finalの音響 研究開発について、鼎談いたしました。パート3は、『視覚的な音? 8K SOUNDって何?』です。

↓ 下記より動画でもご覧いただけます。


細尾:いままでソースは、イヤホンを対象にしているというと、いまのイヤホンの特性をベースに作られているんです。逆にメジャーなソースはそうではないですよね。空間的なところを信号処理によって付けるソースなんかだと、むしろこちらの方が信号処理を生かすことができている。これは私たちだけが正しいと言っているわけではなく、おそらく潮流なんだろうなと思っています。非常にメジャーな製品の中で、そういう製品が既に存在していますから、実際に私たちとかなり似た考え方を持っている会社もあると思っています。これはもう既に存在している未来。新しさはあるんですけれど、必ずこうならざるを得ないだろうなと思っています。

麻倉:聴いてみたときの感じ方を、自然か不自然かということから考えてみると、やはり人間は自然な世界に住んでいるわけで、自然の音楽を聴いて我々は楽しんでいるのですから、その方向にZE8000は行っています。テレビの世界がSDから8Kまでより自然になってきたというのと、ZE8000が不自然なところから自然に向かって行くのは、TWSイヤホンの新しい潮流と完全にリンクしていると思いますね。
今回、このZE8000を指して8K SOUNDという言葉を作られています。なかなか発想がすごいよね。これはどういういきさつで作られたんですか。
細尾:濱﨑はかつて8Kの映像に関わっていますが、私もNHK放送技術研究所が毎年行っている技研公開で、小さめのモニターでしたが、8Kを初めて見たときに感動もしたんです。でも、よくわからないというか、自分の知覚を超えた感じもありまして。しかも、かなり近くで見たものですから、視野全部が8K画像に入ると、それまではフルHDを見ていて良い映像になんだと思っていたのが、違っていたことに割と戸惑ったんです。
その話をしたところ、社内で同じことを思った人間が結構いました。ZE8000も、社内で聴いてもらっても、すぐに最高だという意見を言う人と「良いのかどうか、よくわからない」と言った人間に分かれまして。でも、数日聴いていくと、やっぱり良いというんですね。この感覚は8K映像を見た時に近いなと。
また、じつはZE8000の音色や空間を的確に表現する言葉が、いくら議論しても出なかったということもあります。これだけ論理的に作っているのに、むしろ論理的に作ったからかもしれませんが、高域が綺麗とかそういう言葉が当てはまらない。それが8K SOUNDという言葉を作ったことによって、みんなが腑に落ちたというところがありました。

麻倉:映像もSDから2Kに行って4Kに行って8Kに行って、いろんなことが変わったんですよね。解像度も変わっているし、ビット深度も8bitから最大12bitになるし、HDRでダイナミックレンジが広大になり、色の再現範囲もガンマというんですけども、これも広がってくる。階調、コントラスト、解像度、解像感、そして色再現性といろんなところが進化しているんです。
特にSDと8Kを比べて違うのは、表面的には解像感なんですが、階調感が一番違いますね。bitで表せるという階調感というよりも、感覚的な階調感。どのぐらい細かなグラデーションのシャドウが入っているか。しかも、それが大面積じゃなくて、どれだけ小さな面積に入っているか、というところが8Kなんです。それで見てみると、ものすごく感動する。実物感というかリアリティという言葉に、スーパーを付けてもいい。


麻倉:実は最初に8K SOUNDと聞いたときに、何を言っているのかよくわからなかったんです。しかし、実際に聴いてみると、ナチュラル感と共に細かな音から大きな音に対する音の濃淡の違いがすごく出るんですよ。しかも、その濃淡はいろんなディメンションがあって多層的になっている。だから、まだ聴いたことの無いような音が出ています。この“聴いたことがない”とは言葉のあやで、コンテンツの中に入っているものが、ちゃんとそのまま出てきたというところでは、まさに8K SOUND。8K映像のアナロジーみたいなところから出てきたと思いますが、本当にうまく音の良さというものを表していると思いますね。8K的な階調感、特に色の階調感ですよね。音色とはよく言ったものです、色が付いているんですよね。コンテンツが持っている色合い、色の濃度みたいなところもよく違いを出してくれます。

細尾:音色に奥行きのある感じが、おっしゃっている階調感に近いかもしれません。ここは私たちもイヤホンで初体験した部分でした。ここも8K SOUNDという一つの根拠になっています。

麻倉:細かな情報に生命感があるかないかというところは重要なところで、良い8Kの番組を見ていると画の中にビビッドな生命力を感じるんですよ。ZE8000もそういうところがあって、これも私がよくリファレンスで使っているオイゲン・ヨッフム指揮ボストン・シンフォニーの『シューベルト:交響曲第8番「未完成」』という曲があります。誰が演奏しても『未完成』は素晴らしい曲なんですが、特に最初のメロディを奏でるチェロの膨らみ感。音像があって、そこからフワッと出てくるときの音の出方が、立体的で風船が膨らむように、つまりこちらにも来るんだけども、球状に音が拡がっていく。音の流れ、音の空間感といいましょうか、ダイナミックな空間の動きがすごくよく出ています。それは、決してZE8000が表現しているわけではなくて、音源に入っている元々の音像の立体感が、やっとTWSイヤホンで聴けたという感じですね。作ってみて聴いてみてどうですか?

濱﨑:いま空間のお話がありましたが、私も8Kディスプレイで特に印象に残っているのは、平面なのに非常に奥行き感を感じられたことです。奥行き方向というと、現在の技術として一般的なものは、ステレオスコピックという左右の輻輳差で出す技術で、ある意味かなりギミックな奥行き感になってしまいます。それより、8Kの平面ディスプレイではとても自然に奥行き感が感じられるんですね。いま麻倉先生がおっしゃっている話、ZE8000の音色の階調感、非常に自然なところというのは、おそらく8Kディスプレイに奥行きを感じる我々の視覚と同様なことが聴覚にも当てはまるということではないかと思います。私達は自然さを与えて、後は聞く人がその感覚で感じる。
私達にはまだまだやるべきことはたくさんありますが、私もZE8000から出てきた音を最初に聴いた時に、スピーカーに近い体験がするなと感じました。それは頭内定位とか、輪郭とかいう言葉で表せない、これまでとは異なる体験でしたが、自分が音楽ソースの中身を感じられやすくなる音が、ようやく出せたとのではないかと思いました。

麻倉:ZE8000は音の感情がよく出るとか、奏者の思いが出ると言いましたが、最近私がよく聴いているのが『シューベルト:ピアノ五重奏曲「鱒」』。アンネ=ゾフィー・ムターがヴァイオリンを弾いて、ダニール・トリフォノフがピアノを弾いているバージョンが、ものすごく面白いんですよ。
何が面白いかというと、奏者みんなが“私は神様よ”“私が王様だ”と思いながらガツンと弾いている。アンネ=ゾフィー・ムターが出てくるときでも、私は女王よという感じで、すごく前に出てくるし、また、ダニール・トリフォノフもチャイコフスキー・コンクールで優勝した人で、ピアノがものすごく際立つんですよ。また、その時々でチェロです、ヴィオラですと、出てくる。その間にオブリガートがちょこちょこっと入るんですよね。例えばダニールがメロディを弾いているとき、オブリガートをムターがやるんだけども、ムターが主役になるようなオブリなんですよね。
昔からよく言われていることは、巨匠同士が集まったときには成功するか失敗するか2つあるという。うまくいくときには良いんだけど、失敗するときはみんな俺が俺がとなってしまう。その俺が俺ががまさに出ています。それがZE8000では、演奏家5人の思いがすごくわかる。表現力がないと、何か統一されたような綺麗な音楽になってしまうのですがね。
もう一つ、このアルバムが最高なのは、そういうバラバラの個性の戦いみたいな曲があるかと思うと、逆にものすごく統一された曲もあるんです。それが『シューベルト:セレナーデ』。これは『鱒』とは対照的に、誰も主役にならず相手を立ててシューベルトの世界を形作っています。プロデューサーの意向か、演奏家の意向かわからないけれど、私は演奏家の考えなんだと思います。その違いや考えが本当にZE8000を聴いていると面白いぐらいに出てくる。
やはり表現力が、ものすごく多彩に、ものすごく情報量としてあるんだけども、決してイヤホンが操作していない。やはり大元のものがまさに8Kのように、そのままクリアにこちらに来る。ただ8Kと言っても、我々が見ている8K放送というのは、圧縮に次ぐ圧縮で100分の1ぐらいに圧縮しているので「なんだこれが8Kか」というものもあるんだけども、ベースバンドの映像を見るとまったく違います。そういう圧縮した8Kじゃなくて、ZE8000が伝えているのは、NHKが撮ったばかりの本当に生々しい映像と同じような感覚が来るという感じがしています。

細尾:開発している人間には、大手で信号処理をやってきた人間が移ってきたり、あとは学校で音響工学やった人間が新卒で入ってきたりしているんですけど、じつは濱﨑は上司でもないような形なんですね(笑)。上司が存在してないような組織としていまして、バラバラであまり言うことを聞かない人ばかりなんですが、ムターの『鱒』ではないですが、俺が俺がというチームを濱﨑が……。

麻倉:まとめていると。

濱﨑:いや、まとめてもいないですね(笑)。細尾の意向もあり、finalには研究の計画書もないんですよ。あなたはここまでやりなさいというのではなくて、それぞれが自分の視点でやっている。それこそ去年入ってきた社会人1年生と同じ視点で話ができる環境です。というのも、明らかに彼らの方が私よりも最新のことを知っているわけです。私が大学で学んでいたのはもう40年前ですから(笑)。自由に話せるとすごく面白いですよ。
ただし、最終的になにかを判断しなければならない場面で、「これは止めよう」「これはやろう」ということは必要ですので、そこで私が自分の経験から物を言うくらいですかね。たぶん他社でこういう研究開発のスタイルを行っているのはほとんどないのではないでしょうか。さらには、営業やバックオフィスの人たちとも一緒になって、いろんな話ができるのは新鮮です。私たち研究者に「自分たちは研究だから」という意識はないですね。ZE8000も手を動かしたのは技術の人間ですけれど、会社に属するみんなの思いがまとまっている。そこがこのfinalという会社の非常に独特なところじゃないでしょうか。

麻倉:研究開発や技術開発は、会社ごとに一つの風土みたいなものがあります。きちっと目標を決めて、頑張らなきゃいけないところもあれば、実用化研究までしなければいけないとか。でも、finalの場合は、風土的にすごく研究開発を重視されている。

濱﨑:実は、私も最初は正直に言って戸惑ったんです。

麻倉:NHKとずっとずいぶん違うなと(笑)。具体的にどのような働き方なんですか?

濱﨑:一般に研究開発は、短期、中期、長期と期間毎の計画を作るんです。そこに向かって研究を進めていくのですが、私も入社して、最初に計画書を作って「こうしませんか?」みたいな話をしたんです。

麻倉:従来通り、まず計画書を作ったんですね。

濱﨑:はい。ところが計画通りにまったく動かないわけですよ。とはいえ、いろんな状況の変化がありながらも、ここは商品化に向けて集中的に研究開発しようというような山ができますよね。その山に向かって、みんながいろんな引き出しを用意しておいて、さあ行くぞとなったときにアイデアを出しながら一気にその山を登っていきます。通常はそのためにネタを仕込むわけですが、それが個人個人で違うベクトルで動いているんです。

麻倉:そのネタは個人が決めているんですか?

濱﨑:細かいところは個人が決めていますね。全体にぼやっと方向性というものはあるんですが、明確に「この四半期はこうしましょう」というような計画書はないですね。いまはこの辺を攻めていこう、とかいうことで研究していきます。

麻倉:一つの縛られた中で頑張っていくというのではなくて、自発的にやりたい方向をやるということですね。

濱﨑:そうですね。楽しくというと言葉は違うと思いますけど、興味があることを深堀りできるという環境だと思います。

麻倉:ネタに関して言うと、上司として「これはいいんじゃないか」みたいなことは、言うんですか。

濱﨑:私は上司ではないんですよ(笑)。私はこの会社では4年生ですが、1年生とまったく同じ目線です。何かを指示して誰かが動くという命令系統があるわけではないですね。細尾との会話では、「こういうことをやってみましょうか」「finalはこの辺の技術に強いので使いましょうか」という話はしますけれど、研究開発のみんなにこうしなさいというような立場ではありません。


麻倉:4年経ってみて、やはりそういう方法は効果的だと感じますか?

濱﨑:効果的ですね。正直に言って、研究は時間が掛かるので、研究途中で商品が出るわけです。このZE8000に関する研究も、まだ終わっていないんです。純粋な研究の立場から言えば“この技術を出すのは、ちょっと待ってください”というところもあるんです(笑)。
でも、よく社内で脳内開発と言うのですが、頭の中でストーリーを考えて、仮説を立てて、仕組みを考える。それでいけるなと思ったら、製品として出していこうとなる訳です。その後、我々としては論文にしなければいけないので、きちんと科学技術的なエビデンスを作っていきます。
例えばE500という製品では、コンテンツ制作者が意図した通りの空間音響が、いわゆるイマーシブ・バイノーラル・サウンドで、そのまま聞こえますよという製品を研究開発したんですが、その理屈に関する論文を出したのは発売して3年後の2022年10月でした。

麻倉:普通はどのくらい掛かるんですか?

濱﨑:基礎研究では論文を出すまで少なくとも数年かかります。2022年10月に韓国で行われたICA(国際音響学会)は3年に1回の開催なので、たまたまぴったり間になってよかったんです。でも、製品より論文発表が遅れるというのは、たぶん普通の会社なら許してくれないでしょうね(笑)。

麻倉:なにか目に見えない統一感があって、研究員がやりたいことをやれる。でも、商品化が最も重要なステップですからね。商品化と基礎開発がうまく結びついていると。当然ZE8000に関わる研究も将来があるわけだから、より高度な研究までいったときには、それをまたスピンアウトするということになりますね。

濱﨑:ありますね。

麻倉:単に商品企画としてのもの作りというよりは、研究開発の成果発表会みたいなところがありますよね。面白い。

濱﨑:まさしくそうですね。学会の評価の前にお客さんに評価していただくみたいなものです。私たちもすごくやりがいがあって“思い通りの反応が来たな”という部分と、“ここはそういう評価になるのか”みたいなところがあります。

麻倉:やりがいとおっしゃいましたけども、だいたい商品化まで見ないから基礎
研究する人はやりがいがないんですよ(笑)。なんのために研究をやっているんだ、みたいな話を聞いたことがあります。

濱﨑:大きい会社ですと、研究、製品開発、営業、マーケティングと部門ごとに組織が異なります。そもそも開発と研究のところも、なかなか相容れないですよね。我々はR&Dとは言っていますけど、基礎研究もあれば、商品開発もあれば、自分たちでコンテンツを作ってTwitterに出すとかもやっています。私はこの会社に入るまでTwitterとかいじったことなかったんです。

麻倉:面白いね(笑)。天下の濱﨑がTwitterをやっている。

濱﨑:そういう意味では、なんというか面白いというか、finalは身動きしやすいですね。逆に、計画を作ると縛られてしまいます。いまは研究開発のスピードがものすごく速いので、1年前に決めたことが、1年後には成り立っていない可能性もあります。でも、過去にやったことは、いずれ役に立つんですよ。それを続けなければいけないですし、時流を見ながら気がついたことがあればやってみる。だから、研究内容は凸凹はしているんですけど、トータルで見ると間違いなく一つの方向に進んでいるなという感じを持っています。

麻倉:耳の話とか脳のリアクト(反応)なんかは、まだまだわかってないことが多いじゃないですか。音響心理学なんていう分野は最近の話です。深堀りしていくと新しい知見が出てきて、研究開発でわかったことをまた商品化する。PDCAじゃないですけれど、そういうサイクルができている感じですね。

細尾:私もODM事業をやってきて、大手の研究開発のやり方、基礎研究をせっかくやっているのに、それがなかなか商品できないところなど、いろいろと拝見させてもらって、その反省を活かしています。あとは、人間って面白いと思っていることをやるのと、“一応1年掛けてやるけれど、そんなに意味がないな”と思っているのでは、おそらく数十倍以上生産性が違うんですよ。

麻倉:違いますよね。

細尾:こういう商品を創ろうという考えは、みんなそれなりに思っているんです。未来はこういう技術潮流になるだろうと。実際にどうやるかというのは、割と自分で決められるし、手伝ってというのも柔軟にしてくれる。うちに入って2年目の女の子が、濱﨑さんに「これやっといてください」と言うんですよ。“おおすげえな”って思ったりしますけれど。すごいのが、濱﨑さんも「わかりました!」とやることですね(笑)。

麻倉:やっちゃうのね(笑)

濱﨑:たぶん私は根っからの研究者じゃないんですよ。もちろん研究をやっていますけれど、キャリアの最初は録音ですから。音楽録音は、向こうに演奏家がいて録音技術を使いながら瞬時に判断していきます。その癖がついているんじゃないですかね。だから、私もそれ相応の歳なので、重たい荷物を運ぼうとすると「いいです。やります」とか言われるのが一番悔しいんです(笑)。率先して荷物とか運びたいんですけど。
やはり若い人たちの視点ってすごく面白いですよね。持っている知識も違っているし、考え方も変わっている。先日、東京藝大の亀川教授と対談したとき(final Labにて公開)に、自分たちが学生の頃と何が違うかという話になって、昔は各自で常時使えるコンピューターがなかったことが今と最も違うことだと二人で納得しました。
驚くのは検索の使い方ですね。自分たちは、どちらかというと書籍を読んで、少しずつ知識を貯めていきながら考えることをしてきた。いまはすぐに検索。信号処理もいろんなツールが世の中にあるので、それを組み合わせて使っていく。この能力は圧倒的に長けています。そこはもう我々は敵いません。
あとは私たちの経験やどちらの方向に行った方がいいかという判断を、うまく組み合わせていけば、若い研究者は伸び伸びと楽しくやってもらえるんじゃないかなと思っています。

細尾:みんなが同じ立場で議論するためには、ツールが必要だと思っています。特性の計測についても、自分達でソフトウェアを完全に作っていまして、ほとんどPC上で事前にエミュレーションできるんです。そうすると、同じものを見て、同じ音を聴いてやるので、あまり議論が分かれないんです。

麻倉:共通なんですね。


細尾:あとはDSPというと、そもそも実験するためのプログラムを組むのが、昔は8割から9割の時間が掛かって、実際の試行錯誤は1割ぐらいしか取れなかったんですね。そこもかなり良いツールを導入しまして、プログラムを書く作業を9割ぐらい減らしています。あとは物理シミュレーターも導入しました。このシミュレーターを使って、色々とシミュレーションしたいなと思っていたら、東大の大学院で流体のシミュレーションをやっていた人間が入ってきたりして。めっちゃシミュレーターが使える(笑)。

麻倉:ぴったりですね。

細尾:“なんでそんなピッタリの人が入ってくるんだろう?”というようなことがあります。そこで私がやらなければいけないのは環境整備。若い人が自由に伸び伸びやるためには、例えばPythonというプログラム言語を使うことを制約しない。会社によって「Pythonは、汎用的に使えなかったりするから使っちゃだめ」と言われるんです。でも、私たちは属人性でもいいから自由にやれと。じつは技術のミーティングは、私も出ていまして、出ているんですけれど、3分の2はあまりわかってないんです(笑)。わかってないんだけど……

麻倉:基本的な方向が分かればね。

細尾:はい。研究の方向を知るために“予算はどこにいるのかな”“環境整備は何がいいのかな”と考えながら聞いているんです。私が行列計算の途中からわからなくなっていたら、入ったばかりの新人が、「ここだけ見ていれば大丈夫ですよ」とPower Pointで解説してくれたので、めちゃくちゃわかりました(笑)。
最近は大きな会社から転職してきたり、新卒も必ずしもオーディオではない人が入ってきたり。でも、オーディオをやってこなくても、音響は物理と数学ですからね。学生時代に音響を研究していなくても、さきほどの流体シミュレーションをしていた人の様にいきなり活躍できる環境になっていると思います。

麻倉:今日はいろいろな面白い話を聞かせてもらいました。結論を言うと、やはり経営から出ていますね。経営から、つまり会社そのものからZE8000が発生しているなと思いました。製品は単に技術を集めたというだけではなくて、研究する人間がはつらつと研究開発をして、しかも基礎研究を非常に大事にしています。しかも、なんか楽しくやる基礎研究というか。私はどちらかというと応用研究の方が楽しいというイメージを持っていますが、finalは基礎研究が応用研究に繋がっていて商品化にも繋がる。それだけじゃなくて、あまり制約がなくて自分のやりたいことができる環境がある。力の入り方というのは、自分が本当にやりたいことと言われて作るのとではまったく違いますからね。
そういうものの集積が製品になって表れている。そういう会社のあり方、会社経営のあり方そのものから、ZE8000のような傑出した製品が出てくる。その辺を理論的に納得いたしました。

細尾:ありがとうございます。褒められて嬉しい感じがします。

麻倉:傑作はこれで終わるわけではなく、基礎研究ができて、ある時期になったらそれがまとまって出てくる、次の製品も大変期待できると思います。今日は、ありがとうございました。

濱﨑&細尾:ありがとうございました。



用語解説

[1]ステレオスコピック
ステレオスコピック(Stereoscopic)、あるいはステレオスコピック3D(Stereoscopic 3D)とは、両眼に1対の画像を独立して提示し奥行きを感じさせる立体視を作り出す技術だが、自然な立体感は得られにくい。一般には、左右の目にそれぞれ独立した映像信号を提示するために、特殊な立体視用メガネを必要とする。立体視用メガネには、左右に赤青のカラーフィルタ入れたもの、左右に異なる偏光レンズをいれたもの、左右に映像のフレーム周波数に合わせたシャッターをいれたものなどがある。現在は、メガネ無し立体映像ともよばれる、より自然な立体視を得られる方式も研究開発されている。

[2]イマーシブ・バイノーラル・サウンド
前後・左右・上下の音像移動や空間の拡がりを感じられる三次元音響をヘッドホンやイヤホンで聴取できる音である。イマーシブサウンドは、通常、複数のスピーカーを前後・左右・上下に立体配置した三次元マルチチャンネル音響システムで聴くことができる。この三次元マルチチャンネル音響を構成する複数のモノ信号を、聴取位置を基準点として、各モノ信号の三次元方向位置に合わせてHRTF(頭部伝達関数)を用いて2チャンネルのバイノーラル信号に変換(バイノーラルレンダリング)した音が、イマーシブ・バイノーラ ル・サウンドである。

[3]ICA(国際音響学会)
ICA(International Congress on Acoustics、国際音響学会)は、国際音響委員会 (International Science Council)が、音響学のあらゆる分野における国際的な発展と 協力を促進するために開催する国際学会であり、その第 1 回目はは1953 年にオランダの デルフトで開催された。それ以降、3年ごとに世界各地で開催されており、前回は2022 年に韓国で開催され、次回は2025年にアメリカ合衆国のニューオーリンズで開催される予定である。

一覧へ戻る