May 31, 2020

ジッター再々考

前回、サンプリングパラメータによるジッターの影響の差異についてという、大仰なタイトルのエントリーを上げたんだけど、ない頭でいろいろ考えている。
繰り返し色々考えているので、今回のタイトルは再々考ということだ。アベノマスクもまだ届かないのに我ながら暇なことだ。

前回のエントリーで僕は「PCトラポによるアップサンプリングもジッター対策だと考えて使ってきている。そもそもハイレゾ音源で音が良くなるのは、それ自体がジッター対策になるからだ」と書いた。
ずっと、そう考えてやってきていた。

それが、どうも違うんじゃないかと考え始めている。
違うというか、考えが足りないと。
今回は、その不足分を追加する試みだ。
でも思いつくままの書き散らかしでとっちらかって、例によって科学的な正確さとは縁がない文章なので、世の中では意味がない内容かもしれない。そういう意味では、アベノマスクのいいかげんさを笑えないエントリーだ。

前回エントリーの試聴では、アップサンプリングと、仮想アースによるFGの安定によって、音がどう変わるかを確認したのだけど。
色々と、考えを改めることになった。
うちのデジタルオーディオに纏わる「仮説」についての話だ。

まず、PCトラポでアップサンプリングすることの意味について。
ジッター対策というよりも「アナログ音声の情報量」への貢献のほうが大きいのではないかと思うようになった。
情報量って、アップサンプリングでデジタルなデータ量が増えるのは当たり前(44.1/16から768/32だと30倍以上)なんだけど、データ量=情報量とかいう、そういう話ではない。

以前は、アップサンプリングに伴って情報量が増える理由について、ジッターの影響が少なくなり、DA変換の正確性が向上することによるものだろう、と考えていた。
最近、考えるようになったのは、デジタル信号から変換されるアナログ音声信号の「振幅」の正確性への影響だ。
DA変換後のアナログ信号の振幅が、より正確に再生されるようになることで、音声の情報量が増加するのではないか、ということ。

わけがわからんね。
もう少し整理していく。

録音に際してアナログ音声は、サンプリング周波数で決められた時間間隔でサンプルされ、デジタルデータにAD変換されている。
サンプルされたデータがアナログ出力にDA変換された信号電圧の数値は、サンプルされた時点の数値はデジタルデータ自体から正確に数値化して変換すればいいのだけど、サンプリングされていない、サンプル間のアナログ出力電圧の数値は、DACチップによる補間で決定される。
補間というか、要するにサンプリング定理に則ってDA変換される過程で、サンプル間をつなぐアナログの電圧の値(振幅)がDA変換によって決定される。

NOS DACだとアップサンプリングなし、補間されて得られる数値は、たしかローパスフィルターの品質に影響されるのかな(違っていたら御免なさいだ)。
通常のDACだと、DACチップによるアップサンプリングを行うので、その品質にも影響される。もしもZOH、Linearなど低品質なアップサンプリングを行うDACチップがあったとしたら、十分に正確な振幅値の抽出が難しく、正確なアナログ波形再現が望めないのではないか。
低品質なアップサンプリングでも理論上は音質上の問題は全くないという説明を何処かで何回か読んだのだけど、僕には難しくてよく分からなかった。

ZOH、Linearなど低品質なアップサンプリングを行った場合、下図のようになる。

本来、DACチップが理論通りに働くなら、アップサンプリングに伴う音質の改善を考慮する必要はなくて、NOS-DACの音質はどうとかいう話もないはずなのだ。理論通りにいかないから、どうしようDACチップでアップサンプリングしようというような話に現実のチップがなっている。
そういう現状なのに、ZOH、Linearみたいなアップサンプリングでも音質に影響しないとは、個人的には中々信じられない。実際、PCトランスポートでZOH、Linearといった設定にしてアップサンプリングした場合、DACがADI-2 DACだと明らかに音質低下がある。むしろそんなことはしないほうがいい。

どのような方法にせよ、サンプル間が補間されて電圧が生じないと問題がある筈。
各々のDACチップなりの手法で電圧出力しているのだろうと思う。

そもそも、その補間自体が正確ではなくて、電圧に時間軸の変動があったり電圧自体の誤差があったりしたら、どうだろう。
そうした変動は、たぶんジッターとして再生音に作用する。
つまり、時間の流れのままに変動しているアナログ再生波形として考えた場合、時間軸の変動も電圧の誤差も、結果として出てくるのは「アナログ波形の乱れ」にしかならないので、区別すること自体ができないのではないか、だったら「ジッターの影響」で括られるのではないか、と思うからだ。

ちょっと、DACチップの気持ちになって、アナログ波形を出力してみた図。

我乍らひどい。
あんまり人に見せられないな、怒る人いるんじゃないかな。
実際には、このようなことにはなってないだろうとは思うのだけど。

それはともかく、PCトランスポートで良質なアップサンプリングをしておけば、DACチップによる補間の影響は小さくなる。
元のアナログ波形をPCでシミュレートし、その波形シミュレーションの振幅変動の数値から、新たなデジタル信号をサンプル数を増やして作り出し(そういうアップサンプリングをするということだけど)、そのデジタル信号をDACに伝える。
再生されるアナログ信号がよりAD変換前の信号に近い正確なものとなる。

アップサンプリングしてやらないとサンプル間の電圧が正確に再現されない(断言してるけど仮説だ)。
再生波形の歪みは20kHZとか聴取可能限界以上で生じるんだろうけど、再生音全てに影響すると思う。

正確なサンプルが増えることで、正確な音声信号の「振幅」の再現が可能になる。
より正確なアナログ波形の再現は、音楽の情報量を増やすことにつながる。
これはハイレゾ音源を使用する場合にも当てはまるだろう。

ここまで書いて、ひっくり返すような話だけど、ふつうに44.1/16の信号をDACチップ通したら、オシロスコープでは問題ないアナログ波形が表示される、というのを過去に何回か何処かしらで読んだことがある。つまり、アップサンプリングしたら正常なアナログ波形が得られるというのは、違うのだという。

しかし、じゃあオシロで正常な波形が出ていれば音質に問題がないかといえば、たぶんそうじゃないんだよね。ジッター対策なんか何もしなくたって、オシロの波形は正常でDACから音は普通に出るのだ。
そしてそういう音にオーディオファイルは満足できない。
僕は何を聴いているのだろう、ということになるのだけど。何が一体、どうなってるんだろうね、、、
DACチップに上記のような問題があるというのも仮説で、ジッターがどのようにDACチップに作用するのかもよく分からないのだけど。

次に、仮想アースによるジッター改善に伴い、再生音の音楽性改善がみられることについて。
驚いたのは、アップサンプリングによるよりも、PCトランスポートの仮想アースによるジッター低減のほうが音楽性の改善効果が大きかったことだ。まあ、驚くことじゃないと言われたらそうなんだけど、想定以上の音の変化があった。

ここでいう「音楽性」とは、音色の鮮度、色彩感、生命感といった感触。音色の自然さ、リアリティも含めたいところだが、前回の試聴では逆に不自然に感じられたケースがあり、ことは単純ではないみたい。改善するのが「音楽性」という漠然とした表現しかできないのも難しいところ。
サンプリング周波数には関係なく、ジッター改善に伴い再生音の音楽性の改善がみられる。

さらに今回、新たに気付いた。
サンプリング周波数が一定なら、ジッター改善に伴う音質向上に際して、基本的には情報量の向上は伴わない。

本当に?
いや、でも、なんだかそんな感じだよね?
ちょっとこれは僕にとっては意外なことだった。

僕は今まで、ジッターが改善され音質が良くなれば情報量も増えると、勝手に思い込んでいた。
考えてみたら、うちのオーディオの音質改善は、かなりの場面でアップサンプリングと足並み揃えていたので、「ジッター改善」に伴う情報量の増加について、ちゃんと意識し比較したこと自体がなかった。あるいは、音色が綺麗になって聴き取り易くなったのを「情報量が増えた」というように表現した事も、もしかしたらあったかもしれない。

今回の試聴で、情報量と音楽性、パラメータが2つになって、ちょっと、今まで何してたの?、という気持ちにもなったりしてるんだけど、、、ともかく、ジッター改善に伴う音質改善が、音声の情報量増加につながらないらしい?のは、僕にとってはかなり意外で困惑した。音楽性の向上は情報量の向上によるものと、ずっと考えていたんだからね。

そもそも、アップサンプリングの有無によってDA変換後の情報量が変わるということ自体が、理論的には有り得ないことだ。
デジタルデータはサンプリング定理に沿って再生されれば正確に再現される、理論的には。
現実にはそうはいかない。
ならばジッターを低減さえすれば理想的な再生に近づくに違いない、と考えていた。アップサンプリングで音声の情報量が増えるのは、アップサンプリングによってジッターの影響が減ることで理論的なDA変換に近づくから情報量が増えるのだ、と思っていた。
だけど今回、どうも、ことはそう単純ではない?という考えに至った、ということだ。

ジッターが改善したら「音楽性」が改善するが、音声の情報量は増えない。
正確なアップサンプリングを行うことで、CD音源に含まれている本当の情報量を引き出すことが出来る。

逆に言えば、情報量の向上がなくてもジッターの低減によって再生音の「音楽性」の向上を目指すことは出来る。
また、アップサンプリング自体にジッターの悪影響を減らす作用がある、という以前からの考えは、今でも妥当ではないかと思っている。アップサンプリングで情報量の向上だけではなく、音楽性の改善も得られるからだ(仮想アース程ではないけれど)。

しかし、どんな挙動がどのように作用しているかは分からない。
過去に僕の考えをアップしたことはあったが、当時から科学的な根拠がある論考ではなかったし、当時の考えだけでは足りなかったと思ってこんなエントリーを上げてはいるが、科学技術的根拠がないという意味では相変わらず机上の空論のままなのだ。

今回、更に、もしかしたらと思ったのは、データのサンプリングパラメータによって、ジッターの影響の現れ方が違い、音質劣化の聴こえ方も違うのではないか、ということ。だけど、なんだか手に負えない感があるし、そろそろ息切れ気味なので、今回はここまで。

Edit this entry...

wikieditish message: Ready to edit this entry.
















A quick preview will be rendered here when you click "Preview" button.