人类对不同的声音频率有不同的感知。例如,可以听到的频率是从20赫兹到20 kHz;参见Hearing range。
如equal-loudness contours所示,不同的频率也具有不同的灵敏度;另请参阅Loudness。这在测量人类感知的响度时是相关的,例如参见ReplayGain。
然而,我猜对于人类感知的信息密度来说,图表不一定是相同的(如果你可以这样叫它的话)。例如,可能有一些频率被感知为很大,但感知到的信息密度并不是那么高。我不确定是不是这样。是吗?或者它基本上是一样的?也许我对它的理解也太天真了。
根据我天真的理解,MP3的工作原理(和其他有损音频编码)是,它为更重要的频率存储了更多的信息,而为不太重要的频率存储了更少的信息。“更重要”意味着人类感知的信息密度更高。
(Meta:也许StackOverflow不是问这个问题的最佳SE站点。哪一个会更好呢?)
发布于 2012-11-28 09:52:51
心理声学感知的“信息密度”很难定义。然而,恰好可微的基音轮廓(例如,Mel scale)接近。它不是基于对音高/频率的感知响度,而是人类听觉系统感知不同音调/注意频谱中音调最小变化的能力。如果“信息”是听觉事件的基音/基本频率,则Mel比例描述每个频率的“信息密度”。
在这种情况下,您是对的,因为Mel比例与响度无关,尽管与某些频谱相关。有些频率被认为是响亮的,但这种感知的“信息密度”并不像你说的那么高。
然而,感知到的响度本身就是信息,对于这一点和其他影响信息成功传输到人类听觉系统的心理声学因素,你可能想看看Critical Bands,特别是Auditory Masking。
https://stackoverflow.com/questions/13588508
复制相似问题