主要菜单

芯片厂家常用录音模块采集量化参考数据

    芯片厂家常用录音模块采集量化参考数据

    语音信号的量化参数

    采样率(f)、位数(n)、波特率(T)

    采样:将语音模拟信号转化成数字信号;

    采样率:每秒采样的个数(byte);

    波特率:每秒钟采样的位数(bit);

    1、采样率

    奈奎斯特抽样定理(Nyquist Law):要从取样数据信号中无失帧地恢复原数据信号,取样頻率应超过2倍数据信号最大頻率。取样頻率低于2倍频谱最大頻率时,数据信号的频谱有混叠。取样頻率超过2倍频谱最大頻率时,数据信号的频谱无混叠。
    声音的频带宽度为20~20k Hz左右,普通声音约为3 khz以下。所以,一般来说,CD的音质是44.1 k和16 bit,遇到类似乐器的特别的声音,音质也有可能变成48 k和24 bit,但不是主流。
    一般来说,当我们处理普通语音的集成电路时,采样率高达16K,而语音通常需要8K(例如电话音质)和6K。6K以下的效果相对较差。
    在单片机语音芯片的应用过程中,采样越高,定时器中断速度越快,这将影响对其他信号的监测和检测,因此应予以综合考虑。

    2、语音压缩技术
    由于语音数据量巨大,有必要对语音数据进行有效压缩,这样可以使我们在有限的只读存储器空间内输入更多的语音内容。有几种方法:
    语音分段:将语音中可以重复的部分截取出来,通过排列组合将内容完整地回放出来。
    声音采样(Voice sampling):一般来说,我们使用的扬声器频率响应曲线在中频部分,高频很少使用。因此,在扬声器的声音质量可接受的情况下,采样频率应当适当降低以实现压缩效果。这个过程是不可逆的,不能恢复到原来的样子,这就是所谓的有损压缩。
    数学压缩:主要是压缩采样位数的方式,这种方式也是可逆压缩。例如,我们经常采用的ADP cm压缩形式,将声音数据从16 bit压缩到4 bit,压缩率是4倍。 MP 3压缩数据流,涉及到数据预测的问题它的波特率压缩倍率为10倍左右。

    通常,上述录音模块压缩方法是结合使用的。