基础篇_8.音频编码MP3AAC_CMS教程

1、 VO与VOP概念的引入

传统的视频编码方式是将整个视频信号作为一个内容单体来处理，其本身不可再分割，而这与人类对视觉信息的判别法则，也就是大脑对视神经导入的视觉信号的处理方法是完全不同的。这就决定了我们不可能将一个视频信息完整的从视频信号中提取出来，比如：将加有台标和字幕的视频恢复成无台标、字幕的视频。解决问题的惟一途径就是在编码时就将不同的视频信息载体--视频对象VO（Video Objects）区分开，独立编码传送，将图像序列中的每一帧，看成是由不同的VO加上活动的背景所组成。VO可以是人或物，也可以是计算机生成的2D或3D图形。VO具有音频属性，其属性赋值可能quot;有"或者是"无"。但音频的具体内容数据是独立于视频编码、传输的。VO概念的引入，更加符合人脑对视觉信息的处理方式，并使视频信号的处理方式从数字化进展到智能化。提高了视频信号的交互性和灵活性，使得更广泛的视频应用和更多的内容交互功能成为可能。

现代图像编码理论指出，人眼捕获图像信息的本质是"轮廓－纹理"，即人眼感兴趣的是VO的一些表面特性，如形状、运动、纹理等。VO的表面往往是不规则的、千变万化的，但可将其视为一定视角下，n个形状规则的、具有一定纹理的剖面的组合的连续运动，这些剖面的组合称为视频对象面VOP(Video Object Profile)。VOP描述了VO在一定视角条件下的表面特性。VOP的编码主要由两部分组成：一个是形状编码，另一个是纹理和运动信息编码。VOP纹理编码和运动的预测、补偿在原理上同MPEG-2基本一致，而形状编码技术则是首次应用在图像编码领域。

在MATLAB里打开svd的源码可以看到只有一堆注释，最后写的是该函数为built-in function。事实上，MATLAB的矩阵计算使用的是Intel的MKL库（见之前我写的一个答案如何写出比 MATLAB 更快的矩阵运算程序？ - 过拟合的回答），这个库基本是现有BLAS/LAPACK实现中最快的了。svd是LAPACK中的标准运算，因此MATLAB实际是使用的MKL库来做svd。

MKL作为一个商业库，其算法细节和代码是不公开的，而且业界对于这种基本算法必然会有非常独到的优化，涉及到大量细节（算法本身的细节，以及代码层次的细节）。svd的经典算法有Golub-Kahan算法、分治法、Jacobi法几种，我推测MKL具体实现的是分治法。

以上就是关于基础篇_8.音频编码MP3\AAC全部的内容，包括:基础篇_8.音频编码MP3\AAC、预测编码的基本思想是什么、简述变化编码和预测编码的区别，以图像dct变换为例，描述变化编码的工作原理等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址:https://www.54852.com/zz/10114014.html

基础篇_8.音频编码MP3AAC

发表评论

评论列表（0条）