一、MPEG-2压缩技术在解码器中的应用分析(论文文献综述)
秦莉文[1](2021)在《鲁棒数字水印性能优化方法研究》文中指出近年来,随着互联网和多媒体技术的飞速发展,数字信息以图像、视频、文字等形式被广泛传播。多媒体数据易被非法获取和篡改,从而导致严重的信息安全问题,例如版权纠纷、数据泄露等。作为多媒体数据版权保护的一种有效方法,数字水印技术在不影响视觉效果的情况下,将标识信息嵌入到多媒体数据中,从而利用提取的嵌入信息确认版权。本文针对最广泛使用的多媒体数据载体,即图像和视频,研究了不同嵌入规则下的鲁棒盲水印方法,优化其在水印图像质量、水印提取准确率和实时性上的性能,取得的主要研究成果如下:(1)提出一种基于空域最小可觉差(Just-noticeable Difference,JND)模型的视觉优化图像水印方法,解决了水印图像的非纹理区域存在明显视觉失真的问题。首先,利用空域JND模型约束每个空域像素的改变,并引入差值图像方差约束相邻像素的改变,然后构建一个优化问题求解最优的水印嵌入强度,这与空域的人眼视觉特性相符。与经典的基于DCT域JND模型的图像水印方法相比,相同PSNR下,所提方法的水印图像和宿主图像之间的SSIM更高,水印图像视觉质量更高。(2)提出一种基于多尺度特征的鲁棒图像水印方法,该方法利用深度学习提高了水印图像质量以及水印提取准确率。首先,在水印嵌入网络中,冗余嵌入水印信息。然后,引入具有不同大小卷积核的Inception-Res Net网络,更好地融合水印信息和宿主图像。同时在水印提取网络中,利用Inception-Res Net网络获取多尺度的特征,提高水印提取准确率。最后,采用两阶段的训练方法,保证水印图像质量的同时增强鲁棒性。在COCO数据集上的实验证明,与经典的Hi DDe N方法相比,所提方法提高了抵抗攻击的鲁棒性,水印提取准确率平均提高6.4%。(3)提出一种基于帧差的高效视频水印方法,解决了当前视频水印方法难以抵抗几何攻击、实时性低的问题。首先,修改相邻视频帧U通道每个像素嵌入1比特数据,同时引入空域JND模型约束修改量以确保水印视频质量。该方法在不进行几何矫正的情况下,通过计算帧差对水印信息进行盲提取,降低了计算复杂度。在标准视频序列上的实验证明,该方法可以抵抗严重的几何攻击。而且,与变换域视频水印方法相比,在相同嵌入容量和PSNR下,所提方法对于1080p视频的水印嵌入和提取速度提高了3倍以上。
裴航[2](2021)在《基于申威421处理器的视频解码SIMD优化技术研究》文中研究指明随着互联网的高速发展以及第五代移动通信技术的到来,各个领域对多媒体品质的要求日益提高,视频作为多媒体的关键载体其高清质量的高效压缩逐渐成为研究热点。H.264视频编解码标准作为发展比较成熟的编解码格式,一直应用于人们生活的各个场景。但H.264视频编解码标准在拥有更高编解码质量的同时,带来的是编解码复杂度的增加,导致视频解码性能降低,影响用户的多媒体视觉体验。为满足国产申威平台用户的多媒体需求,推进申威处理器生态软件的发展,对H.264解码器的移植与优化有着很重要的意义。申威421是国产第三代多核处理器,其搭载的SIMD指令集体系非常适合多媒体程序的并行优化。本研究首先对H.264解码器的开源程序FFmpeg进行移植,H.264解码器在申威平台移植后遇到解码效率低,视频播放不流畅等问题。为提升视频解码性能,对FFmpeg开源编解码库中H.264解码器进行了详细分析,使用性能分析工具找到视频解码的瓶颈函数。然后充分利用申威处理器的SIMD扩展部件,对解码器帧间运动补偿、去块滤波、反变换等关键模块代码进行向量指令替换来缩短指令周期,实现关键模块算法的SIMD并行计算,从而提升多媒体程序运行速度。实验平台基于申威421处理器及搭载Debian的Linux桌面操作系统deepin15.5。实验结果表明,在保证没有损失视频品质的情况下,模块化效果测试中帧间运动补偿模块的性能提升最为明显。对于解码器的整体优化效果,优化后的视频解码性能最高提升了35.3%,对于高分辨率的视频序列播放更为流畅。在一定程度上表明了申威SIMD技术对于多媒体应用的性能提升是有效的,解决了视频播放不流畅问题,有效的推动了申威处理器市场化发展。
王洋[3](2019)在《基于深度学习的视频编码技术研究》文中进行了进一步梳理随着通信技术、互联网技术的发展和移动终端、智能设备的普及,数字广播电视、互联网视频、视频会议、远程医疗、远程教育等传统多媒体应用以及3D视频、虚拟现实视频、短视频等新兴多媒体应用丰富着人们的日常生活,但同时也使得视频数据呈爆炸式增长,给数据存储和网络传输带来巨大挑战,如何稳定高效的存储和传输海量的视频数据成为目前亟待解决的问题。数字视频压缩技术在视频数据压缩处理中扮演关键角色,数字视频压缩技术在通信、计算机、广播电视等领域的广泛应用促进了数字视频编码标准的产生和发展。目前,已经发布的最新的数字视频编码标准HEVC和AVS2虽然能够满足高清和超高清数字视频的压缩性能需求,但是,随着人工智能的发展和5G时代的到来,更加庞大的视频数据量对视频编码标准提出了更高的要求,因此,在现有数字视频编码标准的基础上进一步提升压缩性能十分必要。近年来,随着深度学习的发展,以卷积神经网络为代表的深度神经网络在计算机视觉、语音识别、自然语言处理等计算机领域都取得了令人瞩目的成果,利用深度学习提升视频编码的压缩性能不仅能够为未来的数字视频编码标准提供技术储备,而且是目前视频编码领域的前沿问题和研究热点。本文从利用深度学习提升视频编码技术的压缩性能角度展开深入研究,涵盖了数字视频编码标准框架中的帧内预测、帧间预测以及环路滤波三个主要模块。具体的研究内容分为以下三个部分:第一,本文提出了基于多尺度卷积神经网络的帧内预测算法,用来提高视频编码中帧内预测的准确性。基于方向插值的帧内预测方法广泛应用在现有的数字视频编码标准中,这种方法能够很好的预测具有主方向纹理的图像块,但是对于复杂纹理的图像块或者方向性较弱的图像块不能获得较好的预测效果。为了提高现有视频编码标准中的帧内预测的准确性和为下一代视频编码标准的制定做技术储备,本文提出了基于多尺度卷积神经网络的帧内预测方法。具体来讲,本文提出的算法由两个子网络组成:多尺度特征提取网络和复原网络。将基于方向插值的帧内预测生成的预测块与其相邻的L型重构像素组合为更大的图像块输入到多尺度特征提取网络,然后将输入图像块进行下采样并提取不同尺度的特征图,最后对特征图进行上采样恢复到原始尺度。复原网络用来聚合不同尺度的特征图,并利用卷积操作生成最终更准确的预测块。实验结果表明,与HEVC参考软件HM 16.9相比,本文提出的帧内预测算法能够获得3.4%的BD-rate节省。第二,本文提出了基于深度神经网络的帧间预测算法,用于提高数字视频编码中帧间预测的准确性。现有的数字视频编码标准中的帧间预测是通过运动估计和运动补偿技术从参考帧获取当前预测块,基于平移运动的运动估计技术不能处理自然视频中的更复杂的变化,如非线性亮度变化、模糊、缩放等。为了提高视频编码中帧间预测的准确性,本文提出了基于深度神经网络的视频编码帧间预测算法,旨在利用当前块邻近的L型重构像素、参考块邻近的L型重构像素提高帧间预测的准确性。具体来讲,本文提出的方法包括三个子网络:关系估计网络、组合网络、深度提纯网络。关系估计网络用于学习当前块与其参考块之间的关系。组合网络用于提取学习到的关系和参考块的特征图,然后将这些特征图连接在一起。深度提纯网络用于生成最终更准确的预测块。实验结果表明,与HEVC参考软件HM 16.9相比,本文提出的帧间预测算法能够获得4.4%的BD-rate节省。第三,本文提出了基于卷积神经网络的环路滤波算法以及基于GPU的环路滤波并行优化算法,前者旨在利用卷积神经网络提升环路滤波的编码性能;后者旨在降低环路滤波的编码复杂度。环路滤波在现有的数字视频编码标准中扮演十分重要的角色,不仅能够去除编码过程中产生的块效应、振铃效应,提高重构视频的主观质量,而且能够提高视频编码的压缩性能。本文从两个方面对环路滤波展开深入的研究。一方面,从提高环路滤波的编码性能入手,本文提出了基于卷积神经网络的环路滤波算法。具体来讲,本文提出了一个全新的卷积神经网络结构,利用编码过程中产生的边信息(如块划分、残差以及运动矢量)结合重构视频本身来提高环路滤波的性能。实验结果表明,与HEVC参考软件HM 16.9相比,本文提出的帧间预测算法能够获得4.6%的BD-rate节省。另一方面,环路滤波的较高复杂度是HEVC在实时编码应用场景中的瓶颈,为了降低环路滤波的编码复杂度以及考虑基于深度学习的视频编码架构使用CPU+GPU的多设备协同编码,本文提出了基于GPU的环路滤波并行优化算法。具体来讲,本文提出了使用CPU+GPU的多设备协同的并行编码方案,通过将HEVC编码端Deblocking和SAO联合在GPU端并行处理来降低环路滤波的编码复杂度。实验结果表明,与HEVC的开源编码器x265相比,本文提出的环路滤波并行算法能够获得47%的编码加速。
王英彬[4](2019)在《基于卷积神经网络的视频压缩环路滤波技术研究》文中研究说明随着信息技术的高速发展,移动设备的逐渐普及,多媒体应用广泛流行,各式各样的多媒体内容极大丰富了人们的日常生活。其中,数字视频是多媒体应用中最常用的信息载体之一。原始视频由于数据量巨大难以投入实际应用之中,为了高效的存储,传输及应用视频数据,往往需要对视频数据进行压缩。国际化标准组织于20世纪80年代起开始建立视频编码的国际标准,目前正在开展新一代的视频编码标准VVC的研究。环路滤波技术是视频编码的关键技术之一。为了取得较高的压缩比,一般采用有损压缩的方式对视频进行压缩。压缩后的视频往往伴有块效应,振铃效应和模糊等失真。当前编码标准使用环路滤波技术对压缩后的重构像素进行处理,有效改善了视频质量。另外,环路滤波有利于提高后续压缩过程中帧间预测的准确性,能够进一步的提升压缩性能。近年来,卷积神经网络在众多计算机视觉任务上取得令人瞩目的成绩,为进一步提升视频压缩性能提供了新的思路。本文结合视频压缩和卷积神经网络的原理,重点研究卷积神经网络在视频压缩环路滤波技术中的应用。本文在新一代的视频编码国际标准VVC的基础上,从性能和速度两方面对基于卷积神经网络的环路滤波技术开展了深入的研究,主要创新及贡献如下:(1)本文提出了一种基于卷积神经网路的环路滤波算法。为了能够学习压缩前后视频图像之间的映射,本文设计了一种全新的卷积神经网络结构,称为密集残差网络。该网络不仅能够充分利用多层级的特征,而且能有效的进行特征复用,特征融合。通过将该算法与最新的视频编码国际标准VVC结合,进一步提升了编码性能。(2)本文对所提出的基于卷积神经网路的环路滤波算法的优化加速进行了研究。尽管基于卷积神经网络的环路滤波算法能够带来大幅度的编码性能提升,但其引入的复杂度难以满足视频压缩实际应用的要求。本文从计算效率上对所提出的模型进行分析,提出一个轻量高效的卷积神经网络模型。
荣润琴[5](2019)在《基于集成成像的16K三维显示编码研究》文中研究指明三维(3-dimension,3D)显示向逼真地显示三维世界视觉的真实感迈进了一大步。近年来,随着3D技术的发展,基于集成成像的3D成像技术成为一项令人关注的热点技术。观察者不需要特殊的眼镜,然而在追求更高空间分辨率的同时而使得数据量大幅增加,因此会产生大量的冗余数据。3D图像的高效存储和传输系统必须依赖于压缩算法对进行数据压缩,以获得更好的观看效果。该方案的实现需要超高空间带宽积和超高分辨率的显示终端和更大压缩处理图像。本文研究了单帧分辨率为16K×8K的视频播放和3D图像压缩。显示带宽超出目前视频分辨率为8kK×4K显示的能力,一方面,需要在现有的硬件水平上构建适当的系统构架;另一方面,对视频数据的编解码计算提出了更高要求,同时研究了3D视频帧特点,给出了一种压缩方案。论文研究内容包括硬件的配置和压缩编解码:一方面,使用16块分辨率为4K×2K,尺寸为15.6英寸的液晶显示器(Liquid Crystal Display,LCD)组成4×4阵列的16K×8kK视频显示终端系统。尽管数据传输能够使用并行处理传输16个编解码器的4K数据,但该传输系统在各通道之间存在时间间隙,在接收端不能确保数据包的顺序以及包的丢失,本文使用具有全解码的单层体系结构,在CPU为i7-6800K,两块显卡为NVS810(显存带宽为25GBps)的主机中解码并行传输16路4K信号,利用显示终端系统驱动进行同步,通过16个DP(DisplayPort)接口实现了信号传输。另一方面,本文对mpeg-2和H.26X系列编码标准进行了比较研究,研究了帧内预测、帧间预测、DCT变换、熵编码等模块。在本硬件系统架构下,对于16K视频播放使用基于帧间的前向预测(BFP)方案。实验在Win7系统环境下,利用mpeg-2视频编码,调用ffplay解码实现了16K视频15Fps的流畅播放,验证了本方案的有效性。所提出的BFP方案进一步降低了CPU的解码复杂度。3D视图的帧内压缩使用了一种基于伪序列的图像压缩方案。在方案中,基于集成成像特点,将原始图像分解成多个视图。这些视图构成像视频一样的伪序列,提取伪序列相同位置的像素后合成一组新的合成图像序列,视频编码器利用合成视图序列间的冗余。研究了视图的编码顺序,预测结构和码率分配以用于对伪序列进行编码。
卢琦[6](2018)在《基于高级安全芯片平台集成CA系统的研究与实现》文中进行了进一步梳理随着网络信息技术的飞速发展,广电运营商面临着严峻的安全考验,基于非安全芯片机顶盒产品软件被黑客肆意修改、加扰密钥随意被共享、克隆智能卡屡禁不止,这些行为直接导致运营商的利益严重受损。为了有效的保护运营商的商业利益,CA厂商联合芯片公司共同研发基于高级安全芯片的CA系统。如何高效率、高质量集成CA系统到机顶盒产品中是本论文需要解决的主要问题,一直以来集成CA系统面临着接口不统一、软件开发周期长、安全性能要求高以及CA系统运行不稳定等诸多难题。本论文主要研究基于高级安全芯片的集成CA系统方法以及性能优化。论文首先介绍国内外对CA集成软件的研究现状,分析了当前集成CA系统软件架构存在的问题并进行了深入的研究,提出了基于软件分层和软件模块化相结合的架构设计方案并采用FIFO消息队列服务实现对软件层间解耦。研究了系统初始化以及CA子系统的设计,分析了机顶盒制造商面临的快速集成CA子系统的资源管理问题,根据芯片平台提供的数据存储器、数据接收器、数据解扰器以及智能卡资源,采用信号量机制对临界资源的互斥访问防止系统死锁,同时对CA子系统中各个关键子模块进行详细的研究与设计。本文设计的集成软件缩短了从集成开发到CA厂商认证通过时间周期,即从原来的平均三个月周期下降到一个半月完成,消耗工时从6个人月降到2.2个人月。另外论文还对基于安全芯片的快速切台性能进行优化,首先对现有的切换频道时间的组成进行了详细的统计和研究,归纳了目前切换频道流程中的问题,提出了采用散列寻址方式快速定位并获取节目信息,利用多线程并发处理模式的特性,将锁频线程、播台线程、解扰线程异步执行,同时对DVB播放器采用动态调整缓冲区方案快速启动视频解码。经过优化后的机顶盒产品切台时延从2000ms降低到1500ms左右。该系统软件的设计具有良好的安全性,并且解决了基于高级安全芯片的条件接收系统的安全和效率均衡问题。本文开发的集成软件具有可移植性,可适用于DVB-C、DVBT、DVB-S的机顶盒系统。
赵晓涵[7](2018)在《结合EVS的立体声编解码算法研究》文中提出随着IP网络的迅速发展,多媒体业务日益增长,由于音频带宽较窄和非语音信号处理效果欠佳等限制因素,现有语音编解码器提供的语音质量已经无法满足用户的需求。为了适应未来宽带移动通信,编解码器应支持高清、全频带语音和音频。沉浸通信,在线直播等场合也要求新一代编解码器支持立体声信号,并实现高品质下的编解码和传输。目前最先进的全频带语音通信编解码器——增强型语音服务编解码器(EVS)通过改进语音和音频编码技术大幅提升了通话服务质量,其通过提供全频带音频传输使得声音质量接近原声体验,并改善了语言清晰度及聆听舒适度。但EVS目前尚不支持立体声信号处理,为了更为广泛的应用在日常生活中,EVS急需增加立体声信号处理技术。编解码技术经过多年的发展,出现了多种基于不同原理的立体声信号处理技术,这些技术已经趋向于成熟,且或多或少具有专利问题,因此需要探索新的发展方向。主成分分析(PCA)技术被广泛地应用在数据降维,与编解码器的思想具有一致性。本文结合EVS设计了基于PCA的立体声音频编解码算法,所设计的算法模块包括信号预处理模块、主成分分析模块、量化模块和参数立体声处理模块等。算法设计完成后本文从压缩效果、音频的重建音质和空间感等方面对该立体声编解码算法进行了测评。测试结果证明,本文所设计的基于PCA的立体声编解码算法有着较高的可行性和较大的发展空间。
姚佳[8](2016)在《基于众核平台的多路超高清实时编码系统设计和实现》文中指出随着视频业务的普及和终端智能设备的不断发展,人们对于视频服务的画质质量和分辨率的要求不断提高,这对视频编码的压缩率和处理性能提出了更高的要求。作为新一代的视频压缩标准,HEVC在相同主观质量下比目前主流H.264的压缩率提高了一倍,具有广阔的应用前景。但HEVC的运算复杂度更高,基于传统的单核处理器很难实现超高清实时HEVC编码器。近年来,众核处理器的发展成熟,其强大的并行运算能力为超高清HEVC编码器提供了一个很好的实现平台。本文基于多片众核处理器平台实现了一套多路超高清HEVC实时编码系统,包括从多路视频源的输入采集、压缩编码、码流复用输出到解码端的实时呈现输出的全链路。针对多路视频以及超高清HEVC视频编码所引入的码率波动性和突发性,本文提出了有效的闭环码率控制并结合场景切换检测,实现对编码器输出码率的精确控制。为了降低系统端到端延时,本文设计了系统链路中各个缓冲器的缓存控制机制,实现系统的稳定和恒定延时。针对实时系统中的时钟不同步问题,本文在利用MPEG2-TS的PCR进行时钟同步的基础上,设计了用于同步视频源,编码器以及解码器三者本地时钟的时钟同步机制。最后本文成功搭建了一套多路超高清实时系统,并给出了各种场景下的指标测试结果。本文采用的众核平台最多可支持四路HEVC超高清视频准实时编码以及相应的视频采集和发送工作。
邢玲[9](2013)在《基于VLC的压缩域视频水印算法研究》文中认为随着信息技术和计算机网络的日益普及,数字多媒体产品的传输、复制以及网络传播越来越便捷,极大地丰富了人们的日常生活。但由此引发的数字视频的版权问题也日益严重,光碟盗版、网络盗版以及非法使用视频服务等,已经严重影响了影视音像业和文化产业的发展。视频水印技术作为一种新兴的解决方案应运而生,成为研究的焦点,其中与压缩标准相结合的压缩域视频水印算法是视频水印的主要发展趋势。本文首先介绍了视频压缩标准MPEG-2的压缩原理,并采用MATLAB软件实现了该标准的压缩和解压过程。在详细分析已有压缩域视频水印算法优缺点的基础上,结合实际应用中对视频水印的实时性、恒定码率、盲检测性等要求,提出了一种基于VLC(Variable Length Coding)的压缩域视频水印算法。该算法将水印嵌入在视频Ⅰ帧的色度分量上,根据具体的水印取值0或者1,在密钥控制选择的宏块的游程码中插入(01)或者(0-1),实现水印嵌入,水印不仅可以在游程解码时提取,也可以在码流中直接提取。理论分析和仿真实验表明,本文算法可有效提高实时性,降低实现复杂度,具有良好的抗再压缩能力和设备兼容性,能够为版权纠纷、盗版追踪等问题提供技术支持。
范飞虎[10](2013)在《基于FPGA的MPEG-2/4AAC音频解码器的设计与验证》文中提出在数字技术飞速发展的时代,音频编码技术逐渐深入人们的生活。MPEG-2/4AAC(Advanced Audio Coding,先进音频编码)数字音频压缩标准,已经成为国际标准中高质量音频编码的核心,代表着目前感知音频编码技术的发展方向。MPEG-2/4AAC具有音质好,压缩比例高,重建音频质量好,编解码过程模块化,支持更多声道,可变采样率等特点。因而,MPEG-2/4AAC技术在数字声音的存储,网络上音视频多媒体的传输和数字音视频产品领域得到广泛的应用,如:手机、MP3、CD和数字电视。AAC格式比目前最为流行的MP3文件缩小30%的前提下能提供更好的音质。因此,对MPEG-2/4AAC进行研究和实时实现具有重要的意义。随着芯片设计规模不断扩大化和复杂度急剧增大,验证在整个产品设计流程中占有相当大的比例。验证技术正是在这种情况下发展起来的,并在整个设计中发挥越来越重要的作用,成为半导体行业与SoC设计领域研究热点问题。本文将MPEG-2/4AAC音频解码IP核作为研究和分析对象,做了以下工作:1.文中首先介绍了该系统的总体设计方案,对MPEG-2/4AAC音频解码标准的各个模块进行了研究,针对所使用的FPGA开发板设计了音频解码核的外围数据输入和输出接口。2.其次对整个系统验证做了详细的介绍,包括IP/模块级验证;虚拟仿真验证;FPGA原型验证。3.最后针对该系统的设计,对音频质量的评价介绍了主观评价和客观评价。MPEG-2/4AAC音频解码器系统采用RTL级Verilog HDL语言编写,通过验证仿真、综合和时序分析,并在FPGA平台实现,其结果完全正确满足实时性解码要求。
二、MPEG-2压缩技术在解码器中的应用分析(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、MPEG-2压缩技术在解码器中的应用分析(论文提纲范文)
(1)鲁棒数字水印性能优化方法研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 引言 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 基于量化的图像水印方法 |
1.2.2 基于扩频的图像水印方法 |
1.2.3 基于深度学习的图像水印方法 |
1.2.4 原始域视频水印方法 |
1.2.5 压缩域视频水印方法 |
1.3 本文研究内容 |
1.4 论文结构安排 |
2 鲁棒数字水印方法 |
2.1 基本原理 |
2.2 常见的攻击类型及抵抗方法 |
2.2.1 常见的攻击类型 |
2.2.2 抵抗几何攻击的数字水印方法 |
2.2.3 抵抗其它攻击类型的数字水印方法 |
2.3 空域最小可觉差模型 |
2.4 评价标准 |
2.5 现有鲁棒数字水印方法存在的问题 |
2.6 本章小结 |
3 基于空域最小可觉差模型的视觉优化图像水印方法 |
3.1 问题分析 |
3.2 算法描述 |
3.2.1 水印嵌入 |
3.2.2 求解最优水印嵌入强度 |
3.2.3 水印提取 |
3.3 实验设置及评价标准 |
3.4 实验结果及分析 |
3.4.1 不可见性测试 |
3.4.2 鲁棒性测试 |
3.5 本章小结 |
4 基于多尺度特征的鲁棒图像水印方法 |
4.1 问题分析 |
4.2 基于多尺度特征的鲁棒图像水印网络结构 |
4.2.1 编码器 |
4.2.2 噪声层 |
4.2.3 解码器 |
4.2.4 判别器 |
4.3 实验设置及评价标准 |
4.4 实验结果及分析 |
4.4.1 无噪声层训练的网络性能测试 |
4.4.2 单个噪声层训练的网络性能测试 |
4.4.3 多个噪声层训练的网络性能测试 |
4.4.4 消融实验 |
4.5 本章小结 |
5 基于帧差的高效视频水印方法 |
5.1 问题分析 |
5.2 算法描述 |
5.2.1 基于相邻帧色度通道的水印嵌入 |
5.2.2 基于帧差的水印提取 |
5.3 实验设置及评价标准 |
5.4 实验结果及分析 |
5.4.1 不可见性测试 |
5.4.2 鲁棒性测试 |
5.4.3 实时性测试 |
5.5 本章小结 |
6 总结及展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
作者简历及攻读硕士学位期间取得的研究成果 |
学位论文数据集 |
(2)基于申威421处理器的视频解码SIMD优化技术研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 论文研究背景 |
1.2 视频压缩编解码技术 |
1.2.1 视频压缩基本原理 |
1.2.2 视频编解码的发展历程 |
1.3 申威处理器及SIMD技术 |
1.3.1 申威处理器 |
1.3.2 SIMD技术 |
1.3.3 申威SIMD扩展部件 |
1.4 国内外研究现状 |
1.5 研究内容及章节安排 |
2 H.264 视频编解码标准 |
2.1 H.264 的分层结构 |
2.2 H.264 编解码框架 |
2.2.1 视频编码框架图 |
2.2.2 视频解码框架图 |
2.3 H.264 关键技术 |
2.3.1 熵编码 |
2.3.2 帧内预测 |
2.3.3 变换与量化 |
2.3.4 帧间预测 |
2.3.5 去块滤波 |
2.4 本章小结 |
3 申威平台下H.264 解码器的移植 |
3.1 FFmpeg介绍 |
3.1.1 FFmpeg中函数及数据结构简介 |
3.1.2 FFmpeg的编译使用 |
3.2 基于FFmpeg的 H.264 解码器移植 |
3.2.1 编译第三方依赖库 |
3.2.2 编译FFmpeg |
3.3 基于FFmpeg的 H.264 解码器分析 |
3.4 本章小结 |
4 关键模块的向量化并行 |
4.1 热点函数分析 |
4.2 分像素插值算法优化 |
4.2.1 插值过程分析 |
4.2.2 算法优化及实现 |
4.2.3 模块优化效果测试 |
4.3 整数反变换的优化 |
4.3.1 整数变换过程分析 |
4.3.2 算法优化及实现 |
4.3.3 模块优化效果测试 |
4.4 去块滤波优化 |
4.4.1 宏块内边界滤波顺序 |
4.4.2 边界强度的选择 |
4.4.3 滤波器判决条件 |
4.4.4 滤波优化及实现 |
4.4.5 模块优化效果测试 |
4.5 本章小结 |
5 H.264 解码器优化效果测试 |
5.1 测试环境搭建 |
5.2 正确性测试 |
5.3 优化效果测试 |
5.4 本章小结 |
6 总结与展望 |
参考文献 |
附录:攻硕期间取得研究成果 |
致谢 |
(3)基于深度学习的视频编码技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题背景 |
1.2 数字视频压缩基础 |
1.2.1 视频压缩的基本原理 |
1.2.2 视频编码标准的基本框架 |
1.2.3 数字视频编码标准的发展历程 |
1.3 HEVC标准的关键技术 |
1.3.1 块划分方式 |
1.3.2 帧内预测 |
1.3.3 帧间预测 |
1.3.4 环路滤波 |
1.4 基于深度学习的视频编码 |
1.5 本文课题的提出及其主要贡献 |
第2章 基于深度学习的视频编码技术的研究现状 |
2.1 帧内预测技术的研究现状 |
2.2 帧间预测技术的研究现状 |
2.3 环路滤波技术的研究现状 |
2.3.1 基于深度学习的环路滤波技术的研究现状 |
2.3.2 环路滤波并行优化的研究现状 |
2.4 本章小结 |
第3章 基于多尺度卷积神经网络的帧内预测 |
3.1 问题的提出 |
3.2 模式依赖的帧内平滑滤波 |
3.2.1 MDISF原理及分析 |
3.2.2 MDISF的滤波器设计 |
3.2.3 MDISF集成到HEVC |
3.2.4 MDISF的实验结果 |
3.3 基于多尺度卷积神经网络的帧内预测 |
3.3.1 MSCNN的网络结构 |
3.3.2 MSCNN的训练策略 |
3.3.3 MSCNN集成到HEVC |
3.4 实验结果与分析 |
3.4.1 实验配置 |
3.4.2 与HEVC的性能比较 |
3.4.3 与其他方法的性能比较 |
3.4.4 网络深度分析 |
3.4.5 编解码时间分析 |
3.5 本章小结 |
第4章 基于深度神经网络的帧间预测 |
4.1 问题的提出 |
4.2 NNIP的网络结构 |
4.2.1 关系估计网络 |
4.2.2 组合网络 |
4.2.3 深度提纯网络 |
4.3 NNIP的训练策略 |
4.4 NNIP集成到HEVC |
4.5 实验结果与分析 |
4.5.1 实验配置 |
4.5.2 与HEVC的性能比较 |
4.5.3 与其他方法的性能比较 |
4.5.4 编解码时间分析 |
4.6 本章小结 |
第5章 基于卷积神经网络的环路滤波及其并行优化 |
5.1 基于卷积神经网络的环路滤波 |
5.1.1 CNNF的网络结构 |
5.1.2 CNNF的训练策略 |
5.1.3 CNNF集成到HEVC |
5.1.4 实验结果与分析 |
5.2 基于GPU的环路滤波并行优化 |
5.2.1 问题的提出以及算法的整体框架 |
5.2.2 GPU端 Deblocking的并行结构 |
5.2.3 GPU端 SAO的并行结构 |
5.2.4 内存优化管理 |
5.2.5 实验结果与分析 |
5.3 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的学术论文及研究成果 |
致谢 |
个人简历 |
(4)基于卷积神经网络的视频压缩环路滤波技术研究(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景 |
1.2 研究现状 |
1.3 研究内容 |
1.4 论文章节安排 |
2 视频压缩基础 |
2.1 视频压缩基本概念 |
2.1.1 视频 |
2.1.2 视频编码 |
2.1.3 编码性能评价 |
2.2 视频编码标准的发展 |
2.3 新一代视频编码标准VVC |
2.4 本章小结 |
3 卷积神经网络及其在视频压缩中的应用 |
3.1 卷积神经网络基础 |
3.1.1 人工神经网络 |
3.1.2 卷积神经网络 |
3.2 卷积神经网络在视频压缩中的应用 |
3.2.1 基于卷积神经网络的预测技术 |
3.2.2 基于卷积神经网络的压缩视频后处理 |
3.2.3 基于卷积神经网络的熵编码和量化 |
3.3 本章小结 |
4 基于卷积神经网络的环路滤波算法设计 |
4.1 概述 |
4.2 方案设计 |
4.2.1 卷积神经网络模型设计 |
4.2.2 模型的训练 |
4.3 实验结果与分析 |
4.3.1 实验配置 |
4.3.2 编码性能 |
4.3.3 与其他方法的对比 |
4.4 本章小结 |
5 基于卷积神经网络的环路滤波算法优化 |
5.1 概述 |
5.2 方案设计 |
5.2.1 模型的优化 |
5.2.2 训练方法的优化 |
5.3 实验结果与分析 |
5.4 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
(5)基于集成成像的16K三维显示编码研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.3 论文内容与结构 |
第二章 成像原理与图像压缩 |
2.1 成像原理 |
2.2 图像压缩 |
2.2.1 MPEG-2视频压缩标准 |
2.2.2 H.264/AVC视频压缩标准 |
2.2.3 视频帧 |
2.2.4 帧间编码 |
2.2.5 帧内编码 |
2.2.6 压缩编码的方法 |
2.2.7 视频编码率失真 |
2.3 本章小结 |
第三章 面向3D的16K视频显示研究 |
3.1 3D视频帧的获取及数据量 |
3.2 系统解决方案 |
3.2.1 硬件组成 |
3.2.2 压缩编码选择 |
3.2.3 16K×8K视频的获取 |
3.2.4 同步控制 |
3.3 实验结果 |
3.4 本章小结 |
第四章 基于伪序列的3D图像压缩 |
4.1 原始图像切割成子图像 |
4.2 转换编码处理 |
4.3 转换图像的压缩编码 |
4.4 实验结果 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
致谢 |
攻读硕士学位期间发表论文 |
(6)基于高级安全芯片平台集成CA系统的研究与实现(论文提纲范文)
摘要 |
abstract |
符号说明 |
第一章 绪论 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.3 主要研究内容及贡献 |
1.3.1 研究目标及其内容 |
1.3.2 本文的贡献 |
1.4 本文的组织结构 |
第二章 CA系统及高级安全芯片原理 |
2.1 MPEG-2 加扰标准 |
2.2 条件接收系统的概述 |
2.2.1 条件接收系统组成 |
2.2.2 数据解密的基本原理 |
2.3 高级安全芯片工作原理 |
2.4 本章小结 |
第三章 集成软件的架构研究及初始化 |
3.1 集成软件面临的问题 |
3.2 集成软件架构 |
3.2.1 软件架构问题分析 |
3.2.2 基于松耦合的软件架构设计 |
3.2.3 消息队列解耦的应用 |
3.3 软件初始化 |
3.3.1 基于RSA算法的安全启动设计 |
3.3.2 CA系统初始化设计 |
3.4 本章小结 |
第四章 CA子系统的研究与设计 |
4.1 CA子系统面临问题及分析 |
4.2 CA子系统关键模块的分析与设计 |
4.2.1 加密数据存储模块设计 |
4.2.2 数据接收模块设计 |
4.2.3 解扰模块设计 |
4.2.4 智能卡模块设计 |
4.3 CA子系统关键模块的实现 |
4.3.1 加密数据存储模块实现 |
4.3.2 数据接收模块实现 |
4.3.3 解扰模块实现 |
4.3.4 智能卡模块通讯协议实现 |
4.4 本章小结 |
第五章 数字电视视频服务性能优化 |
5.1 FCC面临的问题及研究现状 |
5.2 FCC性能优化 |
5.2.1 DVB解码器模块优化设计 |
5.2.2 TS解扰模块优化设计 |
5.2.3 数字信号接收模块优化设计 |
5.2.4 多线程处理模式的设计 |
5.2.5 散列寻址在快速切台的应用 |
5.3 FCC的算法实现 |
5.4 本章小结 |
第六章 软件性能测试及分析 |
6.1 测试环境 |
6.1.1 硬件配置要求 |
6.1.2 数字码流播发卡的安装及配置 |
6.2 系统性能测试 |
6.2.1 CA系统的性能测试及结果分析 |
6.2.2 FCC性能测试及结果分析 |
6.3 对比测试 |
6.4 本章小结 |
第七章 总结与展望 |
7.1 论文工作总结 |
7.2 问题与展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文 |
(7)结合EVS的立体声编解码算法研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 音频编解码概述 |
1.2 音频编解码标准概述 |
1.3 EVS编解码器简介 |
1.4 立体声技术概述 |
1.5 编解码器质量评价方法 |
1.5.1 客观评价方法 |
1.5.2 主观评价方法 |
1.6 主成分分析 |
1.7 本文课题来源及研究内容 |
第2章 EVS关键技术概述 |
2.1 编码器技术概述 |
2.1.1 编码器工作流程 |
2.1.2 线性预测技术 |
2.1.3 频域编码技术 |
2.1.4 非活跃信号编码 |
2.1.5 动态码率编码 |
2.1.6 带宽扩展 |
2.1.7 暂态判别 |
2.1.8 自适应时频变换 |
2.1.9 量化模块 |
2.2 解码器技术概述 |
2.2.1 解码器工作流程 |
2.2.2 丢帧补偿 |
2.3 本章小结 |
第3章 基于PCA的编解码方案设计 |
3.1 主成分分析的数学思想 |
3.2 主成分分析的基本推导 |
3.3 基于PCA的编解码设计方案 |
3.3.1 矩阵形式设计 |
3.3.2 信号采样方式 |
3.4 改进的基于PCA的编解码器设计方案 |
3.4.1 多帧联合主成分分析 |
3.4.2 低算法延时的多帧联合主成分分析 |
3.5 本章小结 |
第4章 量化设计与滤波器设计 |
4.1 本章概述 |
4.2 降维矩阵的量化设计 |
4.2.1 降维矩阵的性质 |
4.2.2 降维矩阵比特分配 |
4.3 滤波器的设计 |
4.3.1 滤波器设计原理 |
4.3.2 滤波器参数量化 |
4.4 旋转矩阵的量化设计 |
4.4.1 旋转矩阵性质 |
4.4.2 旋转矩阵比特分配 |
4.5 稳态帧的处理 |
4.6 本章小结 |
第5章 基于PCA的 EVS立体声编解码器设计 |
5.1 本章概述 |
5.2 双声道PCA分析 |
5.3 空间听觉理论 |
5.3.1 空间声源理论 |
5.3.2 空间参数的局限性 |
5.4 MDCT域内空间参数的计算 |
5.5 结合PCA的 MDCT域参数立体声模块设计 |
5.6 解码端空间参数综合 |
5.7 子带划分及码率计算 |
5.8 本章小结 |
第6章 结合EVS的双声道编解码器框架及测试 |
6.1 双声道编解码器框架 |
6.1.1 编码器框架和工作流程 |
6.1.2 解码器框架和工作流程 |
6.2 复杂度分析 |
6.3 MUSHRA测试 |
6.3.1 测试设计 |
6.3.2 测试结果 |
6.4 本章小结 |
第7章 总结与展望 |
7.1 本文主要工作总结 |
7.2 未来工作展望 |
参考文献 |
攻读学位期间发表的论文与研究结果清单 |
致谢 |
(8)基于众核平台的多路超高清实时编码系统设计和实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 引言 |
1.2 超高清HEVC编码器研究现状 |
1.3 众核处理器简介 |
1.4 多路超高清编码平台和系统简介 |
1.4.1 多片众核Tile-Gx36 处理器平台 |
1.4.2 多路编码系统简介 |
1.5 本文的主要内容与章节安排 |
第二章 多路超高清实时编码系统 |
2.1 多路实时系统链路 |
2.2 采集线程与原始序列缓存管理 |
2.3 发送线程与TS流打包 |
2.3.1 传输流[24](Transport Stream)简介 |
2.3.2 TS流时间戳信息 |
2.3.3 发送线程 |
2.4 系统线程管理 |
2.4.1 Pthread简介 |
2.4.2 TTR简介 |
2.4.3 线程管理 |
2.5 本章小结 |
第三章 实时系统的控制与同步机制 |
3.1 系统缓存管理 |
3.1.1 系统总延时分析 |
3.1.2 基于缓存管理的恒定延时方案 |
3.2 闭环码率控制方案 |
3.2.1 码率控制简介 |
3.2.2 场景切换检测 |
3.2.3 闭环码率控制方案 |
3.3 实时系统中的时钟同步机制 |
3.3.1 编码器与解码器之间的时钟同步 |
3.3.2 视频源与编码器的时钟同步 |
3.4 本章小结 |
第四章 基于多片众核处理器的多路编码系统设计 |
4.1 处理器间的数据交互 |
4.1.1 多路编码系统的硬件实现平台 |
4.1.2 处理器间的mPIPE传输 |
4.2 TS流复用及传输 |
4.2.1 TS流复用实现 |
4.2.2 RTP传输实现 |
4.3 本章小结 |
第五章 多路超高清实时系统搭建与测试 |
5.1 四路超高清实时系统的搭建 |
5.2 系统各指标测试 |
5.2.1 单路超高清实时编码系统测试 |
5.2.2 多路超高清编码系统测试 |
5.3 HLS直播应用的实现 |
5.3.1 HLS简介 |
5.3.2 HLS直播实现 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
攻读硕士学位期间已发表或录用的论文 |
(9)基于VLC的压缩域视频水印算法研究(论文提纲范文)
摘要 |
Abstract |
目录 |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 压缩域水印研究现状 |
1.3 本文研究内容及组织结构 |
第二章 视频水印基本原理及典型算法 |
2.1 视频水印系统及特点 |
2.1.1 视频水印系统 |
2.1.2 视频水印的特点 |
2.2 视频水印分类 |
2.3 压缩域经典视频水印算法 |
2.3.1 基于DCT系数的水印算法 |
2.3.2 基于运动矢量的水印算法 |
2.3.3 基于VLC码的水印算法 |
2.3.4 压缩域视频水印算法分析 |
2.4 视频水印算法评价标准 |
2.4.1 一般情况下的评价标准 |
2.4.2 水印受攻击后的评价标准 |
2.5 本章小结 |
第三章 MPEG-2视频压缩标准及其MATLAB实现 |
3.1 MPEG-2视频压缩层码流结构 |
3.2 MPEG压缩算法原理 |
3.2.1 预处理 |
3.2.2 运动估计和运动补偿 |
3.2.4 DCT变换和量化 |
3.2.6 Z扫描 |
3.2.7 变长编码 |
3.2.8 码率控制 |
3.3 MPEG-2视频压缩的MATLAB实现 |
3.3.1 MPEG-2的MATLAB实现方法 |
3.3.2 举例及验证 |
3.4 本章小结 |
第四章 基于VLC的视频水印算法 |
4.1 基于VLC码的视频水印算法 |
4.1.1 嵌入算法 |
4.1.2 提取算法 |
4.1.2.1 根据游程码提取水印 |
4.1.2.2 根据码流提取水印 |
4.2 算法性能理论分析 |
4.2.1 兼容性分析 |
4.2.2 水印嵌入对码率的影响 |
4.2.3 码率控制器对水印嵌入的影响 |
4.2.4 抗再压缩能力 |
4.2.5 安全性 |
4.3 算法性能仿真分析 |
4.3.1 不可见性 |
4.3.2 实时性 |
4.3.3 码率保持特性 |
4.3.4 抗再压缩性 |
4.3.5 误差漂移对视觉质量的影响 |
4.4 与其他算法性能比较 |
4.5 本章小结 |
总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
附录 |
攻读硕士学位期间取得的学术成果 |
致谢 |
(10)基于FPGA的MPEG-2/4AAC音频解码器的设计与验证(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 课题研究背景 |
1.2 常见的音频格式 |
1.3 音频压缩标准 |
1.4 FPGA 技术 |
1.5 本文研究内容及论文章节安排 |
第二章 MPEG-2/4AAC 音频解码器系统介绍 |
2.1 AAC 码流的封装格式 |
2.2 MPEG-2/4 AAC 音频解码器的系统架构 |
2.3 音频控制接口 |
2.4 音频解码核 |
2.5 小结 |
第三章 MPEG-2/4AAC 音频解码器系统的设计 |
3.1 音频控制接口设计 |
3.2 AAC 音频解码核关键模块设计 |
3.3 I2S 接口 |
3.4 小结 |
第四章 MPEG-2/4AAC 音频解码器系统的验证 |
4.1 验证计划 |
4.2 验证流程 |
4.3 模块/IP 核级验证 |
4.4 软硬件协同验证 |
4.5 虚拟原型仿真验证 |
4.6 FPGA 原型验证 |
4.7 音频评价标准 |
4.8 小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
致谢 |
参考文献 |
四、MPEG-2压缩技术在解码器中的应用分析(论文参考文献)
- [1]鲁棒数字水印性能优化方法研究[D]. 秦莉文. 北京交通大学, 2021(02)
- [2]基于申威421处理器的视频解码SIMD优化技术研究[D]. 裴航. 中原工学院, 2021(08)
- [3]基于深度学习的视频编码技术研究[D]. 王洋. 哈尔滨工业大学, 2019(01)
- [4]基于卷积神经网络的视频压缩环路滤波技术研究[D]. 王英彬. 武汉大学, 2019(06)
- [5]基于集成成像的16K三维显示编码研究[D]. 荣润琴. 安徽大学, 2019(07)
- [6]基于高级安全芯片平台集成CA系统的研究与实现[D]. 卢琦. 上海交通大学, 2018(01)
- [7]结合EVS的立体声编解码算法研究[D]. 赵晓涵. 北京理工大学, 2018(07)
- [8]基于众核平台的多路超高清实时编码系统设计和实现[D]. 姚佳. 上海交通大学, 2016(01)
- [9]基于VLC的压缩域视频水印算法研究[D]. 邢玲. 西北大学, 2013(S1)
- [10]基于FPGA的MPEG-2/4AAC音频解码器的设计与验证[D]. 范飞虎. 西安电子科技大学, 2013(S2)