基于文档分割的图像兴趣域检测与编码方法

基于文档分割的图像兴趣域检测与编码方法

一、基于文档分割的图像兴趣域检测及编码方法(论文文献综述)

曹莹[1](2020)在《面向智能视频监控场景的感知优化与内容分析算法研究》文中认为智能视频监控系统改变了原有视频监控系统中基于人工的监控画面监视和内容分析模式,在一定程度上为视频监控提供了更加广阔的前景和发展空间。但如何通过普通感知设备获取有价值的目标信息是当前智能视频监控系统的核心问题之一。为解决这一问题,基于分布式视频编码和视频修复研究感知优化方案以获得具有较高质量的感知视频数据。继而在视频目标分割算法的基础上研究内容分析方案,以实现对海量感知视频目标信息的可靠提取。本文主要工作如下:1)基于预测的分布式视频编码优化算法研究。根据采用无线多媒体技术的智能视频监控系统对感知设备低功耗、高效率的要求,研究分布式视频编码方案,并针对分布式视频编码方案受视频背景环境、目标运动等干扰因素影响造成的解码数据质量下降问题,提出基于预测的边信息生成算法。所提算法首先根据视频块属性和视频块间的运动关系建立边信息预测模型;而后基于边信息预测模型,以视频块为单位,根据视频块属性得到较准确的运动矢量,进而提高边信息质量。仿真实验表明所提方法能够在满足采用无线多媒体技术的智能视频监控系统要求的同时,缓解视频背景环境、目标运动等对边信息质量的干扰,从而提高解码感知视频质量。2)基于张量列秩的视频修复算法研究。为解决普通感知设备受光照、天气等因素影响造成的数据质量下降问题,研究视频修复算法,并针对数据退化现象中的数据缺失问题,提出基于张量列秩(Tensor Train rank,TT-rank)的视频补全算法。在所提算法中,首先考虑视频中可能存在的数据分布不平衡及数据信息冗余问题,采用近似张量求解算法调整张量数据,得到只保留重要信息的且信息分布较均衡合理的张量数据。其次,为更好地映射视频信息在修复过程中的影响,根据张量数据特征提出自适应权重机制得到每一维数据相应的权重值。理论分析和仿真实验表明所提算法能够在避免更换昂贵感知设备的同时实现对感知视频数据质量的优化3)基于吸收马尔科夫链的感知视频片段目标分割算法研究。在获取具有较高质量的感知视频数据后,在内容分析中,为建立面向海量感知视频数据的自适应目标分割模型,首先针对感知视频片段设计基于吸收马尔科夫链的视频目标分割算法,在目标较剧烈运动、较大形变等因素的干扰下,通过对时空域特征的充分考虑实现对感知视频片段目标的有效分割,并将分割结果作为标记数据用于感知视频目标分割方案中,以实现对海量感知视频目标的自适应分割。所提方案首先利用目标选块和边权重模型搭建吸收马尔科夫链有向图;其次,设计再筛选机制,根据利用吸收时间完成初次筛选后的目标选块的时空域特征,确定每张视频帧唯一的目标选块,并结合优化模型细化目标选块,以得到分割目标。仿真实验表明所提目标分割算法能够充分利用感知视频片段的时空域特征,从具有较剧烈目标运动、较大目标形变等干扰因素的感知视频片段中有效分割视频目标,为感知视频目标分割方法提供较准确的标记数据。4)基于注意力机制的感知视频目标分割算法研究。针对感知视频提出基于注意力机制的视频目标分割算法,结合感知视频片段目标分割算法,建立面向海量感知视频数据的自适应目标分割模型,通过对视频目标时域特征的充分考虑,来应对感知视频目标运动、目标形变等干扰因素的负面影响,实现对海量感知视频目标信息的可靠提取。所设计方案具有两个分支:深度网络模型和光流预测模型。深度网络模型首先利用注意力机制突出视频目标相关特征;继而采用三维卷积和基于注意力机制的残差卷积长短时记忆网络以更好地获得目标时域特征。与此同时设计光流预测模型以降低背景运动对目标分割性能的影响。最后,采用残余区域清除算法清除分割结果中的非目标区域,得到分割目标。仿真实验表明,结合得到的标记数据,所提视频目标分割算法能够充分考虑感知视频时域特征,在视频目标运动、形变等的干扰下,完成对海量感知视频目标的自适应分割,实现海量感知视频数据目标信息的可靠提取。

芦春雨[2](2020)在《基于改进Faster R-CNN的钢轨踏面块状伤损检测研究》文中进行了进一步梳理由于轨轮强烈摩擦、挤压、冲击等影响,钢轨踏面作为钢轨与轨轮接触最为频繁的区域,容易出现危害列车行驶安全的伤损,在这些伤损中,块状伤损最为常见。因此,为保障铁路运营中列车的行驶安全,本文针对钢轨踏面块状伤损的检测进行了研究,主要研究内容如下:1)考虑到基于机器视觉的检测技术具有速度快、结果直观等优势,本文对基于传统机器视觉与基于深度学习的钢轨伤损检测研究进行了分析,并进一步对基于深度学习的目标检测算法进行了研究,提出了基于区域提名的钢轨踏面块状伤损检测研究。2)考虑到钢轨踏面块状伤损存在的伤损类间差异小、尺度变化大的特性,提出了基于Faster R-CNN和特征金字塔网络(Feature Pyramid Network,FPN)的钢轨踏面块状伤损检测研究,并通检测网络设计、训练和测试,验证了其对钢轨踏面块状伤损检测的有效性。3)针对Faster R-CNN中回归损失Smooth L1是以预测边框与实际边框之间的距离为损失定义,对预测边框位置不敏感问题,提出了采用广义交并比(Generalized Intersection over Union,GIo U)损失替代Smooth L1损失的Faster R-CNN优化方案;另外,针对Faster R-CNN中区域生成网络(Region Proposal Network,RPN)生成的锚点大量冗余而导致检测网络训练中正负样本失衡,进而影响网络检测效果的问题,提出了采用引导锚定的区域提名(Region Proposal by Guided Anchoring,GA-RPN)替代RPN的Faster R-CNN优化方案。最后,实验结果证明,本文所设计的改进Faster R-CNN网络能有效地提高钢轨踏面块状伤损的检测精确度,从而实现伤损的准确检测。

刘建平[3](2020)在《科学数据用户相关性判断模型研究》文中提出在开放科学环境和“数据密集型”科学研究范式的驱动下,科学数据的重要性持续提升。在FAIR原则和关联数据技术的影响下,更多的科学数据以富含语义的形式进入网络传播。然而,我们对科学数据用户如何做出某条科学数据相关与否的判断过程知之甚少。因此,本研究以科学数据用户相关性判断行为及其认知机理为研究切入点,理解和建模科学数据用户相关性判断过程,以期丰富和拓展信息科学领域相关性研究,同时为科学数据专属的搜索技术研发提供理论基础。相关性是信息科学的基础概念之一,理解用户对特定类型信息对象做出相关性判断的过程、原理、影响因素以及作用效果,始终是信息科学特别是信息检索学者们的关注点。学者们先后研究了科技论文、文本文档、网页、多媒体、社交媒体等多种类型的相关性,大数据以及科学数据的相关性是最近的关注,并且因其区别于其他信息类型的认知和技术特点而吸引了越来越多的研究兴趣。本论文尝试以实证的方式构建科学数据用户相关性判断模型。通过对用户相关性判断过程的描述、核心认知过程量化验证和模型的算法化设计,进而为科学数据搜索与推荐提供理论基础。为此,本研究在综述已有研究的基础上提出了认知导向的相关性判断假设性概念模型和相应的研究目标。并基于此,顺次开展了三个层次的实证研究:1)科学数据用户相关性判断描述性概念模型研究;2)科学数据用户相关性判断实证性量化模型研究;3)多标准相关性排序(Multi-Criteria Relevance Ranking,MCRR)算法及其应用框架设计。本研究共得出以下研究结论:首先,论文通过静态要素识别验证了科学数据用户相关性判断描述性概念模型。模型中识别了24个科学数据信息元(Scientific Data Information Elements,SDIEs)、3类决策规则、12个一级相关性标准、4类相关性标准维度。基于此,论文提出了TAQA-U(Topicality,Availibility,Quality,Authority and Usefulness)科学数据用户相关性标准结构,为用户导向的科学数据查询与检索实践提供了“静态”指导原则。其次,基于偏最小二乘结构方程模型(Partial Least Squares Structural Equation Modeling,PLS-SEM)量化方法,实证验证了科学数据查询与检索交互过程中科学数据相关性标准使用结构模型,即科学数据用户相关性判断实证性量化模型。论文验证了主题相关性标准在用户相关性判断中的先决条件作用,验证了可用性、质量和权威性的中介作用,验证了有用性作为科学数据用户判断数据对象的结果变量。同时,研究实证验证了科学数据用户相关性判断的个性化认知模式主要体现在相关性标准动态组合使用的差异上。最后,基于描述性概念模型和实证性量化模型研究发现与结果,研究设计了多标准相关性排序(MCRR)算法及其应用框架。该算法综合考虑了用户多标准相关性判断的认知本质:1)综合计算多标准得分,而非主题词匹配模式下的单一维度相关性;2)引入优先级算子计算不同标准(集)之间的等级关系。同时,研究提出了认知导向的科学数据检索与推荐框架以支撑个性化科学数据检索与推荐实践。综合以上研究结果与发现,论文的主要学术贡献与创新体现在:1)论文从三个水平(描述性概念模型/实证性量化模型/算法化表达)创新地提出并验证了科学数据用户相关性判断模型。同时,将用户相关性判断研究对象拓展到科学数据及其用户,在理论上丰富和发展了用户相关性研究进程。2)探索了从描述性概念模型到量化模型到算法表达的连续性用户相关性判断研究路径;3)提出了认知导向的科学数据检索与推荐框架,为智能、个性化科学数据检索与推荐提供了理论基础。未来研究将在理论和实践上进一步丰富和发展认知导向的科学数据查询与检索研究。在理论上,扩大研究情境(如科学数据与科技文献的关联搜索)和用户类型(如专门针对科学数据领域专家),完善和发展已有理论模型;在实践上,以个性化科学数据检索与推荐为切入点,开发认知导向的科学数据查询与推荐系统,提升科学数据的复用率和价值,支撑开放科学背景下的科研创新。

刘奕[4](2020)在《5G网络技术对提升4G网络性能的研究》文中研究表明随着互联网的快速发展,越来越多的设备接入到移动网络,新的服务与应用层出不穷,对移动网络的容量、传输速率、延时等提出了更高的要求。5G技术的出现,使得满足这些要求成为了可能。而在5G全面实施之前,提高现有网络的性能及用户感知成为亟需解决的问题。本文从5G应用场景及目标入手,介绍了现网改善网络性能的处理办法,并针对当前5G关键技术 Massive MIMO 技术、MEC 技术、超密集组网、极简载波技术等作用开展探讨,为5G技术对4G 网络质量提升给以了有效参考。

王殷浩[5](2020)在《行人的特征表示与再辨识》文中研究表明近些年随着视频监控网络的大范围部署应用,如何有效对海量的监控数据自动分析处理,成为了亟待解决的问题。行人再辨识作为其中一个关键技术得到了广泛的关注,并取得了显着的进步。行人再辨识的目标是在跨场景的条件下,依据指定的行人图像或序列数据,从其它场景中识别出目标人。本文从基于图像数据的行人再辨识、基于序列数据的行人再辨识和无监督行人再辨识三个方面进行了较为深入的研究,主要的研究内容和创新点包括:在基于图像数据的行人再辨识研究中,提出了一种融合中级语义特征和局部特征的行人表示算法,获得包含多级别语义信息的判别性特征;此外,设计了基于显着性的多尺度特征增强算法,提高了行人特征的表示能力。在基于序列数据的行人再辨识研究中,提出了一种双向的帧特征增强算法,在抑制噪声的同时恢复图像缺失信息,实现了行人特征的增强;此外,提出了一种帧特征混合融合策略,通过层次相关性融合算法和三维卷积实现了行人时空特征的有效提取。在无监督行人再辨识研究中,提出了一种基于行人关键点信息增强的无监督再辨识框架,并通过设计自适应的簇多样性正则项,提高了跨场景行人再辨识的泛化性能。三个算法分别在多个公开行人数据集上与当前代表性算法进行了性能比较,结果验证了本文算法的有效性。

徐勤军[6](2019)在《视频序列中的行为识别建模方法研究》文中研究表明视频序列中的行为识别由于应用广泛,是当前计算机视觉研究领域的一个热点。行为识别研究在受控场景下已经取得很大进展,但在复杂场景下,还存在着诸多挑战,如何在嘈杂的真实场景下,寻求有效的行为特征表示,以及高效的、鲁棒的、能满足实时处理要求的机器识别算法,将是较长时期内所追求的目标。为了提升行为识别的性能,我们做了以下几个方面的工作:1)概率隐含语义分析模型的行为识别研究概率隐含语义分析模型通过挖掘隐含于众多特征点间的共现模式,提取中间层的语义描述来表示视频中的行为,增强了特征的判别性。为了进一步提升模型的识别性能,着重研究了不同编码方法联合归一化方法对于分类性能的影响,采用稀疏时空特征时局域软分配编码结合指数归一化方法大幅提升了识别性能;还考察了主成分分析预处理原始特征对于性能的影响,在显着降低特征维度进而降低计算量的同时,当特征包含较多噪声成分的情况下性能甚至会有所提升。在KTH和UT-interaction数据库上的实验表明,编码和归一化方法的适当组合可以显着提高模型的性能。在UT-interaction数据库的两个子集上识别精度分别达到了当前最好的结果96.44%、95%,其中在数据集1上采用稀疏的时空兴趣点特征,得到了94.24%的识别精度。2)过完备稀疏编码的行为相似识别方法行为相似性识别着重研究动作之间是否相似,因何相似,这有助于更深入的理解视频中的行为,也为跨数据库的识别提供了新的思路。提出了过完备稀疏编码的行为相似识别方法,首先通过高斯混合模型对训练集中抽样得到的特征子集进行训练,然后针对每一个混合模型分量,学习得到子码本,综合各分量的码本即得到超完备的码本集;对特征编码时,先对特征利用高斯混合模型进行分类,为了保留更多的特征信息,采用软分配的方法,保留概率最大的三个分量,并对三个概率分量归一化;对归属于混合模型的各个分量的特征,采用相对应的码本进行稀疏编码;最后采用支持向量机进行分类识别。该方法通过高斯混合模型来学习特征空间的子流形结构,在每一个分量上,用相对较小规模的字典来编码特征,既降低了对于运算能力的要求,又提升了对于行为的描述能力,在ASLAN行为相似数据库上的实验验证了所提方法的有效性。3)基于费舍尔矢量和局域聚合描述符矢量编码的行为识别方法针对局域聚合描述符矢量编码采用硬量化方法带来的信息损失问题以及费舍尔矢量编码只统计了特征一阶、二阶统计量,提出了两种改进方法。首先探讨了主成分分析预处理特征对编码性能的影响,在此基础上,提出了两种改进方法,一是采用两种软分配方法替代矢量量化的硬编码方法,提出了软分配版本的局域聚合描述符矢量方法,提升了局域聚合描述符矢量编码的性能;二是由于特征分布的高阶矩统计量提供了有关特征的更多信息,将特征的高阶矩统计量融入到费舍尔矢量的编码中,提出了联合高阶矩的特征编码方法。在KTH、UT、UCF sports及UCF101数据库上的实验验证了所提方法的有效性。4)基于时空信息的超矢量编码行为识别方法特征间的时空关系包含了丰富的信息,这对于提升视频中的行为识别性能是很重要的。在上一章研究的基础上,将特征间的时空信息统计融入到超矢量编码中,提出了基于时空信息的超矢量编码行为识别方法。首先,提取特征的时空信息点,根据时空信息点的位置坐标进行聚类,将特征点分割为时空体;在每一个时空体中,采用费舍尔矢量、各类高阶统计矩来统计局部特征点集的分布特性;最后联合全局的费舍尔矢量编码组成视频的超矢量表示。所提方法联合了特征点在全局和局域的分布特性,将特征间的时空关系纳入到编码中,在KTH、UCF sports以及UCF101数据库上的实验取得了较好的识别率,其中在UCF101数据库上取得了比基于深度学习方法更高的识别精度。

俞雨晨[7](2019)在《基于人—机—环的HUD自适应显示视场设计》文中进行了进一步梳理近年来伴随着军事航空的大力发展,平视显示器(Head-up Display简称HUD)在空军以及被广泛应用并且不断发展。在飞行过程中,飞行员通过HUD显示设备来获取飞机的飞行状态和飞行参数。目前针对HUD显示界面的信息布局和色彩各方面的研究较为广泛。本论文以HUD界面为研究对象,以人-机-环系统为基础,结合飞行员视觉认知,针对HUD界面视场布局开展工作:(1)从人、机、环三个方面分析飞行员与飞机HUD显示器设备以及外部环境之间的相互关系。人的方面,主要阐述了与研究相关的人体系统及视觉参数,视觉特性视场大小,以及飞行工作中由于人的因素产生的影响;机的方面,研究了飞机的简单飞行原理,平视显示器的系统,平视显示器的信息构架和视场布局;环境方面,介绍了飞行员所处的天空环境,研究了飞行环境从生理上和心理上对于人的影响。(2)研究飞行员视觉认知和视觉搜索行为。根据Endsley的情境感知理论模型,从界面分析了信息获取第一阶段中存在影响的因素,重点分析了信息传递阶段中所涉及到的情境感知,选择性注意、视觉搜索等问题。结合眼动追踪研究方法,通过预实验测试在单因素的条件下,研究背景信息对于飞行员造成的视觉搜索影响。引入计算机视觉的显着性分析,研究飞行员视觉搜索机制,以及画面显着性对于视觉搜索的影响。建立HUD画面显着性和飞行员视觉认知的映射关联。(3)基于本文所提出的画面显着性和飞行员视觉认知的映射关联,针对画面中出现的显着性差异和画面选择性注意分配的状态,设计出两个自适应显示视场的界面调整方案。本文通过分析人-机-环系统以及对HUD界面视场自适应的研究,为降低飞行员对于飞机HUD界面的认知难度提供了新思路,从人机工效学和视觉显着性两个方面对于飞机的显示视场进行改进研究,平衡飞行员同一界面中可能出现的视觉差异,提高使用效率。

张贵兰[8](2019)在《科学数据用户相关性标准研究》文中进行了进一步梳理科学数据已经成为科学研究的战略性资源。从海量科学数据资源中发现所需数据成为研究人员的迫切需求。由此,理解科学数据相关性判断的认知本质,为科学数据的高效发现、质量判断、以及治理提供理论基础,成为信息科学领域相关性研究的新课题。用户相关性研究力图理解用户检索信息行为的认知机制进而实现行为的解释和预测。学者们已经先后开展了多种信息类型的相关性标准研究,认为相关性标准与信息类型具有关联性。因此,科学数据作为新型信息类型,相关性标准集合、内涵以及对判断的影响会发生怎样的变化是一个需要回答的问题。研究基于刺激反应理论和透镜模型理论提出了科学数据相关性判断认知模型,抽样选取了86名科学数据研究生,综合运用眼动仪记录、访谈和问卷等构成的三角测量方法观察和记录了具有真实信息需求的科学数据检索者的相关性判断过程,并运用内容分析法和层次分析法等方法创新性地探索了科学数据用户相关性判断的线索、标准及使用特征。首先,研究首次提出了9个科学数据相关性标准,分别为:主题性、可获得性、质量、规范性、权威性、全面性、便利性、可用性、时效性。其中主题性、可获得性、时效性、权威性、质量、便利性和可用性是跨越不同信息载体而存在的共性标准;全面性和规范性是与科学数据自身特质相关的独特标准。且科学数据相关性标准具有层级性,9个相关性标准可分为5大类。第二,研究首次明确区分了科学数据信息特征、线索、相关性标准并分析了三者的对应关系。信息特征是客观存在于外界环境的数据的外在表现。判断者对信息特征进行感知的信息是判断中的线索。大脑感知线索触发用户认知中的工具性概念是判断的标准。第三,相关性标准的认知处理过程呈现出两个特点:一重刺激,多重反应;多重刺激,一重反应。主题性认知处理过程既需要常规数据信息特征如题目、摘要,又需要综合专业知识,最为复杂。其余相关性标准的调用基本不依赖专业知识。第四,研究探索了用户长时记忆中相关性标准的使用特征,相关性标准的使用符合长尾定律和最小省力原则。整个判断过程符合锚定与调整策略,主题性为相关性判断中的锚,其余标准都是在这个“锚”定后的后续调整。最终的判断结果是相关性标准线性累加的结果。最后,综合信息特征、线索、用户相关性标准特点及其内在关系,提出了科学数据相关性判断模型。本文创新性——研究首先在用户相关性理论方面有所创新,基于刺激反应理论和透镜理论,提出了科学数据用户相关性判断的理论模型,较为完整地描述了科学数据相关性判断全过程,丰富了用户相关性判断的理论。其次,研究综合考虑了相关性判断过程中各变量的性质及相互关系,首次将眼动观测与访谈、问卷等方法集成为三角测量法,实现了方法的创新。下一步,将进一步拓展用户和情境类型,丰富现有的科学数据相关性判断理论模型,提升模型的描述和解释能力。

张哲为[9](2019)在《基于感兴趣区域率失真优化的视频压缩编码通信系统设计》文中认为基于感兴趣区域模式的视频压缩编码近年来成为视频压缩、计算机视觉领域研究的热点课题。从广义上来讲,视频中的感兴趣区域指视频帧中引起人们注意的像素部分区域。它通常包括视频中运动的目标、色彩变化的区域。感兴趣区域视频编码的关键思想在于,对这部分区域以较小的量化步长进行压缩编码,以获得较高的编码精度。而对于非感兴趣区域部分,则采用较大的量化步长进行粗糙编码,以降低整体编码输出的比特。依据人体视觉系统的要求,感兴趣区域视频编码的目的是将特定的感兴趣区域在解码端得以清晰的呈现,而对于非感兴趣区域,人们的关注点并不在这部分,因此并没有必要完全保证这部分的编码质量。换句话说,在某种特定应用场景下,为尽可能减小编码速率,仅保留感兴趣区域部分的编码精度以达到不影响人们对视频内容理解的目的。本文设计了一套基于感兴趣区域率失真优化的视频编码通信系统,该系统包括感兴趣区域提取模块、感兴趣区域视频编码率失真模块与感兴趣区域视频流传输模块。设计这套系统的目的在于实现低比特视频流通信同时不影响对视频内容的理解。围绕这一系统展开,本文主要研究这三大模块中的三个核心技术:感兴趣区域提取技术、感兴趣区域视频编码的率失真优化技术、感兴趣区域视频流在无线网络环境下的传输技术。其中,感兴趣区域提取技术主要研究如何从视频帧数据中提取感兴趣区域,它主要指运动的区域以及一些特定的目标物体。这一部分区域作为视频帧的前景部分,而其它区域则作为背景部分。感兴趣区域视频编码的率失真优化技术主要解决视频编码中的速率和失真权衡的问题。即给定一组视频序列,使得速率受限制的约束条件下,该组序列的失真达到最小。在解决这一优化问题时,如何建立恰当准确的速率失真模型是其中的关键部分。速率失真模型可对感兴趣区域编码模式下的速率、失真进行数学描述。通过速率失真模型列出率失真优化问题的目标函数以及约束条件,并对其进行求解,得到视频组序列每帧的比特分配方案,进而设计速率控制策略。感兴趣区域视频流传输技术主要以异构无线网络为背景,通过对视频帧中编码单元的编码信息进行封装,组成网络层的传输单元并将这些传输单元分配到不同属性的无线信道进行传输。异构无线网络的传输的模式仍基于端到端的传输模式,然而终端具有多家乡接入属性。通常上讲,终端具有多元化网络接入单元接口,可同时接入不同属性的无线网络。感兴趣区域编码模式下的视频流传输力图保证包含感兴趣区域信息的传输单元能够具有较少的传输失真与解码失真。同时,视频流的传输需满足实时性要求。对于超过时延截止部分的视频流分组则会被丢弃以节约网络资源。此外,传输过程中引入信道差错控制编码技术,通过引入额外监督位降低误码率,并尽可能满足感兴趣区域部分信息得以完整的解码与重建。本文针对上述内容,对感兴趣区域视频编码的关键技术进行了深入详细的研究,主要内容包括:(1)研究了感兴趣区域提取技术。结合传统的数字图像处理理论以及当前流行的深度学习理论。本文分别提出了两种新的感兴趣区域提取检测方法:级联模型算法与基于文本主题模型的边界框修正算法。其中,级联检测算法四个级联步骤:全局运动补偿,运动块提取,多层像素分割和模型更新。前面两个步骤提取前景运动块并形成运动遮罩,后面两个步骤移除属于运动遮罩内背景的像素,并更新背景模型的颜色分布。另外,提出了基于块到像素的检测思路以实现检测灵活性。所提出的方法的另一个好处是它可以嵌入视频编解码器中以进行实时ROI检测和编码。实验结果表明,该方法在检测精度和时间消耗方面都实现了改进的性能。文本主题模型的边界框修正算法属于机器学习算法。它包含两个阶段:模型训练与验证。在训练阶段,它将检测目标图像的特征点信息转换成文本信息。在文档主题生成模型(Latent Dirichlet Allocation,LDA)的基础上,本文提出了一个具有单词共现先验的主题模型,其中图像特征之间的共现信息被充分利用。在验证阶段,本文提出了一种基于边界框(Anchor-box)的修正算法,该算法可以从一些传统算法中快速检测与预训练主题模型相对应的检测结果,并具有快速检测时间。对各种数据集的实验表明,所提出的方法可以在效率和计算成本方面提高检测性能。它对于颜色,光照,尺度等不同的物体也具有鲁棒性。有趣的是,所提出的方法可以与许多快速但有失准确性的感兴趣区域提取算法相结合,并增强了系统模型的灵活性。(2)研究了感兴趣区域视频压缩的率失真优化与速率控制技术。本文提出了一种基于DCT残差系数的混合分布与径向基函数神经网络的适合感兴趣区域编码模式下的速率失真模型。通过将编码单元分类为不同的深度、纹理特征来对其速率失真进行建模。在此之后,利用所提出的速率失真模型,列出率失真优化问题的目标函数以及约束条件,并根据凸优化理论对其进行求解。同时,设计针对感兴趣区域编码模式下的速率控制策略。通过实验验证,所提出的方法在解码重构的视觉质量,速率失真性能和比特率精度等方面取得了相应的改进。它针对感兴趣区域部分取得了较高的编码精度,同时保持编码缓冲器稳定输出,失真满足在可控范围内。(3)研究了感兴趣区域编码模式下视频流在无线异构网络环境下的传输技术。本文提出了一种基于感兴趣编码模式视频传输框架,该框架基于多家乡接入终端的异构无线网络环境。它包含感兴趣区域提取模块和帧分离器的模块,其中编码单元被分类封装到网络传输单元中。该框架还包括监视每个通信路径状态的信道监视器,并将反馈信号发送至视频流控制器来进行分组调度控制。本文提出了用于信道状态预测的深度学习方法。为了解决视频流分组传输问题,本文设计了适用于感兴趣区域编码模式下的视频流传输的速率失真模型,并制定传输调度策略。该策略传输延迟和失真之间寻求平衡点。它还保证具有ROI内容的数据包在具有足够带宽和低损耗的路径上进行传输。通过与其他传输方法的比较的模拟实验,验证了所提出的方案在视频传输质量,端到端延迟以及播放流畅度方面均取得了良好的效果。

薛昊[10](2019)在《基于深度学习的文本检测与识别》文中提出图像作为当今重要的载体承载了大量的信息,对其中的文字信息提取能推动对图像的理解。相比特定场景的文字信息提取问题,自然场景下文字定位的难度较大。同时由于文档、报纸和票据存在的折叠卷曲现象,增加了拍摄得到的图像在后期文字检测与识别上的难度。针对这些问题,本文基于深度学习提出了一种扭曲文档图像矫正的模型和一个文本检测与识别模型,具体的工作包含以下内容:1、提出了Stacked-EAST模型用于矫正扭曲的文档图像。该模型针对扭曲文档图像的每个像素预测偏移数据从而矫正图像,并且训练数据可从平展文档图像自行生成,易于理解且适用范围较广;2、提出了一种适用于自然场景下的文字检测与识别模型。在文本检测方面本文将二阶段的目标检测与图像分割思想结合,并针对长文本难以定位的问题进行了改进,提出了最大合并的非极大值抑制算法,提高了票据等文档环境下的文本检测的效果;在文本识别方面,本文结合了领域内广泛使用的CRNN模型对已经检测到的文本区域内的文字进行识别。本文提出的文字检测与识别模型在多个数据集上取得了较为优秀的效果,并取得了天池ICPR MTWI 2018网络图像的端到端文本检测和识别挑战赛的第十名,证明了其有效性。

二、基于文档分割的图像兴趣域检测及编码方法(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、基于文档分割的图像兴趣域检测及编码方法(论文提纲范文)

(1)面向智能视频监控场景的感知优化与内容分析算法研究(论文提纲范文)

摘要
Abstract
专用术语注释表
第一章 绪论
    1.1 研究背景与意义
    1.2 国内外相关工作研究进展
    1.3 论文的研究内容和主要贡献
        1.3.1 研究内容
        1.3.2 主要贡献
    1.4 论文结构安排
第二章 研究基础及相关工作
    2.1 分布式视频编码算法相关研究
        2.1.1 分布式视频编码基础理论概述
        2.1.2 相关工作
    2.2 视频修复算法相关研究
        2.2.1 张量基础理论概述
        2.2.2 相关工作
    2.3 视频目标分割算法相关研究
        2.3.1 视频目标分割基础理论概述
        2.3.2 相关工作
    2.4 本章小结
第三章 基于预测的分布式视频编码优化算法研究
    3.1 引言
    3.2 相关工作
    3.3 基于预测的边信息生成算法
        3.3.1 边信息预测模型
        3.3.2 生成边信息
    3.4 仿真实验与结果分析
        3.4.1 实验参数设置
        3.4.2 基于公开数据集的实验结果与分析
    3.5 本章小结
第四章 基于张量列秩的视频修复算法研究
    4.1 引言
    4.2 相关工作
    4.3 基于张量列秩的视频补全算法
        4.3.1 基于张量列秩的近似张量求解算法
        4.3.2 基于张量列秩的自适应权重机制
        4.3.3 基于张量列秩的自适应加权张量补全算法
    4.4 仿真实验与结果分析
        4.4.1 实验参数设置
        4.4.2 基于公开数据集的实验结果与分析
        4.4.3 基于实际监测场景感知数据的实验结果与分析
    4.5 本章小结
第五章 基于吸收马尔科夫链的感知视频片段目标分割算法研究
    5.1 引言
    5.2 相关工作
        5.2.1 基于自定义特征规则的半监督视频目标分割
        5.2.2 基于自定义特征规则的无监督视频目标分割
    5.3 基于吸收马尔科夫链的视频目标分割算法
        5.3.1 边权重模型
        5.3.2 基于吸收马尔科夫链有向图的视频目标分割机制
    5.4 仿真实验与结果分析
        5.4.1 实验参数设置
        5.4.2 基于公开数据集的实验结果与分析
        5.4.3 基于实际监测场景感知数据的实验结果与分析
    5.5 本章小结
第六章 基于注意力机制的感知视频目标分割算法研究
    6.1 引言
    6.2 相关工作
        6.2.1 无监督神经网络视频目标分割
        6.2.2 半监督神经网络视频目标分割
    6.3 基于注意力机制的时空CNN-LSTM视频目标分割算法
        6.3.1 三维卷积注意力残差预测模型
        6.3.2 光流预测模型
        6.3.3 生成分割目标
    6.4 仿真实验与结果分析
        6.4.1 实验参数设置
        6.4.2 基于公开数据集的实验结果与分析
        6.4.3 基于实际监测场景感知数据的实验结果与分析
    6.5 本章小结
第七章 总结与展望
    7.1 总结
    7.2 展望
参考文献
附录1 攻读博士学位期间撰写的论文
附录2 攻读博士学位期间参加的科研项目
致谢

(2)基于改进Faster R-CNN的钢轨踏面块状伤损检测研究(论文提纲范文)

摘要
abstract
第一章 绪论
    1.1 背景及意义
    1.2 国内外研究现状
        1.2.1 钢轨表面伤损检测方法的研究现状
        1.2.2 基于深度学习的目标检测算法研究现状
    1.3 本文主要研究工作
    1.4 本文章节安排
第二章 相关理论基础介绍
    2.1 深度卷积神经网络
        2.1.1 网络结构及运算
        2.1.2 网络训练
    2.2 目标检测
        2.2.1 典型传统目标检测
        2.2.2 基于卷积神经网络的目标检测
        2.2.3 常用评价指标
        2.2.4 常见的损失
        2.2.5 常用数据集
    2.3 本章小结
第三章 基于Faster R-CNN的钢轨踏面块状伤损检测
    3.1 钢轨踏面块状伤损数据集
    3.2 Faster R-CNN检测网络设计
        3.2.1 基于Res Net和 FPN的伤损特征提取
        3.2.2 基于RPN的兴趣域生成
        3.2.3 兴趣域池化
        3.2.4 伤损的分类和定位
    3.3 伤损检测实验结果及分析
        3.3.1 实验平台及评价指标
        3.3.2 网络训练过程
        3.3.3 实验结果及分析
    3.4 本章小结
第四章 基于改进Faster R-CNN的钢轨踏面块状伤损检测
    4.1 边框回归损失函数的改进
    4.2 基于GA-RPN的兴趣域生成
    4.3 改进Faster R-CNN的检测网络设计
    4.4 本章小结
第五章 基于改进Faster R-CNN的钢轨踏面块状伤损检测实验结果与分析
    5.1 实验平台及评价指标
    5.2 检测网络训练
        5.2.1 基于GIoU的检测网络训练
        5.2.2 基于GA-RPN的检测网络训练
    5.3 实验结果及分析
    5.4 本章小节
第六章 总结与展望
    6.1 总结
    6.2 展望
参考文献
个人简历 在读期间发表的学术论文
致谢

(3)科学数据用户相关性判断模型研究(论文提纲范文)

摘要
abstract
第一章 绪论
    1.1 研究背景与意义
    1.2 研究目标与内容
    1.3 研究设计
第二章 用户相关性研究综述
    2.1 信息科学中的相关性
        2.1.1 相关性理论
        2.1.2 相关性研究视角
        2.1.3 相关性概念
    2.2 用户相关性判断
        2.2.1 相关性判断的驱动力——信息需求
        2.2.2 相关性判断发生的情境——信息交互过程
        2.2.3 用户相关性判断模型
    2.3 用户相关性标准
        2.3.1 相关性标准的定义与功能
        2.3.2 用户相关性标准识别研究
        2.3.3 相关性标准使用研究
    2.4 本章小结
第三章 科学数据及其查询与检索研究
    3.1 科学数据的重要性分析
        3.1.1 社会信息中的科学数据
        3.1.2 科学研究中的科学数据
    3.2 数据以及科学数据概念与特征
        3.2.1 数据的基本概念与特征
        3.2.2 科学数据的概念与特征
    3.3 科学数据认知与期望
    3.4 科学数据发现与检索
        3.4.1 系统导向的科学数据检索实践
        3.4.2 用户导向科学数据查询与检索探索
        3.4.3 科学数据查询与检索面临的问题
    3.5 科学数据相关性判断模型研究必要性与意义
        3.5.1 科学数据相关性判断研究的必要性
        3.5.2 科学数据相关性判断研究的意义
    3.6 本章小结
第四章 科学数据用户相关性判断模型研究设计
    4.1 概念假设模型
        4.1.1 概述
        4.1.2 理论依据
        4.1.3 认识导向的相关性判断假设性概念模型
    4.2 研究目的、目标与科学问题
    4.3 研究设计
        4.3.1 研究方法论
        4.3.2 技术路线
        4.3.3 研究策略
    4.4 本章小结
第五章 科学数据用户相关性判断描述性概念模型研究
    5.1 概述
    5.2 研究设计
        5.2.1 概念模型与科学问题
        5.2.2 研究过程
    5.3 被试遴选
    5.4 数据收集
        5.4.1 检索前访谈
        5.4.2 相关性判断行为测量与数据采集
        5.4.3 检索后访谈—情境再入式半结构化访谈
    5.5 数据处理与分析
        5.5.1 编码与内容分析
        5.5.2 眼动数据处理
    5.6 研究结果与分析
        5.6.1 科学数据相关性标准识别
        5.6.2 科学数据信息元(SDIEs)及其与标准之间的关系
        5.6.3 科学数据用户相关性/有用性
        5.6.4 相关性判断的认知加工特征分析
        5.6.5 决策规则识别
        5.6.6 科学数据用户相关性判断描述性概念模型总结
    5.7 研究发现与结论
        5.7.1 科学数据相关性判断的认知整合/透镜过程
        5.7.2 科学数据相关性标准结构TAQA-U及其价值
        5.7.3 科学数据相关性标准特征分析
        5.7.4 科学数据相关性判断的多标准决策认知本质
    5.8 本章小结
第六章 科学数据用户相关性判断实证性量化模型研究
    6.1 概述
    6.2 研究设计
        6.2.1 研究问题
        6.2.2 研究过程
    6.3 第一阶段:描述性验证
        6.3.1 被试遴选
        6.3.2 数据收集
        6.3.3 数据分析
        6.3.4 研究结果
    6.4 第二阶段:实证性量化研究
        6.4.1 概念模型与研究假设
        6.4.2 数据收集与处理
        6.4.3 研究结果与分析
    6.5 研究发现与结论
        6.5.1 科学数据用户相关性标准使用特征分析
        6.5.2 基于相关性标准结构的科学数据用户相关性判断模式分析
    6.6 本章小结
第七章 多标准相关性排序(MCRR)算法及其应用框架设计
    7.1 概述
    7.2 MCRR多标准相关性排序算法
        7.2.1 算法需求
        7.2.2 算法设计
        7.2.3 MCRR算法流程
        7.2.4 算法功能与价值
    7.3 应用框架设计
        7.3.1 用户导向的科学数据查询与检索模型
        7.3.2 基于MCRR算法的科学数据查询与推荐系统框架
        7.3.3 框架特色介绍
    7.4 本章小结
第八章 结论与展望
    8.1 研究结论
        8.1.1 提出并验证了科学数据用户相关性判断模型
        8.1.2 探索了多标准相关性性排序算法及其应用框架
    8.2 创新性分析
        8.2.1 理论创新
        8.2.2 研究方法创新
    8.3 研究不足与未来研究
        8.3.1 研究不足
        8.3.2 未来研究与展望
参考文献
附录 A
附录 B
附录 C
附录 D
致谢
作者简历

(4)5G网络技术对提升4G网络性能的研究(论文提纲范文)

引言
1 4G网络现处理办法
2 4G网络可应用的5G关键技术
    2.1 Msssive MIMO技术
    2.2 极简载波技术
    2.3 超密集组网
    2.4 MEC技术
3 总结

(5)行人的特征表示与再辨识(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 课题研究背景
        1.1.1 研究背景和意义
        1.1.2 课题主要难点和关键技术
    1.2 国内外研究现状
        1.2.1 基于传统特征的行人再辨识
        1.2.2 基于深度特征的行人再辨识
        1.2.3 行人再辨识的损失函数
    1.3 数据集及性能评估
        1.3.1 行人再辨识常用数据集
        1.3.2 性能评估标准
    1.4 本文主要工作和研究成果
    1.5 论文结构安排
第二章 基于图像数据的行人再辨识
    2.1 引言
    2.2 图像数据行人再辨识背景
        2.2.1 行人再辨识基本框架
        2.2.2 基于人体部分区域的特征学习
        2.2.3 显着性学习
        2.2.4 判别性行人特征增强学习
    2.3 基于多级语义特征融合和显着性分析的特征学习
        2.3.1 网络整体框架
        2.3.2 中级语义特征融合模块
        2.3.3 高级语义特征提取模块
        2.3.4 基于显着性的块级别特征增强
    2.4 实验
        2.4.1 数据集
        2.4.2 实验设置
        2.4.3 特征学习实验对比
        2.4.4 实验结果对比与分析
    2.5 本章小结
第三章 基于序列数据的行人再辨识
    3.1 引言
    3.2 序列数据行人再辨识背景
        3.2.1 循环神经网络简介
        3.2.2 深度学习中的注意力机制
        3.2.3 时域特征融合
    3.3 基于帧特征增强和混合融合的特征学习
        3.3.1 网络整体结构
        3.3.2 双向帧特征增强模块
        3.3.3 帧特征混合融合模块
    3.4 实验
        3.4.1 数据集
        3.4.2 实验设置
        3.4.3 特征学习实验对比
        3.4.4 实验结果对比与分析
    3.5 本章小结
第四章 无监督行人再辨识
    4.1 引言
    4.2 相关工作背景
        4.2.1 无监督行人再辨识背景
        4.2.2 行人关键点估计
    4.3 无监督行人特征学习
        4.3.1 网络整体框架
        4.3.2 基于关键点信息增强的无监督行人特征学习
        4.3.3 自适应簇多样性正则项
    4.4 实验
        4.4.1 数据集及实验设置
        4.4.2 特征学习实验对比
        4.4.3 实验结果对比与分析
    4.5 本章小结
第五章 总结与展望
    5.1 本文总结
    5.2 未来展望
参考文献
致谢
攻读学位期间发表的学术论文目录

(6)视频序列中的行为识别建模方法研究(论文提纲范文)

摘要
Abstract
缩略词注释表
第一章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 行为识别的特征表示
        1.2.2 分类识别方法
    1.3 视频序列的行为识别建模的技术难点
    1.4 行为识别视频数据库
        1.4.1 单人行为数据库
        1.4.2 复杂行为数据库
    1.5 论文的主要工作
    1.6 论文的组织结构
第二章 概率隐含语义分析模型的行为识别研究
    2.1 引言
    2.2 主题模型在行为识别中的应用
        2.2.1 主题模型
        2.2.2 主题模型在行为识别上的应用
    2.3 评估方法
        2.3.1 特征提取和表示
        2.3.2 特征编码与归一化
        2.3.3 pLSA模型设置
    2.4 实验结果与分析
        2.4.1 KTH数据库的实验结果
        2.4.2 UT-interaction数据库上的实验
    2.5 结果分析与讨论
    2.6 本章小结
第三章 行为相似度识别的过完备稀疏方法
    3.1 引言
    3.2 相关研究
    3.3 基于高斯混合模型的过完备稀疏方法
        3.3.1 特征提取
        3.3.2 高斯混合模型
        3.3.3 字典学习与稀疏编码
        3.3.4 概率加权的池化表示
    3.4 实验结果与分析
        3.4.1 实验设置
        3.4.2 参数选择
        3.4.3 不同特征描述符的性能比较
        3.4.4 与主流算法的性能比较
        3.4.5 结果分析与讨论
    3.5 本章小结
第四章 基于费舍尔矢量和局域聚合描述符矢量编码的行为识别方法
    4.1 特征编码方法
    4.2 费舍尔矢量和局域聚合描述符矢量编码
        4.2.1 费舍尔矢量编码
        4.2.2 局域聚合描述符矢量编码
        4.2.3 单词包、费舍尔矢量和局域聚合描述符矢量编码的关系
    4.3 基于软分配的局域聚合描述符矢量编码
    4.4 联合高阶矩的费舍尔矢量编码
    4.5 实验结果与分析
        4.5.1 实验设置
        4.5.2 主成分分析影响
        4.5.3 考虑软分配的局域聚合描述符矢量编码实验结果
        4.5.4 联合高阶矩的费舍尔矢量方法的实验结果
        4.5.5 结果分析与讨论
    4.6 本章小结
第五章 基于时空信息的超矢量编码行为识别方法
    5.1 引言
    5.2 基于时空信息的超矢量编码方法
    5.3 试验结果与分析
        5.3.1 KTH数据库上的实验结果
        5.3.2 UCF sports数据库上的实验结果
        5.3.3 UCF101数据库上的实验结果
        5.3.4 实验结果分析
    5.4 本章小结
第六章 总结与展望
    6.1 总结
    6.2 展望
攻读博士学位期间参加的科研项目和完成的论文
致谢
参考文献

(7)基于人—机—环的HUD自适应显示视场设计(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 研究背景
    1.2 研究现状
        1.2.1 人-机-环方面
        1.2.2 航空飞行任务的眼动研究
        1.2.3 针对HUD显示器界面设计优化的研究
        1.2.4 飞行作战环境的感知
    1.3 研究意义和研究内容
    1.4 研究方法
    1.5 研究框架
第二章 飞行员人-机-环境系统分析
    引言
    2.1 航空人-机-环境系统工程
    2.2 人-机-环系统中人的因素
        2.2.1 人体系统及感知
        2.2.2 与研究相关的视觉参数
        2.2.3 视觉特征
        2.2.4 在工作中由于人的因素可能造成的影响
    2.3 人-机-环系统中机的部分
        2.3.1 飞机组成和简单飞行原理
        2.3.2 战斗机基本飞行任务
        2.3.3 现代飞机上HUD显示界面
        2.3.4 平视显示器的工作原理及分类
        2.3.5 平视显示器的优点
        2.3.6 平视显示器视场研究
        2.3.7 HUD界面信息呈现构架
    2.4 人-机-环系统中环境的部分
        2.4.1 飞行环境综述
        2.4.2 温度变化
        2.4.3 噪音和振动
        2.4.4 特殊情况
    2.5 本章小结
第三章 飞行员的认知行为和视觉搜索行为研究
    引言
    3.1 飞行员认知行为特点研究
    3.2 信息加工处理
    3.3 飞行员的情境感知
        3.3.1 影响感知的外部影响因素
        3.3.2 注意力分配
    3.4 飞行环境背景信息处理
    3.5 视觉搜索
        3.5.1 评价视觉搜索模式的相关指标
        3.5.2 眼动研究的基本参数
        3.5.3 眼动的形式
    3.6 本章小结
第四章 不同外部环境下飞行员HUD认知的眼动实验研究
    引言
    4.1 不同飞行场景对飞行员HUD认知的眼动实验
        4.1.1 实验目的和意义
        4.1.2 实验设备
    4.2 实验材料
        4.2.1 实验对象
        4.2.2 实验变量
        4.2.3 实验过程
        4.2.4 实验步骤
        4.2.5 数据处理和分析
        4.2.6 数据分析
    4.3 不同飞行背景下HUD图像显着性的眼动实验
        4.3.1 实验目的和意义
        4.3.2 实验对象
        4.3.3 实验方案
        4.3.4 数据处理和分析
        4.3.5 极端情况分析
    4.4 本章小结
第五章 自适应显示视场下的HUD方案设计
    引言
    5.1 不同外部场景图像显着性下的自适应显示视场的HUD方案设计
        5.1.1 方案一不同显着性自适应显示视场的HUD方案设计
        5.1.2 方案二
    5.2 自适应显示视场流程
        5.2.1 起飞前准备
        5.2.2 飞行过程
    5.3 本章小结
第六章 总结与展望
第七章 致谢
参考文献

(8)科学数据用户相关性标准研究(论文提纲范文)

摘要
ABSTRACT
英文缩略表
第一章 引言
    1.1 问题提出
    1.2 研究内容和意义
        1.2.1 研究内容
        1.2.2 研究意义
    1.3 研究思路和方法
        1.3.1 研究思路
        1.3.2 研究方法
        1.3.3 分析方法
    1.4 关键概念
        1.4.1 科学数据
        1.4.2 用户相关性
        1.4.3 相关性判断
        1.4.4 用户相关性标准
        1.4.5 信息特征
        1.4.6 线索
    1.5 论文框架结构
第二章 国内外研究进展
    2.1 相关性发展概述
        2.1.1 作者、机构和国家分布情况
        2.1.2 学科分布情况
        2.1.3 相关性研究的主题及热点分析
    2.2 相关性标准梳理分析
        2.2.1 文献相关性标准
        2.2.2 网页相关性标准
        2.2.3 图像相关性标准
        2.2.4 音乐用户相关性标准
        2.2.5 不同信息载体类型下相关性标准对比分析
    2.3 科学数据
        2.3.1 科学数据特点
        2.3.2 科学数据相关性标准
    2.4 本章小结
第三章 用户相关性判断理论基础及科学数据用户相关性判断模型
    3.1 用户相关性判断理论基础
        3.1.1 信息行为学理论
        3.1.2 认知心理学理论
        3.1.3 相关性判断模型
    3.2 科学数据用户相关性判断概念模型
    3.3 本章小结
第四章 科学数据用户相关性标准集合及其分类
    4.1 问题提出
    4.2 实验设计
        4.2.1 实验方法
        4.2.2 第一阶段实验——深度访谈
        4.2.3 第二阶段实验——调查问卷
    4.3 科学数据用户相关性标准集合及概念
        4.3.1 主题性
        4.3.2 可获得性
        4.3.3 质量
        4.3.4 规范性
        4.3.5 权威性
        4.3.6 全面性
        4.3.7 便利性
        4.3.8 可用性
        4.3.9 时效性
    4.4 科学数据用户相关性标准分类
    4.5 科学数据用户相关性标准与文献用户相关性标准对比分析
    4.6 不同用户科学数据相关标准对比分析
    4.7 讨论
    4.8 本章小结
第五章 科学数据用户相关性标准认知处理过程
    5.1 问题提出
    5.2 实验设计
        5.2.1 实验方法
        5.2.2 眼动观测法
        5.2.3 被试
        5.2.4 任务选取
    5.3 数据分析和处理
        5.3.1 数据采集
        5.3.2 数据分析
    5.4 科学数据信息特征
    5.5 不同用户类型科学数据信息特征关注差异研究
    5.6 科学数据信息特征、线索与相关性标准对应关系
    5.7 各个相关性标准的认知处理过程
        5.7.1 主题性相关性标准的认知处理过程
        5.7.2 质量相关性标准的认知处理过程
        5.7.3 可获得性相关性标准的认知处理过程
        5.7.4 全面性相关性标准的认知处理过程
        5.7.5 便利性相关性标准的认知处理过程
        5.7.6 权威性相关性标准的认知处理过程
        5.7.7 时效性相关性标准的认知处理过程
        5.7.8 可用性相关性标准的认知处理过程
        5.7.9 规范性相关性标准的认知处理过程
    5.8 讨论
    5.9 本章小结
第六章 科学数据用户相关性标准使用特征
    6.1 问题提出
    6.2 实验设计
        6.2.1 实验方法
        6.2.2 被试选取
        6.2.3 实施过程
        6.2.4 权重的计算
    6.3 实验情境下科学数据用户相关性标准使用
        6.3.1 实验情境下相关性标准使用频次
        6.3.2 实验情境下相关性标准使用频次与重要性分析
    6.4 相关性判断中科学数据相关性标准权重
        6.4.1 实验性用户数据相关判断过程中获得成本权重计算
        6.4.2 科学数据用户相关性标准权重
        6.4.3 用户相关性标准使用特征分析
    6.5 讨论
    6.6 本章小结
第七章 结论与展望
    7.1 研究结论
        7.1.1 科学数据用户相关性标准集合
        7.1.2 科学数据用户相关性标准认知处理过程
        7.1.3 科学数据用户相关性标准使用特征
        7.1.4 科学数据用户相关性判断模型
    7.2 创新性分析
        7.2.1 理论创新
        7.2.2 选题视角的创新
        7.2.3 研究方法的创新
    7.3 研究不足与未来展望
        7.3.1 研究不足
        7.3.2 未来展望
参考文献
附录 Ⅰ:深度访谈被试名单
附录 Ⅱ:眼动实验被试信息
附录 Ⅲ:深度访谈提纲
附录 Ⅳ:科学数据用户信息查询特征调查问卷
附录 Ⅴ:眼动实验访谈提纲
附录 Ⅵ:编码表
附录 Ⅶ:层次分析法被试信息及权重打分表
致谢
作者简历

(9)基于感兴趣区域率失真优化的视频压缩编码通信系统设计(论文提纲范文)

致谢
摘要
ABSTRACT
1 绪论
    1.1 引言
    1.2 感兴趣区域视频压缩编码概述
    1.3 研究背景与意义
        1.3.1 研究中的关键问题与挑战
        1.3.2 相关背景概念介绍
    1.4 论文主要研究内容与创新点
        1.4.1 论文主要研究内容
        1.4.2 论文主要贡献与创新点
    1.5 论文的章节安排
2 基础理论与研究现状
    2.1 引言
    2.2 感兴趣区域提取技术的基础理论与研究现状
    2.3 ROI编码模式下率失真优化技术的基础理论与研究现状
    2.4 感兴趣区域视频流无线网络传输技术的基础理论与研究现状
    2.5 本章小结
3 感兴趣区域提取技术研究
    3.1 引言
    3.2 级联检测模型算法
        3.2.1 检测框架
        3.2.2 检测算法
    3.3 基于文本主题模型的边界修正算法
        3.3.1 模型
        3.3.2 检测算法
    3.4 实验与性能分析
        3.4.1 级联检测算法实验与性能分析
        3.4.2 文本主题模型边界修正算法实验与性能分析
    3.5 本章小结
4 ROI编码模式下的率失真优化技术研究
    4.1 引言
    4.2 ROI编码模式下的速率失真模型
        4.2.1 速率模型
        4.2.2 失真模型
        4.2.3 率失真优化问题
    4.3 ROI编码模式下的速率控制策略
        4.3.1 GOP层速率控制
        4.3.2 Frame层速率控制
        4.3.3 CU层速率控制
    4.4 实验分析
        4.4.1 实验准备
        4.4.2 编码质量比较
        4.4.3 编码速率-失真性能比较
        4.4.4 缓冲充盈度分析
        4.4.5 速率控制的准确度与编码时间分析
    4.5 本章小结
5 感兴趣区域视频流无线网络传输技术研究
    5.1 引言
    5.2 系统模型
        5.2.1 传输系统框架
        5.2.2 视频传输的速率失真模型
        5.2.3 无线接入网络模型
    5.3 传输优化问题与分组调度策略
    5.4 实验分析
        5.3.1 实验准备
        5.3.2 传输质量评估
        5.3.3 传输时延分析
        5.3.4 传输路径的信道状态分析
    5.5 本章小节
6 总结与展望
    6.1 论文的研究总结
    6.2 下一步研究工作展望
参考文献
作者简历及攻读博士学位期间取得的研究成果
学位论文数据集

(10)基于深度学习的文本检测与识别(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 文字信息提取的背景和意义
    1.2 文本检测相关技术
        1.2.1 传统的文字检测算法
        1.2.2 基于神经网络的文本检测算法
    1.3 图像矫正相关技术
    1.4 文本的主要内容与结构设计
第二章 深度学习相关理论基础
    2.1 神经网络概述
        2.1.1 神经网络的概念
        2.1.2 非线性激活函数
        2.1.3 梯度下降
    2.2 卷积神经网络
        2.2.1 卷积层
        2.2.2 池化层
    2.3 残差网络
    2.4 特征金字塔网络
    2.5 本章小结
第三章 扭曲文档图像矫正
    3.1 算法设计思路
    3.2 扭曲文档图像数据生成算法
    3.3 扭曲文档图像矫正模型
    3.4 模型分析与不足
    3.5 本章小结
第四章 基于深度学习的文本检测与识别
    4.1 相关工作
    4.2 算法整体框架
    4.3 文本检测网络模型
        4.3.1 文字区域候选框推选网络
        4.3.2 特征对齐网络
        4.3.3 文字区域分割网络
        4.3.4 损失函数
    4.4 文本框后处理
        4.4.1 非极大值抑制算法
        4.4.2 最大合并的非极大值抑制算法
    4.5 文本识别
    4.6 本章小结
第五章 实验分析
    5.1 数据集介绍
        5.1.1 票据文字图像数据集
        5.1.2 ICPR MTWI2018 网络文字图像数据集
    5.2 实验环境
    5.3 评价指标
        5.3.1 交并比
        5.3.2 精确率
        5.3.3 召回率
        5.3.4 F1-Score
    5.4 文本检测模型的训练与预测
    5.5 实验过程和结果分析
        5.5.1 票据文字图像检测实验结果
        5.5.2 ICPR MTWI2018 网络图像文本检测与识别实验结果
    5.6 本章小结
第六章 总结与展望
    6.1 本文主要工作和贡献
    6.2 后续研究工作
参考文献
致谢
攻读硕士学位期间已发表或录用的论文

四、基于文档分割的图像兴趣域检测及编码方法(论文参考文献)

  • [1]面向智能视频监控场景的感知优化与内容分析算法研究[D]. 曹莹. 南京邮电大学, 2020(03)
  • [2]基于改进Faster R-CNN的钢轨踏面块状伤损检测研究[D]. 芦春雨. 华东交通大学, 2020(03)
  • [3]科学数据用户相关性判断模型研究[D]. 刘建平. 中国农业科学院, 2020(01)
  • [4]5G网络技术对提升4G网络性能的研究[J]. 刘奕. 数码世界, 2020(04)
  • [5]行人的特征表示与再辨识[D]. 王殷浩. 北京邮电大学, 2020(05)
  • [6]视频序列中的行为识别建模方法研究[D]. 徐勤军. 东南大学, 2019(01)
  • [7]基于人—机—环的HUD自适应显示视场设计[D]. 俞雨晨. 东南大学, 2019(06)
  • [8]科学数据用户相关性标准研究[D]. 张贵兰. 中国农业科学院, 2019(08)
  • [9]基于感兴趣区域率失真优化的视频压缩编码通信系统设计[D]. 张哲为. 北京交通大学, 2019(01)
  • [10]基于深度学习的文本检测与识别[D]. 薛昊. 上海交通大学, 2019(06)

标签:;  ;  ;  ;  ;  

基于文档分割的图像兴趣域检测与编码方法
下载Doc文档

猜你喜欢