一、CME指导下的PADDING算法(论文文献综述)
宁靖[1](2021)在《基于生成对抗网络的图像去雾算法研究及其硬件加速》文中研究说明随着信息化的高速发展,图像已经成为人类信息传递的重要手段,但雾天等恶劣天气通常会使成像设备获取到的图像对比度下降、色彩偏移退化和细节丢失。获取到的低质量图像不仅会影响人的主观视觉感受,使人无法从图像中更好的获取和理解图像所包含的信息。而且会对无人驾驶、安防监控系统、卫星遥感航拍等很多智能科技处理系统造成性能影响,这些智能系统都需要一个清晰的图像源作为后续工作的基础。本文以生成对抗网络为基础设计了一种基于生成对抗网络的图像去雾算法,并且分析了所设计网络的去雾性能。本文首先介绍和分析了去雾领域以往所提出的一些算法,介绍了大气散射模型,从本质上分析了雾天图像降质的原因。着重分析了基于卷积神经网络的去雾算法DehazeNet算法和MSCNN算法。针对致力于估计出大气散射模型的中间参数从而求解出清晰图像的去雾方法会产生误差叠加等缺点,提出了一种基于生成对抗网络的单幅图像去雾算法,该网络的生成器包括特征提取、编码、解码和特征融合几部分,直接端对端的生成清晰图像,避免了任何中间参数的估计。本文所提出算法首先对输入的有雾图像进行多尺度的特征提取,同时图像经过编码解码后与提取出的特征再进行多尺度融合,最后得到清晰无雾图像。在网络优化方面,不仅使用了生成图像与标签图像的均方误差来进行网络约束,还通过最小化对抗损失、添加感知损失和L1损失来共同优化网络,使图像在清晰化的过程中能更好的还原色彩和保留细节信息,最后在PSNR、SSIM、MSE等度量标准下验证了本文所设计算法的去雾性能.在硬件加速方面,首先训练所设计的去雾算法,提取出训练生成的权重、偏置等参数并将其定点化。其次基于软硬件协同的方法设计了硬件加速的SOC系统架构,其中包含ARM上的控制部分以及FPGA上的数据计算部分,整个系统使用基于AXI标准的总线进行互联,重点介绍了系统中自定义的卷积计算模块和数据传输模块。最后使用Vivado软件对系统架构中所设计的模块进行仿真验证,并在ZedBoard开发板上进行板极验证。
王婕[2](2021)在《基于卷积神经网络的图像重构方法研究》文中研究指明图像重构作为图像处理领域中的重要研究课题得到了广泛的关注。本文将卷积神经网络算法应用于图像重构问题中,主要围绕图像去噪和CFA图像去马赛克两个方向展开研究,具体研究内容包括:(1)本文提出了一种基于多尺度特征融合的并行稠密残差去噪网络框架。该框架首先采用并行网络结构以结合不同深度的图像特征信息,每个网络分支由一系列连续的具有稠密连接的稠密残差块(Dense Residual Block,DRB)组成,并且DRB之间采用远程跳跃连接以克服网络训练过程中可能出现的梯度消失和梯度弥散等问题并提高网络训练性能。另外,在结合深层图像特征信息与浅层图像特征信息的基础上,每个网络分支内部引入了多尺度特征融合块(Multi-scale Feature Fusion Block,MFFB)以获取不同深度下的多尺度图像特征信息。最后采用残差学习策略进一步提高网络学习性能。本方法能够更好地保留图像中高频部分的有效特征信息,极大地提高了图像的清晰度和自然度,具有更好的去噪效果。(2)本文提出了一种基于深层稠密残差的生成式对抗神经网络的CFA图像去马赛克网络框架。其中生成器使用具有稠密残差块和远程跳跃连接的深层稠密残差网络,鉴别器由一系列堆叠的卷积单元构成。另外,本文结合了对抗性损失、像素损失以及特征感知损失对损失函数进行改进,从而加强网络重建图像的能力。本方法相较于其他传统插值算法可以更好地恢复图像边缘和细节部分的有效信息,并且对图像高频部分的伪影现象有很好的抑制效果。(3)本文提出了一种基于U-nct与稠密残差的生成式对抗神经网络的CFA图像去马赛克网络框架。其中生成器使用改进的U-nct网络模型,鉴别器使用深层稠密残差网络。本方法相较于其他传统插值算法可以在有效抑制图像伪影现象的同时,能够更好地恢复图像纹理和边缘等高频信息,产生高分辨率的清晰彩色图像。
李学日[3](2021)在《基于双通道卷积长短时记忆神经网络的肺音识别方法研究》文中研究说明肺音是人体呼吸时产生的一种生理信号,当肺音出现异常时往往预示着肺器官发生病变。但传统的肺音诊断方法,对于医生的经验和技术要求非常高,不便于大规模实施。因此,本文通过研究肺音信号的时序特征,使用神经网络实现肺音病理诊断,有效的降低了临床实施门槛。针对单一模型在肺音信号上不能同时获取空间信息和时序信息的缺陷,本文首先提出了单通道卷积长短时记忆神经网络算法(CNNLSTM),串行获取肺音数据的特征。该模型中的LSTM层可以对CNN层提取的特征进行学习,保留有用信息,遗忘无效信息,既克服了传统CNN模型在小样本训练中易发生过拟合的缺陷,又克服了单一LSTM模型对非连续数据间的信息不能有效挖掘的缺陷。进一步的,针对CNNLSTM模型中经过CNN提取的特征图分辨率下降的问题,本文提出了双通道卷积长短时记忆神经网络算法(DCCLNN),并行获取肺音数据的特征,通过加权融合的方式生成新的特征,有效的弥补了CNNLSTM模型中经CNN提取后特征图的分辨率下降的不足。论文的主要贡献如下:(1)在对肺音数据预处理中,增加了巴特沃斯滤波去噪,数据归一化,小波变换,LBP处理和数据增强等操作,为有效提升模型的准确率提供了保障。(2)提出了一种单通道卷积长短时记忆神经网络(CNNLSTM)方法串行获取肺音数据特征。(3)提出了一种双通道卷积长短时记忆神经网络(DCCLNN)方法并行获取肺音数据特征。本文在R.A.L.E.?Lung Sounds肺音数据集上进行实验,目前效果最好的Dalal_CNN准确率为89.56%;而本研究所提出的CNNLSTM的准确率为96.43%,DCCLNN的识别准确率为97.40%。由实验结果表明,本文提出的CNNLSTM和DCCLNN方法与Dalal_CNN相比,准确率分别提高了6.87%和7.84%。
史启盟[4](2021)在《高速运动物体图像识别与压缩方法研究》文中进行了进一步梳理运动物体视频图像包含着许多重要的信息数据,而高速运动物体由于速度较快,其运动图像存在采集失真、处理复杂以及分析效果差等方面的问题。本课题以高速运动物体为研究对象,分别进行了图像识别与图像压缩方法的研究,并选取实际工业中的3D打印机高速移动激光点红外图像和高速运动固定翼无人机视频图像分别进行了算法验证及结果分析。主要研究内容如下:(1)分析了高速运动物体图像特征及图像识别过程,提出了基于改进卷积神经网络的高速运动物体图像识别方法。根据高速运动物体运动速度快导致的成像模糊,使得传统的图像识别方法人为提取图像特征困难的问题,采用基于卷积神经网络(CNN)的深度学习方法进行图像识别研究,并针对现有的CNN方法存在的训练效率差、准确率低的问题设计了相关改进方案来提高图像识别的快速性和准确性。(2)针对3D打印机高速移动激光点红外图像进行图像识别研究,分别建立了CNN和改进CNN两种激光点图像识别模型,对两种模型进行对比分析,实验结果表明改进后的CNN模型大大提高了识别效率和准确率;最后利用改进后的CNN模型进行激光中心点温度预测,在误差范围内取得了很好的预测结果。(3)研究了高速运动物体视频图像冗余信息,提出了基于帧内编码和帧间预测结合的高速运动物体视频压缩方法。以静态图像压缩为基础,在传统BP神经网络的基础上加入小波变换的方法进行图像压缩以减少帧内的空间冗余信息,同时针对高速运动物体的视频序列进行了运动信息补偿从而减少帧间的时间冗余信息,最终重构后的视频在保证关键运动信息的前提下大大减少视频数据量。(4)针对高速运动固定翼无人机视频进行图像压缩研究,先对单帧的无人机运动图像进行基于小波变换和神经网络结合的帧内有损压缩,再对压缩后的无人机序列进行基于运动估计和运动补偿的帧间预测编码,最后对压缩前后的无人机运动视频进行目标跟踪和视频传输效果方面的对比分析,结果表明该压缩系统在保留无人机运动信息的情况下可以大大减少冗余数据信息,提高传输效率。
杨欢[5](2021)在《基于深度学习的市民服务热线案件智能分类研究》文中研究指明市民服务热线作为政府和各职能单位服务人民的的重要窗口,实现了聆听群众的诉求,普及政策法规,解决难点问题,为维持社会的和谐稳定起到关键作用。市民服务热线是当今政府和职能部门获取社会信息,服务于广大群众,建设基层的一种重要途径。针对基于深度学习的市民服务热线提供文本分类任务,传统的深度学习网络模型一般都是运用LSTM长短时记忆性神经网络和CNN卷积神经网络,但是CNN只能通过挖掘局部特征,忽略了局部语料特征,对于较长的文本来说不太友好,而LSTM对局部语料的其他特征提取效果较为逊色,因此,本文综合LSTM和CNN两个模型对于文本特征提取上的优势,形成TLSTM融合模型,同时,融入Attention注意力机制,能够有效学习得到词向量的权重分布。综上,本文提出基于Word2vec-TLSTM-Attention的融合神经网络模型对文本进行分类。首先我们对这些文本内容进行了文本预处理,文本预处理过程采用的是jieba分词工具对语料库进行中文分词和停用词文本过滤,之后,利用Word2vec模型对语料库进行训练得到文本对应的词向量,其次将词向量分别输入到TextCNN、LSTM单一神经网络模型中,随后通过Attention注意力机制计算市民服务热线各类别权值分布。最后对单一模型和融合模型的分类结果进行对比分析。实验证明本文提出基于Word2vec-TLSTM-Attention的融合神经网络模型对本文语料库产生了更好的效果。
来文豪[6](2021)在《基于多光谱波段选择的煤矸石识别和快速检测研究》文中提出煤炭在中国当前的能源中有着非常重要的角色,尽管近年来,煤炭在能源中的比例逐步下降,但煤炭的消耗量仍有所增加。这意味着,在未来相当长的一段时间,中国每年需开采大量的煤炭,需加强煤矿现代化建设。随着人工智能等信息技术的快速发展,煤矿的智能化建设也被提上日程。如:2020年3月,发改委等8部门共同发布指导意见,以推动和加快煤矿智能化建设。煤矸石分离是煤炭开采过程中重要步骤,实现智能选煤不仅能提高生产效率,推进煤矿智能化建设,并且对煤炭的清洁高效利用也有重要意义。将多光谱成像技术联合深度学习,从实验手段和数据分析方法上研究煤矸石智能分离中的识别和定位。本文研究内容如下:1、构建一个深度无监督模型,获取煤和煤矸石的二维光谱图像的学习特征。改进卷积神经网络(Convolutional Neural Networks,CNN)分类模型结构,设计一个无监督特征学习模型,称为二维自编码器(2 Dimensional Auto-encoder,2D-AE),以端到端的方式获得学习特征。只需训练一个模型,就可获得所采集的多光谱数据各波段光谱图像的学习特征。设计的2D-AE输入分辨率为408×204,编码后的学习特征长度为64。此外,实验表明对于2D-AE模型,引入批归一化也可以改善模型的训练性能。2、把煤和煤矸石混合也作为一类,揭示不同波段光谱图像采用不同特征描述算子在不同机器学习算法下的可分性。机器学习算法CART、AdaBoost、RF和SVM用于煤、煤矸石以及煤和煤矸石混的识别,SVM的参数由MVO算法设定,AdaBoost和RF中弱学习机数分别设为175和60。人工特征选用HOG、SIFT和LBP。实验独立重复多次,每次数据随机划分,结果取平均值。结果显示,同一算法采用不同的特征,其最大平均识别准确率对应的波段存在差异;不同算法使用同一特征,其最大平均识别准确率同样存在差异。采用2D-AE学习特征,CART、AdaBoost、RF和SVM的识别结果相对最优。3、组合波段的选择。把最佳指数(Optimum Index Factor)结合可分性从25个波段选出3个,组合成伪RGB,用于煤矸石检测研究。实验中,3个波段组合的OIF平均值最大为11.138,对应的组合波段为7、12和23,且包含波段12(采用2D-AE特征,波段12可分性相对好),因此,把波段[7,12,23]组合视为最佳组合。4、将YOLO-V4用于煤矸石识别和定位研究,其输入分辨率分别设为416×416、512×512和608×608。结果显示,其输入分辨率越大,煤矸石检测的平均精度(Average Precision,AP)越大,但时间消耗也相对增加。非极大值抑制联合置信度阈值过滤预测的冗余边界框(False Positive,FP)。通过实验研究,非极大值抑制交并比设为0.4,置信度阈值设为0.25。输入分辨率设为416、512和608时,煤矸石检测的AP分别为89.94%、91.37%和95.51%。此外,YOLO-V3和SSD也用于煤矸石检测,结果显示,YOLO-V4的检测精度相对最优。5、改进YOLO-V4,记为V4.1,实现煤矸石准确、更高效的识别和定位。改进后的模型头部采用两种刻度的网格,分别为17×17和51×51。针对多光谱图像分辨率小,改进模型输入分辨率为408×408。实验发现,V4.1锚框(Anchor Box)的数设置为2、3和4时,煤矸石检测的AP以及时间消耗差别不大。为减小模型复杂度,V4.1锚框设为2,对应的煤矸石的检测AP为95.31%,115张测试图片的检测用时为3.8327秒,远小于采用608×608输入的YOLO-V4的7.871秒。6、设计一个轻量模型,实现煤矸石更快速识别和定位。为实现煤矸石更快速的检测,设计轻量模型,主干网络相对更浅和更窄,采用更小的输入分辨率。在204×204输入分辨率下,115张测试图片的检测用时仅为1.255秒,过滤预测冗余边界框后,煤矸石的检测AP值为91.91%,这优于采用416×416输入的YOLO-V4的89.94%。图[76]表[25]参[175]
向钰[7](2021)在《基于FPGA的卷积神经网络加速系统研究》文中研究说明卷积神经网络作为一种新兴的人工智能实现方式,通常部署在网络边缘设备上以实现物体检测识别等功能。在边缘计算场景中,边缘设备常处在维护难、供电能力差、计算性能要求高的环境下,由于现场可编程门阵列相较于中央处理器、图形处理器等传统神经网络计算器,拥有功耗低、体积小、并行计算能力强、对配套设施要求低等特点,因此将现场可编程门阵列作为卷积神经网络的边缘计算设备是更好的选择。本文针对边缘计算场景中所部署卷积神经网络的加速策略,进行了以下三个方面的研究:首先,对卷积神经网络计算过程中所涉及的参数进行了分析优化。传统卷积神经网络计算器中常使用poly衰减策略作为学习率更新手段,然而poly衰减策略的使用涉及到大量的浮点运算,这种方式与现场可编程门阵列的硬件特性并不匹配。因而本文改进了poly衰减策略,使用固定步长作为学习率更新的依据,从而降低poly衰减的算法维度,减轻神经网络计算器的计算压力。对于softmax分类函数,传统方法中涉及到复杂的指数计算,因此本文在此基础上,以允许最大误差的方式,将指数函数转化为分段的方式储存在查找表中,方便计算时调用,从而提高计算性能。对于普通参数,本文使用了动态确定Q值位数以改进单一Q值量化,进一步压缩了普通参数占用的存储空间。其次,对卷积神经网络计算过程中的并行性进行了分析优化。在卷积核层次上,通过对同一卷积核运算过程的分析,以流水线策略为基础,提出了利用数据缓冲器的方式,进一步减少了与外部存储器之间的数据交互次数,以及数据等待时间,最大化利用了可编程门阵列的计算资源,实现了计算结果的流输出。在多通道特征图层次上,以通道分离-流输出-时延相加的方式,同时进行多通道的结果输出,得到最终的多通道卷积结果。在卷积层间计算的层次上,通过使用推断-预计算的方式,在未计算出上层所需结果的时刻提前开始下一卷积层的计算,并使用内部寄存器存储临时计算结果,提高计算效率。最后,对卷积神经网络计算过程中的硬件资源分配,以及各模块设计并给出了硬件实现。本文在Xilinx 7Z035-2FFG676I处理器的基础上,利用Xilinx 7Z035开发板设计了一种卷积神经网络加速计算设备。在数据传输系统内,片上数据传输使用了QSPI总线,利用其队列传输机制实现各模块间的快速数据交换;开发板-主机端的通信采用了基于PCIe的数据交互方案,提高了大批量并发数据的传输能力。重新设计了卷积窗口读取系统,利用多个先入先出模块组合的方式实现了高速数据流串并行转换,以满足计算模块中并行计算方式的需求,同时也实现了padding以及无用数据剔除的功能。在加法器模块中,使用了并行前缀加法器的原理,利用开发板上丰富的门电路资源,使用高复杂度电路的形式降低了传统加法器的算法复杂度,提高了加法计算的速度。另外还设计了全连接、池化等模块的硬件电路,提供了模块化的卷积神经网络加速方案。结果表明,在使用卷积神经网络进行视频车辆识别的场景中,对比使用CPU架构的卷积神经网络计算器,本系统能够大幅度提高CNN的运算速度,能够获得更高的视频帧率;对比使用GPU的卷积神经网络架构方式,本系统能够在不大幅降低CNN的运算速度的前提下,极大降低系统的功率消耗。
杨圭[8](2021)在《基于CNN与图像处理的河道测流研究》文中指出水资源短缺一直是制约我国经济发展的重要因素,而河道流量的监测工作是水资源量化管理的关键。传统的人工测流工作量大、数据传输与处理不便,已经难以满足水资源智能化管理的要求,而近年来使用较多的多普勒流量计等仪器测流成本高、受环境影响大且预设参数众多,并非最便捷、智能的测流方式。因此,开发设计一种全自动化、普适性强的河道测流方案,对智慧测流及水资源的量化管理有着重要的意义。为了构建智能化的河道测流模型,水流流速及水位识别算法,实时测量与远程操控是模型的关键。近年来深度学习与图像识别技术的飞速发展为智慧化测流提供了思路,由于稳定状态下河流表面流速与波纹、浪花等特征存在着对应关系,且用于水位测量的水尺自身存在较强的几何特征,本文提出利用卷积神经网络对河道水流图像进行特征识别以确定表面流速,采用图像识别形态学变换识别水尺刻度以确定水位,结合两个模型的识别结果进一步计算得到河道实时流量。本文的主要研究内容及成果如下:(1)基于卷积神经网络构建了河道表面流速识别模型。使用自适应直方图均衡化对水流表面图像进行了特征加强;使用数据增强算法扩充了水流表面图像数据集,并对当前识别度较高的三种卷积神经网络模型进行结构设计,调节参数以获取最适合水面图像识别的模型。从输入、卷积、池化、全连接以及输出五个步骤阐述了如何对输入的水流图像进行分类识别,其中卷积核的设计以及卷积、池化层的排列最为重要,各层之间的特征图的尺寸与通道数的衔接变换是研究遵循的基本方法。利用Python与TensorFlow模块对卷积神经模型进行参数调整,确定了最优模型并实现了模型的反向传播训练与水流表面流速的识别。(2)基于图像识别形态学模块构建了水尺水位识别模型。从原始图像的预处理出发,利用边缘检测与水平像素和提取出水尺图像,再通过几何特征提取,消除数字与其他多余图像的影响进而获取刻度数,最后计算出水位值并进行算法率定。水尺图像的拍摄角度、距离对识别均有影响,本研究对几种拍摄角度的图像进行了对比,分别调节参数取得了较好的识别效果。(3)案例研究与分析。开展了水槽测流实验,利用构建的表面流速识别模型、水尺水位识别模型分别对不同流速、水位下的水流表面图像、水尺图像进行识别。实验获取了不同流速下的水流表面视频,按帧截取了大量水流图像,进行特征加强与数据增强后构建水流数据集,使用训练好的网络对其进行识别,准确率超过90%;对不同水位下的水尺图像的识别结果表明,利用形态学算法进行水尺刻度识别比Hough变换效果更好,对不同拍摄角度的水尺均有较好的识别精度,多次识别最大误差为19.05%。实验证明,本研究建立的表面流速识别模型与水尺水位识别模型均有效,二者结合即可计算河道的实时流量。综合来说,基于CNN与图像识别的河道测流方案是一种全新的测流手段,针对不同的应用环境,只需设置模型结构及少量基本参数可通过训练进行模型自我调整,保证了算法的普适性与智能性。同时河道监测点均安装摄像头,可同时实现视频监控与测流工作,管理方便,成本较低,且随着数据集的扩充,测流精度与准确度会进一步提高,本研究是智慧测流的重要发展方向。
肖小娇[9](2021)在《基于无造影剂MRI图像的肝癌智能诊断方法研究》文中提出肝癌是全球最常见且死亡率高的癌症之一。肝癌的微小肿瘤很难被及时发现是造成死亡率高的最主要原因。目前,磁共振成像(Magnetic Resonance Imaging,MRI)是临床主要的肝癌诊断手段之一,它通过注射造影剂可以明显提高肿瘤诊断的敏感性和特异性。然而,注射造影剂不可避免地存在风险高、毒性大和副作用大等问题。近年来,无造影剂MRI以其扫描时间短、低风险、无有毒金属危害等优势,成为研究的新热点。但在研究中,采用无造影剂扫描会使MRI图像的对比度较低、肿瘤区域边缘模糊,为肝肿瘤的准确诊断过程增加了许多难点。针对这一瓶颈问题,拟通过计算机对无造影剂MRI图像进行肝癌智能诊断,不仅能成为临床医师的辅助工具,也是提高患者生存率以及治愈率的重要方法。本文对基于无造影剂MRI图像的肝癌智能诊断进行了一系列研究。通过对无造影剂MRI图像的分析,借助人工智能技术对肝肿瘤的2D分割方法进行研究;在充分研究多模态无造影剂MRI影像间的互补信息的基础上,探索构建肝肿瘤的3D分割和多指标量化的多任务相关网络;挖掘多模态无造影剂MRI图像间的依赖信息,同时构建小样本数据的增强体系,实现肝部无造影剂MRI图像中肿瘤的自动分类;进一步研究分割和检测任务间的关联关系,构建肝肿瘤分割和检测的联合对抗学习网络。主要研究贡献如下:(1)针对无造影剂MRI图像中肝肿瘤的边缘模糊、与周围正常组织的对比度低、差异性较大和复杂度较高等特点,本文提出一种放射组学特征指导的DUN-GAN(Radiomics-guided DUN-GAN)网络用于肝肿瘤区域的2D分割。本部分的研究内容包括3个方面:i)密度嵌套UNet的分割器提取到肝肿瘤的语义特征和全局指导特征,并利用特征相关性对特征进行合理且高效的融合。ii)鉴别器中引入三相造影剂增强MRI图像(动脉期,门静脉期和延迟期)结合的放射组学特征作为先验知识,以学习到分割器和鉴别器间的映射关系。iii)在放射组学特征对抗思想的指导下,网络获得了准确性较高的无造影剂MRI图像中肝肿瘤的2D分割。本文提出的放射组学指导的先验知识以及多策略融合方式可以提取到无造影剂图像中关键的隐含的造影剂放射组学特征,从而实现低对比度图像中较准确的肝肿瘤分割。(2)针对无造影剂MRI序列图像中肝肿瘤空间解剖结构复杂,多模态无造影剂图像(T1FS+T2FS)间肿瘤表征差异较大,以及同时完成多任务(分割+量化)的复杂性较高等问题,本文提出一种双流相关3D(Two-stream associated 3DNet,TsA-3DNet)异构学习网络,利用多模态的无造影剂MRI来同时进行肝肿瘤的3D分割和多指标量化。本文研究内容主要包括两个方面:i)该网络充分考虑多模态数据的关联性和差异性,提出的多视角融合机制(Multi-view fused,Mv F)利用比例门优化算法提取多模态的互补信息,以进一步融合多通道(T1FS+T2FS)和不同尺度的特征。ii)该网络充分结合多任务间的关联和约束,提出的双向指导机制(Bi-directional guided,Bd G)关联多任务间的互补信息,以进一步实现多任务(分割+量化)的同时优化。本文提出的异构学习网络能够建立多视角特征的融合和多任务双向指导机制,从而较准确地同时实现多模态图像中肝肿瘤的3D分割和全面的多指标量化。(3)针对无造影剂MRI图像样本较少、自动识别复杂性较高、肿瘤特异性较低的问题,本文提出了一种稳定的细节指导的生成对抗(Detail-guided Generative Adversarial Network,Dg-GAN)网络,通过增强数据来改善肝肿瘤分类性能。Dg-GAN中的多尺度感知生成器引入残差块感知上下文信息,加强细节特征提取以合成更加逼真的造影增强图像。本文在合成数据增强的数据集上进行卷积和全局平均池化,并设计细节指导的VGG模型以验证数据增强对肝癌分类性能的影响。生成器的细节特征图被作为指导知识引入分类器,以促进不同类型肝癌的特异性特征提取和改善肿瘤分类性能。本文提出的数据增强方式有效地克服了数据样本少的难题,展示了较好的自动分类性能。(4)针对多模态无造影剂MRI图像间特征差异较大、分割和检测任务间复杂性较高的问题,本文提出联合对抗学习(United adversarial learning framework,UAL)网络,整合多模态无造影剂MRI的互补信息,以联合约束的方式实现肝肿瘤的同时分割和检测。首先,编码器通过引入边缘差异特征图的先验知识,增强三个模态的关键特征提取,同时利用门机制实现特征融合和自适应选择。坐标共享机制使得分割和检测进行联合以实现统一学习,同时将多相放射组学特征与语义特征结合以实现分割和检测的同时对抗学习。本文提出的联合对抗学习网络较充分的提高肝肿瘤分割和检测的性能。综上所述,本文围绕无造影剂MRI图像的肝癌智能诊断的四个问题,从不同的目的进行了相关任务的研究和网络的构建,这项工作具有一定的计算机理论意义和辅助诊断的价值。
王歌阳[10](2021)在《面向编码的均匀采样全景视频投影方法研究》文中指出近年来,作为一种能展现360度全方位视角的媒介,全景视频在监控、场景展示、赛事直播等领域展现了独特的魅力,逐步走进大众视野。全景视频具有视角广阔、高分辨率、高帧率、数据量大的特点,为存储和传输带来困难,因此亟需有效的全景视频编码方案。在全景视频编码过程中,投影方法与编码算法是最关键的两个要素。本文围绕全景视频的特性,提出了如下几种投影方法,以适配随后的全景视频编码:(1)提出近似均匀采样的少畸变双八边形投影。克拉斯特抛物线投影实现了球体上的均匀采样,但在平面两侧畸变严重。针对该问题,提出将全景视频投影到两个八边形中,在畸变与均匀采样间取得平衡,以提升编码性能。为消除双八边形投影的倾斜边界,进一步节省码率,还提出一种紧凑的投影方法。实验结果表明,与等距柱状投影相比,双八边形投影能节省24.70%的码率,而紧凑的双八边形投影可以节省24.95%的码率。(2)提出基于球面划分的等面积均匀立方体投影。针对立方体投影采样不均匀的问题,利用提出的曲面像素建模办法,结合等面积比原则,通过直接在球面上进行采样,为每一像素分配相等的球面面积,实现均匀采样。由于所提投影方法具有方向性,因此具有水平和竖直两种采样模式。对比实验结果表明,在高分辨率全景视频编码中,所提投影可获得最佳编码性能。相比等角立方体投影方法,两种模式分别可以节省平均0.5509%和0.6681%的码率。另外,根据所提投影的特性,对球形Lanczos插值算法进行适应性调整,可为重建视频提供约0.1d B的质量增益。(3)提出基于环形分割的均匀对称立方体投影。等面积均匀立方体投影虽实现了球面上的均匀采样,但具有严重的方向性和采样不对称性。而且难以提前判断某测试序列的最佳采样模式。针对上述问题,提出对曲面进行环形分割,并使平面对角线上的像素投影到曲面对角线上,实现对称采样。同时,利用曲面像素建模和等面积比原则,确定环间分界线和曲面像素的位置,确保均匀采样。实验结果表明,在高分辨全景视频编码中,所提投影与等角立方体投影相比,可以节省0.8277%的码率。
二、CME指导下的PADDING算法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、CME指导下的PADDING算法(论文提纲范文)
(1)基于生成对抗网络的图像去雾算法研究及其硬件加速(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 图像去雾研究背景与意义 |
1.2 国内外研究进展 |
1.2.1 基于图像增强的去雾算法现状 |
1.2.2 基于图像复原的去雾方法现状 |
1.2.3 基于深度学习的图像去雾方法现状 |
1.3 本文研究内容及章节安排 |
1.3.1 本文研究内容 |
1.3.2 章节安排 |
2 图像去雾算法的理论基础 |
2.1 大气散射模型 |
2.1.1 大气散射理论 |
2.1.2 入射光衰减模型 |
2.1.3 大气光成像模型 |
2.2 基于卷积神经网络的去雾方法 |
2.2.1 神经网络的基础理论 |
2.2.2 卷积神经网络的理论基础 |
2.2.3 基于卷积神经网络的经典去雾算法 |
2.3 基于生成对抗网络的去雾方法 |
2.3.1 生成对抗网络原理 |
2.3.2 基于生成对抗网络的去雾算法 |
2.4 图像去雾效果衡量指标 |
2.5 本章小结 |
3 基于生成对抗网络的去雾算法研究 |
3.1 算法网络结构 |
3.2 网络实现细节 |
3.2.1 跳过链接 |
3.2.2 MAXOUT特征提取 |
3.2.3 多尺度特征融合层 |
3.2.4 损失函数 |
3.3 网络训练 |
3.3.1 数据集处理 |
3.3.2 网络参数训练 |
3.4 去雾网络结果及分析 |
3.4.1 去雾网络结果 |
3.4.2 去雾网络结果分析 |
3.5 本章小结 |
4 生成对抗网络去雾算法的硬件加速 |
4.1 网络加速系统架构 |
4.2 数据计算模块 |
4.2.1 填充模块 |
4.2.2 移位寄存器模块 |
4.2.3 卷积运算模块 |
4.2.4 激活函数模块 |
4.3 系统控制设计 |
4.4 数据传输模块 |
4.5 板极验证 |
4.5.1 ZedBoard平台介绍 |
4.5.2 SOC验证 |
4.6 本章小结 |
5 总结与展望 |
5.1 总结 |
5.2 展望 |
致谢 |
参考文献 |
(2)基于卷积神经网络的图像重构方法研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 选题背景及研究意义 |
1.2 国内外研究现状 |
1.2.1 卷积神经网络研究现状 |
1.2.2 图像去噪研究现状 |
1.2.3 CFA图像去马赛克研究现状 |
1.3 研究内容与章节安排 |
1.3.1 主要研究内容 |
1.3.2 本文结构安排 |
2 图像重构方法理论基础 |
2.1 卷积神经网络相关理论 |
2.1.1 卷积神经网络结构 |
2.1.2 卷积神经网络特点 |
2.2 图像重构相关理论 |
2.2.1 图像去噪理论基础 |
2.2.2 CFA图像去马赛克理论基础 |
2.3 本章小结 |
3 基于多尺度特征融合的并行稠密残差去噪网络 |
3.1 概述 |
3.2 残差网络介绍 |
3.3 基于多尺度特征融合的并行稠密残差网络 |
3.4 实验结果与分析 |
3.4.1 数据集生成 |
3.4.2 不同方法对比结果 |
3.4.3 不同网络结构对比结果 |
3.5 本章小结 |
4 基于深层稠密残差的生成式对抗神经网络去马赛克架构 |
4.1 概述 |
4.2 生成式对抗神经网络 |
4.3 基于深层稠密残差的生成式对抗神经网络 |
4.3.1 生成器结构 |
4.3.2 鉴别器结构 |
4.3.3 网络损失函数 |
4.4 实验结果与分析 |
4.4.1 数据集生成 |
4.4.2 不同方法对比结果 |
4.5 本章小结 |
5 基于U-net与稠密残差的生成式对抗神经网络去马赛克架构 |
5.1 概述 |
5.2 U-net模型 |
5.3 基于U-net与稠密残差的生成式对抗神经网络 |
5.3.1 生成器结构 |
5.3.2 鉴别器结构 |
5.4 实验结果与分析 |
5.5 本章小结 |
6 总结与展望 |
6.1 本文总结 |
6.2 工作展望 |
致谢 |
参考文献 |
攻读学位期间主要研究成果 |
(3)基于双通道卷积长短时记忆神经网络的肺音识别方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 论文主要工作及组织结构 |
1.3.1 本文的主要工作 |
1.3.2 论文的组织结构 |
1.4 本章小结 |
第2章 肺音信号及相关数据预处理 |
2.1 肺音信号产生的相关理论 |
2.1.1 肺部结构及呼吸原理 |
2.1.2 肺音形成原理及特点 |
2.2 相关数据集 |
2.2.1 肺音音频数据 |
2.2.2 肺音音频数据分析 |
2.3 肺音音频数据预处理 |
2.3.1 数据截取 |
2.3.2 巴特沃斯滤波器去噪 |
2.3.3 数据归一化 |
2.3.4 小波变换 |
2.3.5 梅尔倒谱(MFCC) |
2.3.6 局部二值化(LBP)处理 |
2.4 数据增强 |
2.5 本章小结 |
第3章 基于CNN与CNNLSTM的肺音识别方法 |
3.1 神经网络分类算法 |
3.1.1 卷积神经网络 |
3.1.2 长短时记忆神经网络 |
3.2 网络模型设计 |
3.2.1 CNN网络模型设计 |
3.2.2 基于串行的CNNLSTM网络模型设计 |
3.3 实验设计与分析 |
3.3.1 实验数据集 |
3.3.2 实验平台 |
3.3.3 评价指标 |
3.3.4 实验结果及分析 |
3.4 小结 |
第4章 基于DCCLNN的肺音识别方法 |
4.1 双通道卷积长短时记忆神经网络模型算法设计 |
4.2 相关实验 |
4.3 对比实验 |
4.4 消融实验 |
4.5 本章小结 |
第5章 总结与展望 |
5.1 总结 |
5.2 展望 |
致谢 |
参考文献 |
攻读硕士学位期间取得的研究成果 |
学位论文数据集表 |
(4)高速运动物体图像识别与压缩方法研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 图像识别研究现状 |
1.2.2 图像压缩研究现状 |
1.2.3 高速运动物体研究现状 |
1.3 课题主要内容和结构 |
2 高速运动物体图像识别方法 |
2.1 高速运动物体图像特征分析 |
2.2 图像识别过程 |
2.3 基于卷积神经网络的图像识别 |
2.3.1 卷积神经网络基本结构 |
2.3.2 卷积神经网络参数训练 |
2.3.3 卷积神经网络图像识别流程 |
2.4 卷积神经网络改进方法 |
2.4.1 网络结构改进 |
2.4.2 标准化和正则化 |
2.4.3 多层特征融合 |
2.5 本章小结 |
3 基于卷积神经网络的高速移动激光点图像识别 |
3.1 3D打印激光束特点分析 |
3.2 激光点图像数据采集系统设计 |
3.2.1 红外图像采集装置 |
3.2.2 红外摄像头采集模块 |
3.2.3 串口数据传输模块 |
3.2.4 激光温度数据采集过程 |
3.3 激光点红外图像识别过程 |
3.3.1 激光图像识别流程 |
3.3.2 图像数据预处理 |
3.3.3 数据集制作及参数设置 |
3.3.4 CNN及改进CNN模型 |
3.3.5 模型训练及结果分析 |
3.4 激光中心点温度预测 |
3.4.1 测试集处理 |
3.4.2 预测结果及实验分析 |
3.5 本章小结 |
4 高速运动物体视频图像压缩方法 |
4.1 数据的冗余与压缩 |
4.1.1 数据的冗余类型 |
4.1.2 数据压缩分类 |
4.1.3 压缩评价指标 |
4.2 静态图像压缩 |
4.2.1 图像压缩系统构成 |
4.2.2 基于小波变换的图像数据压缩 |
4.2.3 基于BP神经网络的图像数据压缩 |
4.3 序列图像中的运动信息处理 |
4.3.1 运动序列图像特点 |
4.3.2 高速运动物体视频分割 |
4.3.3 基于运动估计的帧间预测编码 |
4.4 高速运动视频图像压缩系统 |
4.4.1 视频图像压缩整体流程 |
4.4.2 压缩重构示例 |
4.5 本章小结 |
5 基于帧内和帧间编码的高速无人机视频图像压缩 |
5.1 高速无人机视频传输系统 |
5.2 基于小波神经网络的无人机静态图像压缩 |
5.2.1 视频图像关键帧提取 |
5.2.2 小波神经网络图像压缩 |
5.2.3 图像重构及结果分析 |
5.3 基于帧间预测编码的无人机视频序列压缩 |
5.3.1 基于三帧差分的无人机目标分割 |
5.3.2 基于块匹配的无人机运动估计 |
5.4 无人机视频重构及结果分析 |
5.4.1 视频重构 |
5.4.2 视频压缩前后结果分析 |
5.5 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
攻读硕士学位期间的研究成果 |
(5)基于深度学习的市民服务热线案件智能分类研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.3 本文研究内容 |
1.4 本文组织结构 |
第二章 相关理论基础 |
2.1 市民服务热线 |
2.2 文本表示 |
2.3 传统文本分类 |
2.4 深度学习文本分类 |
2.5 性能评价指标 |
2.6 本章小结 |
第三章 基于Word2vec-TLSTM-Attention融合神经网络模型的市民服务热线分类研究 |
3.1 模型架构 |
3.2 数据预处理与向量化 |
3.3 文本分类 |
3.4 本章小结 |
第四章 仿真与分析 |
4.1 仿真平台 |
4.2 Word2vec-TLSTM-Attention融合神经网络模型 |
4.3 其它相关模型 |
4.4 仿真结果对比分析 |
4.5 本章小结 |
第五章 总结和展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
致谢 |
(6)基于多光谱波段选择的煤矸石识别和快速检测研究(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 用于煤矸石分离的“识别”研究现状 |
1.2.2 多光谱成像技术及其应用研究现状 |
1.2.3 目标检测研究现状 |
1.3 课题来源 |
1.4 论文章节结构 |
1.5 本章小结 |
2 实验设备及相关理论知识 |
2.1 多光谱系统及数据采集和标注 |
2.1.1 煤矸石多光谱数据采集系统 |
2.1.2 煤矸石多光谱数据采集 |
2.1.3 煤和煤矸石边界框标注 |
2.2 图像的特征描述 |
2.2.1 学习特征描述 |
2.2.2 HOG人工特征理论 |
2.2.3 SIFT人工特征理论 |
2.2.4 LBP人工特征理论 |
2.3 多光谱图像煤矸石识别算法 |
2.3.1 分类回归树 |
2.3.2 随机森林 |
2.3.3 自适应提升 |
2.3.4 多元宇宙优化的支持向量机 |
2.4 YOLO目标检测及相关理论 |
2.4.1 卷积神经网络理论 |
2.4.2 经典卷积神经网络架构 |
2.4.3 YOLO目标检测理论 |
2.5 本章小结 |
3 多光谱单波段的煤矸石识别研究 |
3.1 实验数据准备 |
3.2 2D-AE模型设计与训练 |
3.2.1 2D-AE模型设计 |
3.2.2 2D-AE模型训练 |
3.3 基于2D-AE学习特征的煤矸石识别研究 |
3.3.1 RF和AdaBoost最佳参数 |
3.3.2 基于MVO的SVM参数优化 |
3.3.3 多光谱各波段煤矸石识别研究 |
3.3.4 分析与讨论 |
3.4 基于人工特征的煤矸石识别研究 |
3.4.1 SIFT特征煤矸石识别研究 |
3.4.2 LBP特征煤矸石识别研究 |
3.4.3 HOG特征煤矸石识别研究 |
3.4.4 分析与讨论 |
3.5 结果与分析 |
3.6 本章小结 |
4 组合波段选择及煤矸石检测研究 |
4.1 最佳指数组合波段选择理论 |
4.1.1 最佳指数理论 |
4.1.2 相关性分析及相关系数的计算 |
4.1.3 光谱图像标准差 |
4.1.4 煤和煤矸石最佳指数分析 |
4.1.5 组合波段选择 |
4.2 基于YOLO-V4的煤矸石检测研究 |
4.2.1 实验数据选择和划分 |
4.2.2 检测模型性能评价指标 |
4.2.3 模型参数选择及初始化 |
4.2.4 最佳训练Epoch设定 |
4.2.5 基于YOLO-V4的煤矸石检测研究 |
4.2.6 其它检测模型的煤矸石检测研究对比 |
4.2.7 实验结果与分析 |
4.3 检测结果的FP抑制研究 |
4.3.1 问题描述 |
4.3.2 基于置信度的FP抑制 |
4.3.3 非极大抑制FP |
4.3.4 实验结果与分析 |
4.4 本章小结 |
5 基于改进模型的煤矸石快速准确检测研究 |
5.1 改进YOLO-V4的煤矸石检测研究 |
5.1.1 改进模型的Backbone的设计 |
5.1.2 改进模型的Neck的设计 |
5.1.3 改进模型的参数设置研究 |
5.1.4 基于改进模型的煤矸石检测研究 |
5.1.5 改进后的模型检测结果对比 |
5.1.6 实验结果与讨论 |
5.2 煤矸石快速检测模型的设计与研究 |
5.2.1 主干网路的轻量设计 |
5.2.2 检测模型的Neck轻量设计 |
5.2.3 轻量检测模型的训练 |
5.2.4 基于轻量模型煤矸石检测研究 |
5.2.5 轻量模型煤矸石检测对比分析 |
5.3 本章小结 |
6 总结与展望 |
6.1 本文总结 |
6.2 主要创新 |
6.3 未来展望 |
参考文献 |
致谢 |
作者简介及读博期间主要科研成果 |
(7)基于FPGA的卷积神经网络加速系统研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究的背景和意义 |
1.2 国内外研究现状 |
1.3 本文的研究内容 |
1.4 论文的组织结构 |
2 卷积神经网络参数分析与优化 |
2.1 学习率的分析与优化 |
2.1.1 学习率的分析 |
2.1.2 学习率的分段拟合优化 |
2.1.3 学习率优化前后的对比与分析 |
2.2 softmax函数优化 |
2.2.1 softmax函数并行化分析 |
2.2.2 softmax函数的基于最大误差的分段线性代替优化 |
2.2.3 softmax函数优化前后的算法复杂度对比 |
2.3 参数定点化 |
2.3.1 浮点参数、定点参数与定点参数的Q格式表示法 |
2.3.2 浮点参数定点化分析 |
2.3.3 参数定点化的数学分析 |
2.3.4 实验结果与分析 |
2.4 本章小结 |
3 卷积神经网络卷积计算并行优化 |
3.1 同一卷积核并行计算分析与优化 |
3.1.1 同一卷积核计算过程分析 |
3.1.2 同一卷积核并行处理分析 |
3.1.3 同一卷积核计算并行处理优化原理与方案 |
3.2 多通道特征图中并行计算分析与优化 |
3.2.1 多通道特征图计算分析 |
3.2.2 多通道特征图并行处理分析 |
3.2.3 多通道特征图并行处理优化原理与方案 |
3.3 层间并行计算分析与优化 |
3.3.1 层间计算过程分析 |
3.3.2 层间并行计算分析 |
3.3.3 层间并行计算优化方案 |
3.4 本章小结 |
4 系统架构设计 |
4.1 整体硬件架构设计 |
4.2 基于PCIe的数据交互方案 |
4.3 卷积窗口并行读取设计 |
4.3.1 卷积窗口并行读取原理 |
4.3.2 卷积窗口并行读取方案 |
4.4 并行前缀加法器 |
4.4.1 并行前缀加法器(超前进位加法器)原理 |
4.4.2 并行前缀加法器的硬件实现 |
4.5 系统架构 |
4.6 本章小结 |
5 实验结果与分析 |
5.1 实验平台 |
5.1.1 FPGA加速方案实验平台 |
5.1.2 CPU/GPU加速方案实验平台 |
5.2 资源消耗分析 |
5.2.1 FPGA方案资源消耗分析 |
5.2.2 CPU/GPU方案资源消耗分析 |
5.2.3 资源消耗对比分析 |
5.3 运行结果及分析 |
5.4 本章小结 |
结论 |
1 总结 |
2 展望 |
致谢 |
参考文献 |
攻读学位期间的研究成果 |
(8)基于CNN与图像处理的河道测流研究(论文提纲范文)
摘要 |
ABSTRACTS |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究进展 |
1.2.1 河道流速测量研究进展 |
1.2.2 水位识别研究进展 |
1.2.3 深度学习研究进展 |
1.3 研究内容与技术路线 |
1.3.1 研究内容 |
1.3.2 技术路线 |
1.4 论文组织结构 |
第2章 基于CNN的河道表面流速图像识别模型构建 |
2.1 卷积神经网络介绍 |
2.1.1 基本原理 |
2.1.2 局部感受野 |
2.1.3 权值共享 |
2.1.4 卷积层 |
2.1.5 池化层 |
2.1.6 全连接层 |
2.2 河道表面流速图像识别模型构建 |
2.2.1 经典卷积神经网络 |
2.2.2 水流图像数据集构建 |
2.2.3 模型运行流程 |
2.2.4 模型运行结果 |
2.3 本章小结 |
第3章 基于图像识别的水尺水位识别模型构建 |
3.1 水尺图像预处理 |
3.1.1 水尺图像灰度化处理 |
3.1.2 水尺图像去噪 |
3.1.3 水尺图像均值化 |
3.1.4 Canny边缘检测 |
3.1.5 水尺图像锐化 |
3.1.6 水尺图像二值化 |
3.2 水尺水位图像识别模型构建 |
3.2.1 水尺水位图像识别流程 |
3.2.2 水尺图像分割算法设计 |
3.2.3 水尺刻度及水位识别算法设计 |
3.3 本章小结 |
第4章 案例研究与分析 |
4.1 实验设计 |
4.1.1 实验目的 |
4.1.2 实验设备 |
4.1.3 Fluent数值模拟 |
4.1.4 实验结果 |
4.2 数据处理 |
4.2.1 水流视频处理 |
4.2.2 水尺图像预处理 |
4.3 表面流速识别 |
4.3.1 识别原理 |
4.3.2 数据集制作 |
4.3.3 模型训练 |
4.3.4 模型结果 |
4.4 水位识别 |
4.5 流量计算 |
4.6 本章小结 |
第5章 总结与展望 |
5.1 本文的研究成果 |
5.2 研究展望 |
参考文献 |
致谢 |
攻读学位期间参与的科研项目与发表论文 |
学位论文评阅及答辩情况表 |
(9)基于无造影剂MRI图像的肝癌智能诊断方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 肝肿瘤的2D分割 |
1.2.2 肝肿瘤的3D分割 |
1.2.3 肝脏多模态图像的融合 |
1.2.4 小样本图像的肝肿瘤分类 |
1.2.5 肝肿瘤的自动检测 |
1.3 课题来源及主要研究内容 |
1.3.1 实验数据及其特点 |
1.3.2 研究内容 |
1.4章节安排 |
第2章 基于Radiomics-guided DUN-GAN的肝肿瘤2D分割方法 |
2.1 问题分析及解决思路 |
2.1.1 问题分析 |
2.1.2 解决思路 |
2.2 分割的国内外研究现状 |
2.3 放射组学指导的生成对抗网络 |
2.3.1 密度U型嵌套分割器 |
2.3.2 放射组学特征指导的鉴别器 |
2.3.3 自适应像素级混合损失函数 |
2.4 实验结果与分析 |
2.4.1 实验数据集及平台 |
2.4.2 实验评估指标 |
2.4.3 Radiomcis-guided DUN-GAN的定性评估结果 |
2.4.4 Radiomics-guied DUN-GAN的定量评估-ROC和 PR曲线 |
2.4.5 Radiomics-guied DUN-GAN的定量评估-Dice系数 |
2.4.6 放射组学特征指导的定性评估 |
2.5 讨论 |
2.5.1 放射组学特征对分割结果的影响 |
2.5.2 不同特征指导下模型的性能对比 |
2.5.3 不同损失函数的对比 |
2.5.4 与其他分割方法的对比 |
2.6 本章小结 |
第3章 基于多模态的TsA-3DNet的肿瘤3D分割和多指标量化方法 |
3.1 问题分析及解决思路 |
3.1.1 问题分析 |
3.1.2 解决思路 |
3.2 融合和分割的国内外研究现状 |
3.3 双流相关3DNet |
3.3.1 精炼模块连接的体积分割 |
3.3.2 多指标量化 |
3.3.3 双流处理通道(TsAC) |
3.3.4 TsAC的多功能 |
3.3.5 多任务联合损失函数 |
3.4 实验结果和分析 |
3.4.1 实验数据集及平台 |
3.4.2 实验评估指标 |
3.4.3 数据的预处理 |
3.4.4 TsA-3DNet网络分割性能的定性评估 |
3.4.5 TsA-3DNet网络分割性能的定量评估 |
3.4.6 TsA-3DNet网络量化性能的定量评估 |
3.4.7 TsA-3DNet网络特征图的可视化 |
3.5 实验讨论 |
3.5.1 多视角融合机制对分割性能的影响 |
3.5.2 多视角融合机制对量化性能的影响 |
3.5.3 双向指导机制对分割性能的影响 |
3.5.4 双向指导机制对量化性能的影响 |
3.5.5 与其他分割方法的对比 |
3.6 本章小结 |
第4章 基于数据增强的Dg-GAN肝肿瘤分类方法 |
4.1 问题分析及解决思路 |
4.1.1 问题分析 |
4.1.2 解决思路 |
4.2 合成和分类的国内外研究现状 |
4.3 细节指导的生成对抗网络 |
4.3.1 多尺度上下文感知的生成器 |
4.3.2 基于VGG的鉴别器 |
4.3.3 细节指导的分类器 |
4.3.4 联合的损失函数 |
4.4 实验结果和分析 |
4.4.1 实验数据集及平台 |
4.4.2 实验评估指标 |
4.4.3 数据的预处理 |
4.4.4 Dg-GAN网络分类性能的定性分析 |
4.4.5 Dg-GAN网络合成性能的定性分析 |
4.4.6 Dg-GAN网络合成性能的定量分析 |
4.5 实验讨论 |
4.5.1 不同扩充方法对分类性能的影响 |
4.5.2 不同损失函数对分类性能的影响 |
4.5.3 不同鉴别器对分类性能的影响 |
4.5.4 与其他分类方法的对比 |
4.5.5 与其他合成方法的对比 |
4.6 本章小结 |
第5章 基于联合对抗学习的肝肿瘤辅助诊断方法 |
5.1 问题分析及解决思路 |
5.1.1 问题分析 |
5.1.2 解决思路 |
5.2 分割和检测的国内外研究现状 |
5.2.1 肝肿瘤检测的深度学习 |
5.2.2 肝肿瘤检测的临床研究 |
5.3 联合生成对抗网络 |
5.3.1 边缘差异特征金字塔模块 |
5.3.2 多模态特征融合和选择 |
5.3.3 带填充的坐标共享 |
5.3.4 多相放射组学指导的鉴别器 |
5.3.5 UAL的约束策略 |
5.4 实验结果和分析 |
5.4.1 实验数据集及平台 |
5.4.2 实验评估指标 |
5.4.3 UAL的整体性能 |
5.4.4 UAL网络的定量评估 |
5.5 实验讨论 |
5.5.1 EDFPM对性能的影响 |
5.5.2 FSC对性能的影响 |
5.5.3 CSWP对性能的影响 |
5.5.4 MPRG-D对性能的影响 |
5.5.5 多模态数据的定性评估 |
5.5.6 不同模态的无造影剂图像对UAL的影响 |
5.5.7 不同模态的造影剂增强图像对UAL的影响 |
5.5.8 不同模型的参数量对比 |
5.6 结论 |
第6章 总结和展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读学位期间取得的科研成果 |
致谢 |
(10)面向编码的均匀采样全景视频投影方法研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
术语对照表 |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 基于世界地图绘制的投影 |
1.2.2 基于多面体的投影 |
1.2.3 其它类型投影 |
1.3 论文的研究内容 |
1.4 论文的组织结构 |
1.5 本章小结 |
2 全景视频与投影方法理论基础 |
2.1 全景视频的采集与存储传输流程 |
2.2 重点投影介绍 |
2.2.1 球面坐标系与平面坐标系 |
2.2.2 等距圆柱体投影 |
2.2.3 立方体投影 |
2.2.4 克拉斯特抛物线投影与等面积比原则 |
2.3 投影间相互转换过程 |
2.3.1 投影的间接转换与直接转换 |
2.3.2 亚像素插值算法 |
2.4 全景视频投影的性能评估方法 |
2.5 本章小结 |
3 近似均匀采样的少畸变双八边形投影方法 |
3.1 问题描述 |
3.2 少畸变的双八边形投影构造办法 |
3.2.1 少畸变的双八边形投影 |
3.2.2 紧凑双八边形投影 |
3.3 双八边形投影的转换过程 |
3.3.1 适应双八边形结构的Padding策略 |
3.3.2 前向投影 |
3.3.3 后向投影 |
3.4 实验方法与结果分析 |
3.4.1 减少畸变对编码性能的影响测试 |
3.4.2 编码性能测试及对比 |
3.5 本章小结 |
4 基于球面划分的等面积均匀立方体投影方法 |
4.1 问题描述 |
4.2 等面积均匀立方体投影构造办法 |
4.2.1 球面经纬度坐标系重定义 |
4.2.2 球面全等划分 |
4.2.3 等面积曲面像素分割 |
4.2.4 等面积均匀立方体投影特点分析 |
4.3 等面积均匀立方体投影的转换过程 |
4.3.1 曲面像素建模方法 |
4.3.2 前向投影 |
4.3.3 后向投影 |
4.4 适应等面积均匀立方体投影的球面Lanczos插值算法 |
4.5 实验方法与结果分析 |
4.5.1 均匀采样特性验证 |
4.5.2 曲面像素建模误差分析 |
4.5.3 编码性能测试及对比 |
4.5.4 球面Lanczos插值效果验证 |
4.6 本章小结 |
5 基于曲面环形划分的均匀对称立方体投影方法 |
5.1 问题描述 |
5.2 均匀对称立方体投影构造办法 |
5.3 均匀对称立方体投影的转换过程 |
5.3.1 前向投影 |
5.3.2 后向投影 |
5.4 实验方法与结果分析 |
5.4.1 均匀采样特性验证 |
5.4.2 对称采样特性验证 |
5.4.3 编码性能测试及对比 |
5.5 本章小结 |
6 结论和展望 |
6.1 结论 |
6.2 展望 |
参考文献 |
作者简历及攻读硕士学位期间取得的研究成果 |
学位论文数据集 |
四、CME指导下的PADDING算法(论文参考文献)
- [1]基于生成对抗网络的图像去雾算法研究及其硬件加速[D]. 宁靖. 西安理工大学, 2021(01)
- [2]基于卷积神经网络的图像重构方法研究[D]. 王婕. 西安理工大学, 2021(01)
- [3]基于双通道卷积长短时记忆神经网络的肺音识别方法研究[D]. 李学日. 广东技术师范大学, 2021(09)
- [4]高速运动物体图像识别与压缩方法研究[D]. 史启盟. 西安理工大学, 2021(01)
- [5]基于深度学习的市民服务热线案件智能分类研究[D]. 杨欢. 北京邮电大学, 2021(01)
- [6]基于多光谱波段选择的煤矸石识别和快速检测研究[D]. 来文豪. 安徽理工大学, 2021(02)
- [7]基于FPGA的卷积神经网络加速系统研究[D]. 向钰. 兰州交通大学, 2021(02)
- [8]基于CNN与图像处理的河道测流研究[D]. 杨圭. 山东大学, 2021(12)
- [9]基于无造影剂MRI图像的肝癌智能诊断方法研究[D]. 肖小娇. 太原理工大学, 2021
- [10]面向编码的均匀采样全景视频投影方法研究[D]. 王歌阳. 北京交通大学, 2021(02)