【今日CV 计算机视觉论文速览第98期】Wed, 10 Apr 2019

阅读量：271 次

发布时间：2019-03-01

本文共 7189 字，大约阅读时间需要 23 分钟。

计算机视觉论文速览

跨领域目标检测

一项最新研究成功实现了横跨多个领域的目标检测，通过引入适应层和新域的注意力机制，能够在不需要先验知识的情况下高效学习。该方法在11个不同数据集上展现了其通用性，性能优于单一检测器和多域检测器。此外，网络模型采用序列激活单元和多任务学习框架，确保在所有域间共享参数和计算。

风格图像处理

研究者提出了基于图割的风格特征聚类方法，将风格信息迁移到目标图像上。该方法通过局部图像信息生成图割结果，并结合注意力机制优化图像质量。实验结果表明，该技术在风格特征匹配和图像修复方面表现出色，能够有效恢复原始图像。

人体几何建模

针对着装人体的几何建模，研究团队开发了一种端到端的网络架构，能够从单一图像中生成逼真的3D几何图像。该方法基于深度学习，训练数据集包含80个主体和280个视频段，标注了丰富的3D特征和人体姿势信息。实验结果表明，生成的几何图像能够准确反映实际人体形状。

高效目标检测算法

通过改进YOLOv3的损失函数和预测框估计方法，研究者提出了Gaussian YOLOv3算法。该算法在检测精度和速度上均有显著提升，mAP提高了3.09-3.5倍，False Positive率下降了41.4%-40.62%，True Positive率增加了4.3%-7.26%。同时，算法的推理速度达到了每秒42帧，适合实时应用。

3D点云去噪

提出了一种基于神经网络的3D点云去噪方法，通过估计参考平面并投影去噪。该方法在多次投影和自监督学习中取得了稳定的性能，实验结果表明其去噪效果优于现有技术。

内存高效网络架构

为解决深度网络内存占用的问题，研究者提出了深度虚拟网络框架DVN。该架构通过多级网络协同设计，在保持性能的同时大幅降低内存需求。实验结果显示，其在多任务推理中表现优异，能效比提升显著。

半监督学习方法

提出了一种基于转换标签传播的半监督学习框架，通过流形假设生成伪标签并训练网络。在多个数据集上，所提方法优于传统半监督学习技术，尤其在少量标注数据集中表现突出。

超声图像重建

开发了一种新的超声图像重建方法，结合卷积神经网络和自定义损失函数。该方法能够在临床环境中高效运行，图像重建质量接近真实扫描，同时保持较高的推理速度。

金属伪影消除

针对CT图像中的金属伪影问题，提出了一种基于深度学习的金属伪影减少算法。该方法通过对抗性网络估计金属物体的投影数据，并生成完整图像，从而有效消除伪影。

视频对象分割

提出了一种基于R CNN的VOS框架，能够在高效的前提下实现视频对象分割。实验结果表明，其性能优于现有方法，运行速度提升了45倍。

高分辨率嵌入学习

研究者提出了一种新的嵌入学习方法，通过改进softmax函数实现了更高的嵌入灵活性。实验结果表明，该方法在多个数据集上优于传统方法，平均精度显著提高。

小目标检测

开发了一种基于STMD的视觉系统模型，通过提取运动路径和对比度路径，显著提高了小目标检测的准确性和鲁棒性。

视频问题解答框架

提出了一种端到端的VideoQA框架，包含异构存储器、多模式融合层和迭代推理机制。实验结果表明，其在多个数据集上的性能均优于现有方法。

活动识别

提出了一个连续学习框架，能够从未标记的视频中识别上下文感知活动。该框架结合条件随机场和信息理论方法，显著减少了手动标记的需求。

机器学习与地球观测

探讨了机器学习在地球观测中的应用，分析了作物监测、土地覆盖和多孔介质体积图像分类等任务的最新进展及挑战。

深度度量学习

提出了一种改进的深度度量学习方法，通过数学G softmax函数优化了类内紧致性和类间可分性，实验结果表明其对多标签分类任务的性能提升显著。

多模态网格表面表示

研究者提出了一个融合纹理和几何数据的多模态网格表面表示方法，通过逆映射和图像增强实现了高效的3D数据学习。实验结果表明其在面部动作检测和表达分类任务中性能优异。

全景捕捉与重建

提出了一种全景捕捉录制和重建方法，能够处理大规模、多光照条件下的场景。该方法基于传统3D重建技术，结合深度学习生成逼真的视图和语义标签。

动作识别与剪辑采样

开发了一种轻量级的剪辑采样模型，能够在长视频中高效识别显着时间片段。实验结果表明，其准确率显著提升，计算成本降低。

点云配准

提出了一种基于相对姿态估计网络的点云配准方法，通过局部姿势信息显著提升了配准性能和加速速度。

艺术肖像修复

开发了一种用于艺术肖像面部修复的端到端网络，结合样式移除网络和判别网络，能够从未对齐的艺术肖像中恢复高质量的照片级面部图像。

工业表面检测

提出了专门针对工业表面检测的深度学习模型，通过神经数据增强解决了类别不平衡问题，实验结果表明其准确度和推理时间均优于传统方法。

DNN架构配置

提出了一种自动化DNN架构配置框架，通过特征模型和搜索算法生成高性能模型配置。实验结果表明，其性能优于人工配置，且训练效率显著提升。

高光谱图像分类

研究者提出了基于正无标记的高光谱图像分类框架，通过注释器模型和光谱空间检索模型实现了材料不可知信息检索的目标。实验结果表明其在多个高光谱数据集上表现优异。

##医学图像分割开发了一种基于深度学习的医学图像分割方法，能够准确识别解剖标志并执行精确的解剖标记。该方法利用深度网络的关系推理能力，显著提升了分割的准确性。

元学习方法

提出了一种元学习方法，通过结合共享权重生成模块和元级别丢失技术，显著提高了镜头分类性能。实验结果表明其在Omniglot和miniImageNet数据集上表现优异。

度量学习框架

研究者提出了一个度量学习框架，通过数学G softmax函数优化了类内紧致性和类间可分性，实验结果表明其对多标签分类任务的性能提升显著。

视频理解与体验

提出了一种体验视觉识别框架，允许代理人在复杂环境中自由移动并执行视觉识别任务。实验结果表明，其性能优于传统被动视觉系统。

多域检测框架

开发了一种通用物体检测框架，不需要对感兴趣的域进行先验知识训练。通过引入适应层和域注意力机制，实验结果表明其在11个不同数据集上的性能优于现有方法。

转向角预测

提出了一种基于长短期记忆的深度架构，能够利用车辆共享的图像进行转向角预测。实验结果表明其误差显著低于现有方法。

高分辨率嵌入

提出了一种改进的高分辨率嵌入方法，通过数学G softmax函数优化了类内紧致性和类间可分性，实验结果表明其对多标签分类任务的性能提升显著。

多模态检索

研究者提出了一个基于深度神经网络的多模态检索框架，能够在全色PAN和多光谱图像之间高效检索。实验结果表明其在多标签图像检索任务中表现优异。

半监督学习框架

提出了一种转换标签传播的半监督学习框架，通过流形假设生成伪标签并训练网络。在多个数据集上，所提方法优于传统半监督学习技术，尤其在少量标注数据集中表现突出。

自适应图像分割

研究者提出了一种自适应图像分割方法，通过嵌入式图像增强和后处理提升了分割的质量和不确定性测量。实验结果表明其在Cityscapes数据集上性能显著优于现有方法。

图像裁剪

提出了一种基于网格锚的图像裁剪方法，候选作物的搜寻空间从数百万减少到不到100。实验结果表明，其裁剪模型在准确度和运行速度上均优于传统方法。

面部图像修复

开发了一种从艺术肖像中恢复面部图像的方法，结合样式移除网络和判别网络，能够从未对齐的艺术肖像中生成高质量的照片级面部图像。

半监督图像分类

提出了一种基于转换标签传播的半监督图像分类框架，通过流形假设生成伪标签并训练网络。在多个数据集上，所提方法优于传统半监督学习技术，尤其在少量标注数据集中表现突出。

自动驾驶技术

研究者提出了一种基于长短期记忆的深度架构，能够利用车辆共享的图像进行转向角预测。实验结果表明其误差显著低于现有方法。

多任务学习框架

提出了一种多任务学习框架，能够同时解决多个视觉任务。通过共享特征表示和注意力机制，显著提升了任务间的协同学习效果。

点云去噪

医疗影像分割

开发了一种基于深度学习的医疗影像分割方法，能够准确识别解剖标志并执行精确的解剖标记。该方法利用深度网络的关系推理能力，显著提升了分割的准确性。

多模态数据融合

视频理解与体验

提出了一种体验视觉识别框架，允许代理人在复杂环境中自由移动并执行视觉识别任务。实验结果表明，其性能优于传统被动视觉系统。

多域检测框架

转向角预测

提出了一种基于长短期记忆的深度架构，能够利用车辆共享的图像进行转向角预测。实验结果表明其误差显著低于现有方法。

高分辨率嵌入

提出了一种改进的高分辨率嵌入方法，通过数学G softmax函数优化了类内紧致性和类间可分性，实验结果表明其对多标签分类任务的性能提升显著。

多模态检索

半监督学习框架

自适应图像分割

图像裁剪

面部图像修复

开发了一种从艺术肖像中恢复面部图像的方法，结合样式移除网络和判别网络，能够从未对齐的艺术肖像中生成高质量的照片级面部图像。

半监督图像分类

自动驾驶技术

研究者提出了一种基于长短期记忆的深度架构，能够利用车辆共享的图像进行转向角预测。实验结果表明其误差显著低于现有方法。

多任务学习框架

提出了一种多任务学习框架，能够同时解决多个视觉任务。通过共享特征表示和注意力机制，显著提升了任务间的协同学习效果。

点云去噪

医疗影像分割

多模态数据融合

视频理解与体验

提出了一种体验视觉识别框架，允许代理人在复杂环境中自由移动并执行视觉识别任务。实验结果表明，其性能优于传统被动视觉系统。

多域检测框架

转向角预测

提出了一种基于长短期记忆的深度架构，能够利用车辆共享的图像进行转向角预测。实验结果表明其误差显著低于现有方法。

高分辨率嵌入

提出了一种改进的高分辨率嵌入方法，通过数学G softmax函数优化了类内紧致性和类间可分性，实验结果表明其对多标签分类任务的性能提升显著。

多模态检索

半监督学习框架

自适应图像分割

图像裁剪

面部图像修复

开发了一种从艺术肖像中恢复面部图像的方法，结合样式移除网络和判别网络，能够从未对齐的艺术肖像中生成高质量的照片级面部图像。

半监督图像分类

自动驾驶技术

研究者提出了一种基于长短期记忆的深度架构，能够利用车辆共享的图像进行转向角预测。实验结果表明其误差显著低于现有方法。

多任务学习框架

提出了一种多任务学习框架，能够同时解决多个视觉任务。通过共享特征表示和注意力机制，显著提升了任务间的协同学习效果。

点云去噪

医疗影像分割

多模态数据融合

视频理解与体验

提出了一种体验视觉识别框架，允许代理人在复杂环境中自由移动并执行视觉识别任务。实验结果表明，其性能优于传统被动视觉系统。

多域检测框架

转向角预测

提出了一种基于长短期记忆的深度架构，能够利用车辆共享的图像进行转向角预测。实验结果表明其误差显著低于现有方法。

高分辨率嵌入

提出了一种改进的高分辨率嵌入方法，通过数学G softmax函数优化了类内紧致性和类间可分性，实验结果表明其对多标签分类任务的性能提升显著。

多模态检索

半监督学习框架

自适应图像分割

图像裁剪

面部图像修复

开发了一种从艺术肖像中恢复面部图像的方法，结合样式移除网络和判别网络，能够从未对齐的艺术肖像中生成高质量的照片级面部图像。

半监督图像分类

自动驾驶技术

研究者提出了一种基于长短期记忆的深度架构，能够利用车辆共享的图像进行转向角预测。实验结果表明其误差显著低于现有方法。

多任务学习框架

提出了一种多任务学习框架，能够同时解决多个视觉任务。通过共享特征表示和注意力机制，显著提升了任务间的协同学习效果。

点云去噪

医疗影像分割

多模态数据融合

视频理解与体验

提出了一种体验视觉识别框架，允许代理人在复杂环境中自由移动并执行视觉识别任务。实验结果表明，其性能优于传统被动视觉系统。

多域检测框架

转向角预测

提出了一种基于长短期记忆的深度架构，能够利用车辆共享的图像进行

转载地址：http://rbma.baihongyu.com/

你可能感兴趣的文章

PayPal网站付款标准版(for PHP)

查看>>

Paystack Android SDK 集成与使用指南

查看>>

pbf格式详解，javascript加载导出pbf文件示例

查看>>

PBOC2.0与3.0的区别

查看>>

PbootCMS entrance.php SQL注入漏洞复现

PB级分析型数据库ClickHouse的应用场景和特性

SharePoint 2013 图文开发系列之定义站点模板

PCI Express学习篇：Power Management(二)

查看>>

pcie握手机制_【博文连载】PCIe扫盲——Ack/Nak 机制详解（一）

PC端恶意代码分析Lab1.1-5.1，从零基础到精通，收藏这篇就够了！

查看>>