[01632521]基于场景级与区域建议自注意模块的目标检测系统V1.0
交易价格:
面议
所属行业:
软件
类型:
非专利
交易方式:
资料待完善
联系人:
所在地:
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
该系统考虑到场景信息与语义信息对于视觉识别的重要性。在该系统中提出一种目标检测算法,它不仅考虑了目标的视觉外观,而且利用了场景上下文信息和语义分段。因此,在利用这些结构化信息时,目标检测既是一个认知问题,也是一个推理问题。基于深度可分离卷积网络的高密度预测与区域建议自注意模块的目标检测系统是一个融合语义信息与场景信息实现图像前景与背景互补的目标检测系统。
该系统可以实现多尺度、多类别图像精确而快速的目标检测行为,使用者会从输入的图像中获取目标精确的位置信息和类别信息。首先,针对生成候选区域过程的主干网络部分,该系统引入MobileNet模型的核心-深度可分离卷积,将传统的卷积操作改为两层的卷积操作,在保证准确率的条件下,计算时间减少为原来的1/9,计算参数减少为原来的1/7。该系统以深度可分离卷积共享网络(Depthwise Separable Convolution Networks,DSCN)和特征金字塔网络(Feature Pyramid Networks,FPN)作为主干,之后分为三个并行分支,分别叫做语义分段模块(Semantic Segment Module,SSM)分支,RPN(Faster R-CNN中的结构)分支和区域建议自注意模块(Region Proposal Attention Module,RPAM)分支。SSM分支:为了更好的获得较强的语义特征,提高目标检测性能,这里将来自FPN的所有级别的信息合并为单个输出,实现高密度预测。RPN分支:通过RPN网络生成候选区域,并利用Softmax判断前景信息与背景信息,进一步获取精确的候选框。RPAM分支:通过引入注意力机制,试图互补前景信息与背景信息,且这个注意力模块将RPN分支的信息作用于RPAM分支。这样使得检测任务集中更多注意力在局部目标上,以促进背景语义的准确性。在RPAM的后面还加入了一个小的结构叫做背景选择,旨在过滤掉没有用的背景特征,也可以看做一个小的自注意机制。随后融合三个分支并通过一次全连接网络实现分类与回归操作。
该系统考虑到场景信息与语义信息对于视觉识别的重要性。在该系统中提出一种目标检测算法,它不仅考虑了目标的视觉外观,而且利用了场景上下文信息和语义分段。因此,在利用这些结构化信息时,目标检测既是一个认知问题,也是一个推理问题。基于深度可分离卷积网络的高密度预测与区域建议自注意模块的目标检测系统是一个融合语义信息与场景信息实现图像前景与背景互补的目标检测系统。
该系统可以实现多尺度、多类别图像精确而快速的目标检测行为,使用者会从输入的图像中获取目标精确的位置信息和类别信息。首先,针对生成候选区域过程的主干网络部分,该系统引入MobileNet模型的核心-深度可分离卷积,将传统的卷积操作改为两层的卷积操作,在保证准确率的条件下,计算时间减少为原来的1/9,计算参数减少为原来的1/7。该系统以深度可分离卷积共享网络(Depthwise Separable Convolution Networks,DSCN)和特征金字塔网络(Feature Pyramid Networks,FPN)作为主干,之后分为三个并行分支,分别叫做语义分段模块(Semantic Segment Module,SSM)分支,RPN(Faster R-CNN中的结构)分支和区域建议自注意模块(Region Proposal Attention Module,RPAM)分支。SSM分支:为了更好的获得较强的语义特征,提高目标检测性能,这里将来自FPN的所有级别的信息合并为单个输出,实现高密度预测。RPN分支:通过RPN网络生成候选区域,并利用Softmax判断前景信息与背景信息,进一步获取精确的候选框。RPAM分支:通过引入注意力机制,试图互补前景信息与背景信息,且这个注意力模块将RPN分支的信息作用于RPAM分支。这样使得检测任务集中更多注意力在局部目标上,以促进背景语义的准确性。在RPAM的后面还加入了一个小的结构叫做背景选择,旨在过滤掉没有用的背景特征,也可以看做一个小的自注意机制。随后融合三个分支并通过一次全连接网络实现分类与回归操作。