基于改进的yolov8s的人体安检违禁品检测模型、方法及系统与流程

专利查询2天前  7


本发明涉及图像检测,具体来说是一种基于改进的yolov8s的人体安检违禁品检测模型、方法及系统。


背景技术:

1、传统的人体安检违禁品检测方法是通过金属安检门和人工搜身相结合来检测违禁品。金属安检门主要用于检测金属物品,但对陶瓷、玻璃、塑料等非金属物质,以及易燃易爆品和腐蚀性液体则无能为力。安检人员在金属安检门后使用手持式金属探测器进一步检查,同时对非金属物品进行手工检查。这种检测手段不仅耗时耗力,可能侵犯个人隐私,还存在人为因素的误判和疏忽。随着技术的发展,可以使用毫米波安检门进行违禁品的检测,使用基于深度学习的检测算法对通过毫米波成像的图像进行违禁品的识别检测,既可以快速完成违禁品的检测过程,适应快节奏的安检需求又有效提高了违禁品检测的准确性。但图像识别技术存在以下技术问题:在安检场景中,需要快速完成违禁品的检测,一些深度学习模型虽然检测准确,但参数量、计算量和模型体积太大,难以部署在一些受限的边缘设备上,所以对模型的轻量化处理就显得尤为必要。


技术实现思路

1、本发明所要解决的技术问题在于如何构建轻量化的人体安检违禁品检测网络。

2、本发明通过以下技术手段实现解决上述技术问题的:

3、基于改进的yolov8s的人体安检违禁品检测模型,包括主干网络、颈部网络;

4、所述主干网络使用重参数化后的hgnetv2,在所述颈部网络中利用ghostdynamicconv模块进行卷积操作,并使用gcadown模块作为颈部网络中的下采样操作;

5、所述gcadown为在adown中使用ghostconv模块作为卷积操作,与adown中的平均池化、最大池化操作和ghostconv构造并行分支结构。

6、进一步的,所述主干网络的具体结构为:重参数化后的hgnetv2包括hgstem、rep_hgblock和dwconv;

7、hgstem作为预处理层,首先通过卷积操作提取输入数据的特征,随后采用最大池化进行下采样,捕捉数据在不同尺度上的特征,再和卷积后的特征图进行融合,使得特征信息更加丰富;

8、rep_hgblock利用重参数化思想,在训练阶段,使用1×1、3×3大小的卷积核与batchnorm构成并行的多分支结构,输入的特征图经过三个并行的分支结构最后相加,提取输入数据的多尺度特征信息,增强网络对小目标的特征表达能力;在推理阶段,利用重参数化的方法将1×1、3×3大小的卷积核与batchnorm构成并行的多分支结构融合为只有3×3大小卷积核的单分支结构;将多分支结构融合为单分支结构的过程是在1×1大小的卷积核的分支上,将1×1大小的卷积核通过填充0值变成3×3大小的卷积核;在只有bn层的分支上,通过填充0的方法构造3×3大小的卷积核;然后在每个分支上,融合卷积层核bn层,卷积公式表示如下:

9、conv(x)=w(x)+b

10、batchnorm公式如式(5)所示,其中,γ,β是可学习参数:

11、

12、将卷积和batchnorm融合之后,其表达式可以表示为:

13、

14、其中,表示均值,表示方差,表示归一化;

15、最后将三个分支相加,即可将训练时的并行多分支结构转换为了推理时的单分支结构;

16、dwconv首先将输入特征图的每个通道分别通过卷积核进行卷积操作,在不同的通道上独立的学习特征,然后将得到的特征图通过逐点卷积的方式进行加权组合得到最终的特征图。

17、进一步的,ghostdynamicconv模块包括初始卷积操作和廉价操作,在初始卷积操作中,首先使用1×1大小卷积核的动态卷积对输入大小为c×h×w特征图的通道数进行压缩,将通道数变为原来的一半,大小为c/2×h×w,将得到的特征图用于廉价操作;动态卷积通过聚合多个线性函数来定义,表示为

18、

19、其中,表示第k个线性函数的权重,表示第k个线性函数的偏置,g表示激活函数,πk(x)表示第k个线程函数的注意力权重,根据输入动态调整;

20、在廉价操作中,使用3×3大小卷积核的动态卷积对输入的特征图进行卷积操作,然后将经过卷积操作的特征图与没有经过卷积操作的特征图进行拼接,恢复成原来的通道数,此时特征图大小为c×h×w。

21、进一步的,所述gcadown模块,在adown中使用ghostconv模块作为卷积操作,与adown中的平均池化、最大池化操作和ghostconv构造并行分支结构。

22、进一步的,所述gcadown模块的操作过程为:输入c×h×w大小的特征图首先经过2×2大小的池化窗口进行平均池化操作,平均池化具体操作如下所示。

23、

24、其中,fi,j表示输出的值,n表示区域的个数,表示输入数据第k个区域的值;然后将输出的特征图分为两个分支,各分支上特征图的通道数为原来的一半,大小为c/2×h×w,第一个分支直接经过ghostconv,在ghostconv中,首先使用1×1大小的卷积核聚合通道之的信息特征,然后使用3×3大小的卷积核对经过1×1大小卷积核得到的结果进行卷积操作,将得到的卷积结果和另一半没有卷积的通道合并得到最终结果,最终结果特征图的高和宽的尺寸为输入之前的一半,大小为c/2×h/2×w/2;具体表示如下所示:

25、

26、其中,i表示原图,io表示输出图像,conv1×1表示1×1大小卷积核的卷积操作,conv3×3表示3×3大小卷积核的卷积操作,表示沿着通道维度合并;在第二个分支上,首先经过3×3大小的池化窗口进行最大池化操作,将特征图高和宽的尺寸降低为原来的一半,大小为c/2×h/2×w/2,具体操作如下所示:

27、

28、fi,j表示输出的值,k表示第k个区域,表示输入数据第k个区域的值;再将输出的特征图经过1×1大小的卷积核的ghostconv,得到经过第二个分支的结果,此时特征图大小为c/2×h/2×w/2;最终,将两个分支的结果进行拼接,得到大小为c×h/2×w/2的特征图,再输出gcadown的结果。

29、本发明还提供一种基于改进的yolov8s的人体安检违禁品检测模型的检测方法,包括以下步骤:首先,将图像输入,通过主干网络提取图像特征,其中,rep_hgblock中的卷积操作在训练阶段,由1×1、3×3大小的卷积核和批量归一化层组成的并行多分支结构,用于增强图像的特征表达能力;在推理阶段,会将并行多分支结构转换为只有3×3大小卷积核的单分支结构,提升计算效率和性能;经过主干网络之后输出的特征图会经过颈部网络进行更加细化的特征提取,在颈部网络中,首先经过上采样操作将特征图的高和宽都放大两倍,然后通过特征融合,将颈部网络中的特征与主干网络中的特征图结合起来,再通过ghostdynamicconv卷积操作,提取更加丰富的图像特征,在下采样时,通过gcadown下采样;最终,经过细化处理的特征图会被送入检测头中,进行预测和分类,得到检测结果。

30、本发明还提供基于改进的yolov8s的人体安检违禁品检测模型的训练方法,包括以下步骤:

31、步骤一:数据采集,使用毫米波安检设备采集大量带有违禁品的人体安检数据,如携带金属刀、锤子、扳手等金属物品或陶瓷刀、酒精非金属物品的图像数据;采集数据时,需要采集不同大小、形状、位置和方向的违禁品图像,以确保模型能够学习到丰富的特征用于提高模型的泛化能力;

32、步骤二:数据标注,使用labelimg工具对采集的图像数据进行标注;标注时需要对图像数据进行精确的标注,还需要考虑到违禁品可能被遮挡或部分隐藏的情况,减少漏标的情况;将标记好的图像划分为训练集、验证集和测试集;

33、步骤三:网络训练,首先将划分好的图像数据集输入到检测模型中,这些图像通过检测模型的主干网络进行初步处理,从图像中提取出有用的特征信息;接着,将这些特征信息输入颈部网络,在颈部网络中将不同尺度的特征图进行融合,增强特征的表达能力;最后,将融合后的特征图送入检测头部分进行预测,得到最终结果。

34、本发明还提供一种基于改进的yolov8s的人体安检违禁品检测系统,包括上述的检测模型。

35、本发明的优点在于:

36、目标检测准确率提升:通过使用rephgnetv2、gcadown和ghostdynamicconv三个网络结构对yolov8s进行改进,在人体安检违禁品检测识别的场景下,有效提升了违禁品识别的准确率。

37、模型文件计算量下降:通过融合rephgnetv2、gcadown和ghostdynamicconv三个网络结构,显著降低了模型的参数量和计算量,由于模型文件体积的减少,更加有利于在资源受限的设备上部署该模型。


技术特征:

1.基于改进的yolov8s的人体安检违禁品检测模型,其特征在于,包括主干网络、颈部网络;

2.根据权利要求1所述的基于改进的yolov8s的人体安检违禁品检测模型,其特征在于,所述主干网络的具体结构为:重参数化后的hgnetv2包括hgstem、rep_hgblock和dwconv;

3.根据权利要求1所述的基于改进的yolov8s的人体安检违禁品检测模型,其特征在于,ghostdynamicconv模块包括初始卷积操作和廉价操作,在初始卷积操作中,首先使用1×1大小卷积核的动态卷积对输入大小为c×h×w特征图的通道数进行压缩,将通道数变为原来的一半,大小为c/2×h×w,将得到的特征图用于廉价操作;动态卷积通过聚合多个线性函数来定义,表示为

4.根据权利要求1所述的基于改进的yolov8s的人体安检违禁品检测模型,其特征在于,所述gcadown模块,在adown中使用ghostconv模块作为卷积操作,与adown中的平均池化、最大池化操作和ghostconv构造并行分支结构。

5.根据权利要求4所述的基于改进的yolov8s的人体安检违禁品检测模型,其特征在于,所述gcadown模块的操作过程为:输入c×h×w大小的特征图首先经过2×2大小的池化窗口进行平均池化操作,平均池化具体操作如下所示。

6.基于改进的yolov8s的人体安检违禁品检测模型的检测方法,其特征在于,包括以下步骤:首先,将图像输入,通过主干网络提取图像特征,其中,rep_hgblock中的卷积操作在训练阶段,由1×1、3×3大小的卷积核和批量归一化层组成的并行多分支结构,用于增强图像的特征表达能力;在推理阶段,会将并行多分支结构转换为只有3×3大小卷积核的单分支结构,提升计算效率和性能;经过主干网络之后输出的特征图会经过颈部网络进行更加细化的特征提取,在颈部网络中,首先经过上采样操作将特征图的高和宽都放大两倍,然后通过特征融合,将颈部网络中的特征与主干网络中的特征图结合起来,再通过ghostdynamicconv卷积操作,提取更加丰富的图像特征,在下采样时,通过gcadown下采样;最终,经过细化处理的特征图会被送入检测头中,进行预测和分类,得到检测结果。

7.基于改进的yolov8s的人体安检违禁品检测模型的训练方法,其特征在于,包括以下步骤:

8.基于改进的yolov8s的人体安检违禁品检测系统,其特征在于,包括权利要求1至5任一所述的检测模型。


技术总结
本发明提供基于改进的yolov8s的人体安检违禁品检测模型、方法、系统,包括主干网络、颈部网络;所述主干网络使用重参数化后的HGNetV2,在所述颈部网络中利用GhostDynamicConv模块进行卷积操作,并使用GCADown模块作为颈部网络中的下采样操作;所述GCADown为在ADown中使用GhostConv模块作为卷积操作,与ADown中的平均池化、最大池化操作和GhostConv构造并行分支结构。本发明通过融合RepHGNetV2、GCADown和GhostDynamicConv三个网络结构,显著降低了模型的参数量和计算量,由于模型文件体积的减少,更加有利于在资源受限的设备上部署该模型。

技术研发人员:吴昊,王悦,岳华,凌未
受保护的技术使用者:数据空间研究院
技术研发日:
技术公布日:2024/12/5

最新回复(0)