1.本发明涉及目标检测技术领域,具体涉及一种基于yolov5算法的目标检测的处理方法。
背景技术:
2.目标检测,也叫目标提取,是一种基于目标几何和统计特征的图像分割,它将目标的分割和识别合二为一,其准确性和实时性是整个系统的一项重要能力,尤其是在复杂场景中,需要对多个目标进行实时处理时,目标自动提取和识别就显得特别重要,随着计算机技术的发展和计算机视觉原理的广泛应用,利用计算机图像处理技术对目标进行实时跟踪研究越来越热门,对目标进行动态实时跟踪定位在智能化交通系统、智能监控系统、军事目标检测及医学导航手术中手术器械定位等方面具有广泛的应用价值。
3.现有的目标检测方法在使用的时候,可以的很好的进行使用,但是有时候,目标是非常小的,很容易被忽视的,现有的检测方法对于大型目前可以检测的很好,但是小目标在进行检测的时候,就是很难检测到。
技术实现要素:
4.针对现有技术所存在的上述缺点,本发明的第一目的在于提供一种基于 yolov5算法的目标检测的处理方法,运用将视频转换成图片,然后在图片上进行处理,在进行类成关系网,然后在进行边缘化处理,可以很好的进行提取到mubiao。
5.为实现上述目的,本发明提供了如下技术方案:
6.一种基于yolov5算法的目标检测的处理方法,包括以下步骤:
7.s1、将视频导入到软件中,在软件中,将视频进行分帧,然后将每一帧的图片格栅成不同的大小;
8.s2、将格栅化后的每一帧的图片进行处理;
9.s3、将格栅化后的图片进行边缘化处理;
10.s4、训练自己的数据集;
11.s5、获取到目标。
12.3、本发明进一步设置为:所述步骤s2中的图片处理,包括以下步骤:
13.s21、将格栅后的图片给定输入参考i
t
和所有支撑帧
14.s22、通过候选框生成网络产生各帧的候选框,经过非极大值抑制之后,保留k个候选框加入基础支持候选框集合rs用以对参考候选的增强;
15.s23、参考候选框中objectness得分前r%的候选框又被选出,组成进阶支撑候选框集合ra;
16.s24、在构造完三个集合后,使用关系提炼的基础阶段进行参考候选框特征聚合,基础阶段通过考量基础支持候选框集合rs中所有候选框与每一个参考候选框的关系,获
得参考候选框的关系增强特征,并增强参考候选框的特征。
17.s25、将特征进行提取,提取出相对应的视频特征,形成一个关系网,将每个关系网进行提取,形成一个一个的目标。
18.本发明进一步设置为:所述步骤s3:包括以下步骤:
19.s31、将图片的边缘再次进行格栅处理,分割成更小的格栅;
20.s32、应用高斯滤波来平滑图像,去除图片中的噪声;
21.s33、找寻图像的强度梯度;
22.s34、应用非最大抑制技术来消除边误检应用双阈值的方法来决定可能的边界;
23.s35、使用软件中自带的算法来跟踪边界,将边界进行剥离出来;
24.s36、将剥离出来的图片在进行提取,提取出来的后的图片备用;
25.s37、将关系网中与提取出来的照片进行对比,将该图片放入到相对应的目标中,进行分类。
26.本发明进一步设置为:所述步骤s4:使用yolov5算法训练自己的数据集。
27.本发明进一步设置为:所述步骤s5:使用yolov5算法获取到目标。
28.有益效果
29.采用本发明提供的技术方案,与已知的公有技术相比,具有如下有益效果:
30.将格栅后的图片给定输入参考i
t
和所有支撑帧通过候选框生成网络产生各帧的候选框,经过非极大值抑制之后,保留k个候选框加入基础支持候选框集合rs用以对参考候选的增强,参考候选框中objectness得分前r%的候选框又被选出,组成进阶支撑候选框集合ra,在构造完三个集合后,使用关系提炼的基础阶段进行参考候选框特征聚合,基础阶段通过考量基础支持候选框集合rs中所有候选框与每一个参考候选框的关系,获得参考候选框的关系增强特征,并增强参考候选框的特征,将特征进行提取,提取出相对应的视频特征,形成一个关系网,将每个关系网进行提取,形成一个一个的目标,识别精准度高,识别能力强;
31.将图片的边缘再次进行格栅处理,分割成更小的格栅,应用高斯滤波来平滑图像,去除图片中的噪声,找寻图像的强度梯度,应用非最大抑制技术来消除边误检应用双阈值的方法来决定可能的边界,使用软件中自带的算法来跟踪边界,将边界进行剥离出来,将剥离出来的图片在进行提取,提取出来的后的图片备用,将关系网中与提取出来的照片进行对比,将该图片放入到相对应的目标中,进行分类,边缘化进行处理使精准度更高,可以将小型的目标进行识别,精确度更高。
32.使用pytorch框架,能够方便地训练自己的数据集,pytorch框架更容易投入生产,代码易读,整合了大量的计算机视觉技术,非常有利于学习和借鉴,不仅易于配置环境,模型训练也非常快速,并且批处理推理产生实时结果,能够直接对单个图像,批处理图像,视频甚至网络摄像头端口输入进行有效推理,能够轻松的将pytorch权重文件转化为安卓使用的onxx格式,然后可以转换为opencv的使用格式,或者通过coreml转化为ios格式,直接部署到手机应用端。
具体实施方式
33.为使本发明实施例的目的、技术方案和优点更加清楚,下面将对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
34.实施例1
35.一种基于yolov5算法的目标检测的处理方法,包括以下步骤:
36.s1、将视频导入到软件中,在软件中,将视频进行分帧,然后将每一帧的图片格栅成不同的大小;
37.s2、将格栅化后的每一帧的图片进行处理;
38.步骤s2中的图片处理,包括以下步骤:
39.s21、将格栅后的图片给定输入参考i
t
和所有支撑帧
40.s22、通过候选框生成网络产生各帧的候选框,经过非极大值抑制之后,保留k个候选框加入基础支持候选框集合rs用以对参考候选的增强;
41.s23、参考候选框中objectness得分前r%的候选框又被选出,组成进阶支撑候选框集合ra;
42.s24、在构造完三个集合后,使用关系提炼的基础阶段进行参考候选框特征聚合,基础阶段通过考量基础支持候选框集合rs中所有候选框与每一个参考候选框的关系,获得参考候选框的关系增强特征,并增强参考候选框的特征。
43.s25、将特征进行提取,提取出相对应的视频特征,形成一个关系网,将每个关系网进行提取,形成一个一个的目标。
44.s3、将格栅化后的图片进行边缘化处理;
45.s31、将图片的边缘再次进行格栅处理,分割成更小的格栅;
46.s32、应用高斯滤波来平滑图像,去除图片中的噪声;
47.s33、找寻图像的强度梯度;
48.s34、应用非最大抑制技术来消除边误检应用双阈值的方法来决定可能的边界;
49.s35、使用软件中自带的算法来跟踪边界,将边界进行剥离出来;
50.s36、将剥离出来的图片在进行提取,提取出来的后的图片备用;
51.s37、将关系网中与提取出来的照片进行对比,将该图片放入到相对应的目标中,进行分类。
52.s4、训练自己的数据集,使用yolov5算法训练自己的数据集;
53.s5、获取到目标,使用yolov5算法获取到目标。
54.yolov:网络由三个主要组件组成:
55.1)backbone:在不同图像细粒度上聚合并形成图像特征的卷积神经网络。
56.2)neck:一系列混合和组合图像特征的网络层,并将图像特征传递到预测层。(一般是fpn或者panet)
57.3)head:对图像特征进行预测,生成边界框和并预测类别。
58.yolo v5中用到的重要的模块包括focus,bottleneckcsp,spp,panet。模型的上采
样upsample是采用nearest两倍上采样插值nn.upsample(mode="nearest")。
59.yolo v5使用pytorch框架,对用户非常友好,能够方便地训练自己的数据集,pytorch框架更容易投入生产。
60.代码易读,整合了大量的计算机视觉技术,非常有利于学习和借鉴。
61.不仅易于配置环境,模型训练也非常快速,并且批处理推理产生实时结果。
62.能够直接对单个图像,批处理图像,视频甚至网络摄像头端口输入进行有效推理。
63.能够轻松的将pytorch权重文件转化为安卓使用的onxx格式,然后可以转换为opencv的使用格式,或者通过coreml转化为ios格式,直接部署到手机应用端。
64.对比例1
65.本实施例与所提供的实施例1的方法大致相同,其主要区别在于:步骤 s2中未进行图片进行处理;
66.对比例2
67.本实施例与所提供的实施例1的方法大致相同,其主要区别在于:步骤 s3中未进行边缘处理。
68.对比例3
69.本实施例与所提供的实施例1的方法大致相同,其主要区别在于:步骤 s4中和步骤5中未使用yolov5算法。
70.性能测试
71.分别取实施例1和对比例1~3所提供基于yolov5算法的目标检测的处理方法的数据的准确性、识别能力和计算速度结果:
[0072][0073][0074]
将格栅后的图片给定输入参考i
t
和所有支撑帧通过候选框生成网络产生各帧的候选框,经过非极大值抑制之后,保留k个候选框加入基础支持候选框集合rs用以对参考候选的增强,参考候选框中objectness得分前r%的候选框又被选出,组成进阶支撑候选框集合ra,在构造完三个集合后,使用关系提炼的基础阶段进行参考候选框特征聚合,基础阶段通过考量基础支持候选框集合rs中所有候选框与每一个参考候选框的关系,获得参考候选框的关系增强特征,并增强参考候选框的特征,将特征进行提取,提取出相对应的视频特征,形成一个关系网,将每个关系网进行提取,形成一个一个的目标,识别精准度高,识别能力强;
[0075]
将图片的边缘再次进行格栅处理,分割成更小的格栅,应用高斯滤波来平滑图像,去除图片中的噪声,找寻图像的强度梯度,应用非最大抑制技术来消除边误检应用双阈值
的方法来决定可能的边界,使用软件中自带的算法来跟踪边界,将边界进行剥离出来,将剥离出来的图片在进行提取,提取出来的后的图片备用,将关系网中与提取出来的照片进行对比,将该图片放入到相对应的目标中,进行分类,边缘化进行处理使精准度更高。
[0076]
使用yolov5算法:yolo v5使用pytorch框架,能够方便地训练自己的数据集,pytorch框架更容易投入生产,代码易读,整合了大量的计算机视觉技术,非常有利于学习和借鉴,不仅易于配置环境,模型训练也非常快速,并且批处理推理产生实时结果,能够直接对单个图像,批处理图像,视频甚至网络摄像头端口输入进行有效推理,能够轻松的将pytorch权重文件转化为安卓使用的onxx格式,然后可以转换为opencv的使用格式,或者通过 coreml转化为ios格式,直接部署到手机应用端。
[0077]
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
技术特征:
1.一种基于yolov5算法的目标检测的处理方法,其特征在于,包括以下步骤:s1、将视频导入到软件中,在软件中,将视频进行分帧,然后将每一帧的图片格栅成不同的大小;s2、将格栅化后的每一帧的图片进行处理;s3、将格栅化后的图片进行边缘化处理;s4、训练自己的数据集;s5、获取到目标。2.根据权利要求1所述的一种基于yolov5算法的目标检测的处理方法,其特征在于:所述步骤s2中的图片处理,包括以下步骤:s21、将格栅后的图片给定输入参考i
t
和所有支撑帧s22、通过候选框生成网络产生各帧的候选框,经过非极大值抑制之后,保留k个候选框加入基础支持候选框集合r
s
用以对参考候选的增强;s23、参考候选框中objectness得分前r%的候选框又被选出,组成进阶支撑候选框集合r
a
;s24、在构造完三个集合后,使用关系提炼的基础阶段进行参考候选框特征聚合,基础阶段通过考量基础支持候选框集合r
s
中所有候选框与每一个参考候选框的关系,获得参考候选框的关系增强特征,并增强参考候选框的特征。s25、将特征进行提取,提取出相对应的视频特征,形成一个关系网,将每个关系网进行提取,形成一个一个的目标。3.根据权利要求1所述的一种基于yolov5算法的目标检测的处理方法,其特征在于:所述步骤s3:包括以下步骤:s31、将图片的边缘再次进行格栅处理,分割成更小的格栅;s32、应用高斯滤波来平滑图像,去除图片中的噪声;s33、找寻图像的强度梯度;s34、应用非最大抑制技术来消除边误检应用双阈值的方法来决定可能的边界;s35、使用软件中自带的算法来跟踪边界,将边界进行剥离出来;s36、将剥离出来的图片在进行提取,提取出来的后的图片备用;s37、将关系网中与提取出来的照片进行对比,将该图片放入到相对应的目标中,进行分类。4.根据权利要求1所述的一种基于yolov5算法的目标检测的处理方法,其特征在于:所述步骤s4:使用yolov5算法训练自己的数据集。5.根据权利要求1所述的一种基于yolov5算法的目标检测的处理方法,其特征在于:所述步骤s5:使用yolov5算法获取到目标。
技术总结
本发明涉及目标检测技术领域,具体涉及一种基于yolov5算法的目标检测的处理方法,包括以下步骤:S1、将视频导入到软件中,在软件中,将视频进行分帧,然后将每一帧的图片格栅成不同的大小,将图片的边缘再次进行格栅处理,分割成更小的格栅,应用高斯滤波来平滑图像,去除图片中的噪声,找寻图像的强度梯度,应用非最大抑制技术来消除边误检应用双阈值的方法来决定可能的边界,使用软件中自带的算法来跟踪边界,将边界进行剥离出来,将剥离出来的图片在进行提取,将关系网中与提取出来的照片进行对比,将该图片放入到相对应的目标中,进行分类,边缘化进行处理使精准度更高,可以将小型的目标进行识别,精确度更高。精确度更高。
技术研发人员:李敏芳
受保护的技术使用者:昆明理工大学
技术研发日:2021.11.09
技术公布日:2022/3/8