字符切割方法、装置、电子设备及存储介质与流程

专利查询11月前  64



1.本发明实施例涉及图像识别技术领域,尤其涉及一种字符切割方法、装置、电子设备及存储介质。


背景技术:

2.字符切割指的是对连接字符串中的每个字符进行相应的切割处理以得到对应的单个字符。字符切割应用在生活生产中的各个方面,如在票据业务中的票据打印内容识别或者是证件照打印版中的证件号识别等,在此过程中,打印字符可能会因为打印设备的性能等问题导致字符连接的情况,要识别这些连接字符串就需要进行相应的字符切割。
3.目前,字符切割通常采用等宽切割方法,对整个连接字符串进行等分切割,例如,若连接字符串有10个字符,且已知连接字符串大小的宽度,则可以把字符串平均切割成10份,每一份可以认为是一个字符。但是,等宽切割方法在实际中会出现很多问题,如现有的连接字符串中的字符大小并不一定是等宽的,即使利用平均宽度或者是其他基于统计得到的宽度来进行等宽切割也难以对连接字符串进行准确切割,可能会出现有些字符切割不完全等问题。例如专利文件cn105069456a中的字符切割方法,仅通过投影法来处理连接字符串,可能会造成字符误切割的问题。又如专利文件cn108491845a中提出的一种字符分割位置的确定、字符分割方法,是先确定出粘连子串中的多个目标分割位置,再根据字符间粘连区域的属性信息从多个目标分割位置中确定粘连子串的最终分割位置;但是该方法中若所确定的目标分割位置不准确可能会影响后续最终分割位置,从而可能导致粘连子串的分割不准确。
4.故,如何对连接字符串进行准确的切割是当前亟待解决的问题。


技术实现要素:

5.本发明实施例提供了一种字符切割方法、装置、电子设备及存储介质,以提高对连接字符串切割的准确率。
6.第一方面,本发明实施例提供了一种字符切割方法,包括:
7.确定待识别图像中的连接字符串;
8.从所述连接字符串对应的图像区域中截取设定宽度的区域,得到待切割字符串图像;
9.将所述待切割字符串图像分块,并对得到的分块图像进行列投影,得到各所述分块图像对应的投影结果;
10.根据各所述投影结果确定所述待切割字符串图像的切割线,以根据所述切割线对所述待切割字符串图像进行切割。
11.第二方面,本发明实施例还提供了一种字符切割装置,包括:
12.确定模块,用于确定待识别图像中的连接字符串;
13.截取模块,用于从所述连接字符串对应的图像区域中截取设定宽度的区域,得到
待切割字符串图像;
14.投影模块,用于将所述待切割字符串图像分块,并对得到的分块图像进行列投影,得到各所述分块图像对应的投影结果;
15.切割模块,用于根据各所述投影结果确定所述待切割字符串图像的切割线,以根据所述切割线对所述待切割字符串图像进行切割。
16.第三方面,本发明实施例还提供了一种电子设备,包括:
17.一个或多个处理器;
18.存储装置,用于存储一个或多个程序;
19.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例提供的字符切割方法。
20.第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例提供的字符切割方法。
21.本发明实施例提供了一种字符切割方法、装置、电子设备及存储介质,首先确定待识别图像中的连接字符串;然后从连接字符串对应的图像区域中截取设定宽度的区域,得到待切割字符串图像;之后将待切割字符串图像分块,并对得到的分块图像进行列投影,得到各分块图像对应的投影结果;最后根据各投影结果确定待切割字符串图像的切割线,以根据切割线对待切割字符串图像进行切割。利用上述方法,通过确定连接字符串,能够筛选掉无需进行字符切割的单个字符,从而提高字符切割速率;还通过对连接字符串进行截取、分块以及列投影等处理,能够进一步确定最优的切割位置和对应的切割线,从而提高了对连接字符串切割的准确率。
附图说明
22.图1为本发明提供的一种基于字符等宽切割方法切割字符串的实现示意图;
23.图2为本发明实施例一提供的一种字符切割方法的流程示意图;
24.图3为本发明实施例一提供的一种预处理的实现示意图;
25.图4为本发明实施例一提供的一种基于轮廓查找方法获取二值图像外接轮廓的实现示意图;
26.图5为本发明实施例一提供的一种截取连接字符串的实现示意图;
27.图6为本发明实施例一提供的一种对待切割字符串图像分块的实现示意图;
28.图7为本发明实施例二提供的一种字符切割方法的流程示意图;
29.图8为本发明实施例二提供的一种根据起始线依次截取连接字符串的实现示意图;
30.图9为本发明实施例二提供的一种基于字符切割方法实现连接字符串切割的示意图;
31.图10为本发明实施例三提供的一种字符切割装置的结构示意图;
32.图11为本发明实施例四提供的一种电子设备的结构示意图。
具体实施方式
33.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描
述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
34.在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
35.本发明使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”。
36.需要注意,本发明中提及的“第一”、“第二”等概念仅用于对相应内容进行区分,并非用于限定顺序或者相互依存关系。
37.需要注意,本发明中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
38.对于连接字符串的字符切割是对于字符串基于单个字符识别的重点和难点。各类票据或者证件照中都有对字符串进行识别的需求,而打印字符串因为打印设备的原因可能会导致所打印出的字符串中的字符出现连接的情况。通常情况下,字符串的识别过程需要进行切割,切割为单个字符之后再进行识别,而切割效果的好坏也会直接影响最终的识别效果。
39.现有常采用的一种方法是字符等宽分割方法,即在已知字符大小前提下,对整个字符串进行等份切割。但是,利用字符等宽切割方法对字符串进行切割,总会有些字符切割不完全。此外,因为打印设备的原因,打印字体的浓墨程度也不一样,有的字符打印会比较浓,有的字符会打印的比较浅,也可能会造成每个宽度都不一样,即使利用平均宽度和其他基于统计方法得到的宽度进行字符等宽切割也难以准确对字符进行切割。图1为本发明提供的一种基于字符等宽切割方法切割字符串的实现示意图。如图1所示,图中的每条竖线可以表示利用字符等宽切割方法所得到的切割线,根据切割线,切割出单个字符;在连接字符串中,前面几个字符切割的比较好,后面的字符就切割的不够准确,如切割线只切割了部分单个字符。因此,本技术提出了一种字符切割方法,能够实现对连接字符串中单个字符的准确切割。
40.实施例一
41.图2为本发明实施例一提供的一种字符切割方法的流程示意图,该方法可适用于对连接字符串进行切割的情况,该方法可以由字符切割装置来执行,其中该装置可由软件和/或硬件实现,并一般集成在电子设备上,在本实施例中电子设备包括但不限于:台式计算机、笔记本电脑和服务器等。
42.如图2所示,本发明实施例一提供的一种字符切割方法,该方法包括如下步骤:
43.s110、确定待识别图像中的连接字符串。
44.在本实施例中,待识别图像可以指包含待识别字符的图像,如票据业务中的银行存单打印图像、证件照图像等;其中待识别字符可以是待识别的数字、字母或者符号等,例如银行存单的账号、证件照的证件号等,账号或证件号中的每个字符可以认为是单个字符。
45.连接字符串可以指多个相互粘连的单个字符所构成的一串字符,连接字符串中可以包括至少两个单个字符。例如,在银行存单打印图像中,由于打印设备等原因,账号中多个数字出现粘连情况,该多个粘连的数字可以认为是一个连接字符串。
46.在本步骤中,可以根据待识别图像中的字符宽度,来区分单个字符和连接字符串。单个字符可以认为是没有与其他字符相粘连的字符。例如,连接字符串的宽度大于单个字符的宽度,根据所确定的字符宽度大小,可以确定出连接字符串。
47.可选的,确定待识别图像中的连接字符串,包括:对待识别图像进行预处理,得到待识别图像对应的二值图像;根据二值图像中字符的外接轮廓的宽度,确定连接字符串。
48.其中,预处理可以指对待识别图像所预先进行的图像处理。具体的,预处理的过程可以是:首先,对待识别图像中的字符区域进行定位和截取,得到对应的目标图像,其中目标图像可以指所截取的字符所在区域的图像;然后,为了保留和强化字符的边缘,可以采用3*3卷积核对目标图像进行锐化操作,得到锐化图像,其中卷积核参数可以为(0,-1,0,-1,5,-1,0,-1,0);之后,对锐化图像进行灰度化得到灰度图像;最后,对灰度图像进行二值化,得到对应的二值图像。
49.图3为本发明实施例一提供的一种预处理的实现示意图。如图3所示,图3(a)可以表示目标图像;图3(b)可以表示锐化图像;3(c)可以表示灰度图像;3(d)可以表示二值图像。
50.外接轮廓可以指二值图像中字符的外接矩形轮廓,例如可以通过轮廓查找方法得到二值图像中字符的外接轮廓。字符可以包括单个字符和连接字符串。轮廓查找方法可以指一种基于图像边缘提取的基础以寻找对象轮廓的方法。在此基础上,根据二值图像中字符的外接轮廓的宽度的不同,可以确定单个字符和连接字符串。
51.可选的,二值图像中包括单个字符的外接轮廓和非单个字符的外接轮廓;根据所述二值图像中字符的外接轮廓的宽度,确定连接字符串,包括:确定二值图像中字符的外接轮廓的宽度最小值;将宽度大于所述宽度最小值的设定倍数的外接轮廓所对应的非单个字符,确定为连接字符串。
52.其中,非单个字符可以指除了单个字符外的其他字符。在二值图像中包含单个字符和非单个字符的情况下,则通过轮廓查找方法得到的二值图像中可以包括单个字符的外接轮廓和非单个字符的外接轮廓。
53.宽度最小值可以指在所得到的所有外接轮廓中,宽度最小的值。可以理解的是,该宽度最小值可以认为是所有单个字符的外接轮廓中宽度最小的值。设定倍数可以指所预先设定的一个倍数值,例如设定倍数可以为1.8倍,此处对设定倍数不作限定,可根据字符特点和实际情况灵活设定。
54.示例性的,在本步骤中,可以将宽度大于宽度最小值的1.8倍的外接轮廓所对应的非单个字符,确定为连接字符串。
55.图4为本发明实施例一提供的一种基于轮廓查找方法获取二值图像外接轮廓的实现示意图。如图4所示,二值图像中的“54”和“8965”所对应的外接轮廓明显大于单个字符的外接轮廓的设定倍数,可以确定为连接字符串,需要进行进一步的切割;在二值图像中除了“54”和“8965”,剩余的字符都可以属于单个字符,不需要进行进一步的切割即可以识别。
56.需要说明的是,若在二值图像中包含多个字符的情况下,通过轮廓查找方法得到
的外接轮廓只有一个,则可以说明该二值图像中没有单个字符,整个二值图像中的字符为一个连接字符串。
57.s120、从所述连接字符串对应的图像区域中截取设定宽度的区域,得到待切割字符串图像。
58.在本实施例中,截取可以指从一个整体中切取出一部分。设定宽度可以指预先设定的一个宽度值。例如,若二值图像中包括单个字符的外接轮廓和非单个字符的外接轮廓,则设定宽度可以为所有单个字符外接轮廓的平均宽度的1.8倍;其中,可以将所有单个字符外接轮廓的平均宽度称为第一平均宽度。若包含多个字符的二值图像包括一个外接轮廓(字符数已知),则设定宽度可以为外接轮廓宽度除以字符数所得到的均值的1.8倍;其中,可以将这种情况下的外接轮廓宽度除以字符数所得到的均值称为第二平均宽度。此处,1.8倍可以认为是一个可变参数,可根据字符特点和实际情况进行灵活设定。
59.待切割字符串图像可以指所截取出的等待切割的字符串所占的图像区域。
60.可以理解的是,为了便于字符切割,对于较长的连接字符串(即外接轮廓较宽的连接字符串),其中可能包括多个粘连在一起的单个字符,可以将较长的连接字符串分为多个子部分进行切割,例如可以从二值图像中连接字符串对应的图像区域中截取设定宽度的区域,将所截取出的图像区域作为待切割字符串图像。通常情况下,以设定宽度截取所得到的待切割字符串图像中可能包含两个粘连的单个字符。
61.需要说明的是,对于较长的连接字符串,可能需要进行多次的截取。首次截取的时候,可以将连接字符串对应的图像区域的左侧边界作为起始线进行截取;在之后每次截取的过程中,从连接字符串对应的图像区域中,可以将上一次截取的待切割字符串图像所对应的切割线作为起始线进行截取,直至将连接字符串所对应的图像区域截取完毕。
62.可选的,从连接字符串对应的图像区域中截取设定宽度的区域,得到待切割字符串图像,包括:从连接字符串对应的图像区域中,以待切割字符串图像的左侧边界为起始线,或者以上一次截取的待切割字符串图像所对应的切割线为起始线,截取设定宽度的区域,得到待切割字符串图像。
63.其中,在首次截取的时候,待切割字符串图像的左侧边界即为整个连接字符串对应的图像区域的左侧边界,可以以待切割字符串图像的左侧边界为起始线。在之后的每次截取过程中,可以以上一次截取的待切割字符串图像所对应的切割线为起始线,截取设定宽度的区域,得到待切割字符串图像。
64.图5为本发明实施例一提供的一种截取连接字符串的实现示意图。如图5所示,以连接字符串“8965”对应的图像区域的左侧边界为起始线,采用设定宽度将连接字符串“8965”中的“89”截取出来。
65.s130、将所述待切割字符串图像分块,并对得到的分块图像进行列投影,得到各所述分块图像对应的投影结果。
66.在本实施例中,分块可以指将待切割字符串图像分割成多个小块,例如可以按照一定的比例大小,从待切割字符串图像上边界至下边界的方向进行分块。分块图像可以指通过对待切割字符串图像进行分块所得到的各个子图像。将待切割字符串图像分块所得到的分块图像可以包括两个或多个。
67.可选的,将待切割字符串图像分块,包括:按照字符切割方向,根据设定比例将待
切割字符串图像分为至少两个分块图像。
68.其中,字符切割方向可以指从待切割字符串图像的上边界开始至下边界所对应的垂直方向。设定比例可以指所预先设定的分块比例,此处对设定比例不作限定,例如设定比例可以为2/3、1/2等。
69.图6为本发明实施例一提供的一种对待切割字符串图像分块的实现示意图。如图6所示,设定比例依次取2/3、1/2和2/3,按照字符切割方向(即从上到下的方向)以设定比例依次进行分块得到相应的3个分块图像。
70.列投影可以指对分块图像进行垂直方向的投影。通过列投影可以得到分块图像在垂直方向的所有像素点,像素点中包括白色像素点和黑色像素点。可以理解的是,在分块图像中,白色像素点可以表示字符对应的像素点,黑色像素点可以表示黑色背景对应的像素点。分块图像的垂直方向上的每一列都对应一列像素点,在此基础上,根据所有像素点,可以将白色像素点最少的列所对应的位置作为相应的投影结果。
71.可选的,对得到的分块图像进行列投影,得到各分块图像对应的投影结果,包括:对于每个分块图像,将该分块图像进行列投影,得到该分块图像的列白点分布;在该分块图像的第一扫描范围内,按照第一预设方向扫描列白点分布,以确定列白点个数最少的列所在的位置,作为第一切割位置;在该分块图像的第二扫描范围内,按照第二预设方向扫描所述列白点分布,以确定列白点个数最少的列所在的位置,作为第二切割位置;其中,每个分块图像对应的投影结果包括该分块图像对应的第一切割位置和第二切割位置。
72.其中,列白点分布可以指经过列投影之后,分块图像在垂直方向上的每一列白色像素点的数量分布。白点可以指白色像素点。列白点个数可以指每列白色像素点的数量。
73.在二值图像中包括单个字符的外接轮廓和非单个字符的外接轮廓的情况下第一扫描范围可以指在分块图像中,以第一平均宽度的0.6倍所对应的位置与第一平均宽度的1.8倍所对应的位置作为边界所确定的扫描范围。在包含多个字符的二值图像包括一个外接轮廓(字符数已知)的情况下,第一扫描范围可以指在分块图像中,以第二平均宽度的0.6倍所对应的位置与第二平均宽度的1.8倍所对应的位置作为边界所确定的扫描范围。
74.第一预设方向可以指从分块图像的左侧至右侧所对应的方向。在此基础上,在分块图像的第一扫描范围内,按照第一预设方向扫描列白点分布,将所确定的列白点个数最少的列所在的位置,作为第一切割位置。
75.第二扫描范围可以指整个分块图像范围。第二预设方向可以指从分块图像的右侧至左侧所对应的方向。在此基础上,在分块图像的第二扫描范围内,按照第二预设方向扫描列白点分布,将所确定的列白点个数最少的列所在的位置,作为第二切割位置。
76.一个分块图像对应一组第一切割位置和第二切割位置,即每个分块图像对应的投影结果包括该分块图像对应的第一切割位置和第二切割位置。
77.s140、根据各所述投影结果确定所述待切割字符串图像的切割线,以根据所述切割线对所述待切割字符串图像进行切割。
78.在本实施例中,不同的投影结果对应不同的切割线确定方式。
79.示例性的,在每个分块图像对应的投影结果中,若存在一个投影结果,其中第一切割位置和第二切割位置一致,则可以将该投影结果作为确定切割线的依据,即可以将该投影结果的第一切割位置或第二切割位置所在直线作为待切割字符串图像的切割线。
80.若存在多个投影结果,该多个投影结果中每个投影结果中的第一切割位置和第二切割位置都一致,则可以选取其中任意一个投影结果作为确定切割线的依据;也可以将每个投影结果中的第一切割位置取均值,将每个投影结果中的第二切割位置取均值,在此基础上将得到的两个均值再次求均值,将该均值所在位置对应的直线确定为切割线。
81.若所有的投影结果中,每个投影结果中的第一切割位置和第二切割位置都不一致,则同样的,可以将每个投影结果中的第一切割位置取均值,将每个投影结果中的第二切割位置取均值,在此基础上将得到的两个均值再次求均值,将该均值所在位置对应的直线确定为切割线。
82.在上述实施例的基础上,根据所确定的切割线对待切割字符串图像进行切割,以得到切割后的单个字符。
83.本发明实施例一提供的一种字符切割方法,首先确定待识别图像中的连接字符串;然后从连接字符串对应的图像区域中截取设定宽度的区域,得到待切割字符串图像;之后将待切割字符串图像分块,并对得到的分块图像进行列投影,得到各分块图像对应的投影结果;最后根据各投影结果确定待切割字符串图像的切割线,以根据切割线对待切割字符串图像进行切割。利用上述方法,通过确定连接字符串,能够筛选掉无需进行字符切割的单个字符,从而提高字符切割速率;还通过对连接字符串进行截取、分块以及列投影等处理,能够进一步确定最优的切割位置和对应的切割线,从而提高了对连接字符串切割的准确率。
84.在上述实施例的基础上,对根据各投影结果确定待切割字符串图像的切割线的具体过程进行了描述,在此需要说明的是,为了使描述简要,在以下实施例中仅描述与上述实施例的不同之处。
85.可选的,根据各投影结果确定待切割字符串图像的切割线,包括:确定各分块图像对应的投影结果中,符合预设条件的投影结果的数量,其中,预设条件包括投影结果中的第一切割位置与第二切割位置一致;根据数量确定待切割字符串图像的切割线。
86.其中,预设条件可以指投影结果中的第一切割位置与第二切割位置所在的位置是同一个位置。根据数量确定待切割字符串图像的切割线,可以表明,不同的数量对应于不同的切割线确定方式。
87.可选的,根据数量确定待切割字符串图像的切割线,包括:若数量大于或等于1,则将任意一组符合预设条件的投影结果中的第一切割位置或第二切割位置作为待切割字符串图像的切割线;若数量为0,则将各分块图像对应的投影结果中的第一切割位置的均值作为第一均值,将各分块图像对应的投影结果中的第二切割位置的均值作为第二均值,并将第一均值和第二均值的均值所对应的位置作为待切割字符串图像的切割线。
88.其中,若数量大于或等于1,可以表明符合预设条件的投影结果为1个或多个,此时可以从中任意选取一个投影结果,将该投影结果中的第一切割位置或第二切割位置作为待切割字符串图像的切割线。
89.若数量为0,可以表明符合预设条件的投影结果为0个。此时假设有三个分块图像,第一个分块图像的投影结果为ireft1(表示第一切割线位置)和iright1(表示第二切割线位置),第二个分块图像的投影结果为ireft2和iright2,第三个分块图像的投影结果为ireft3和iright3。在此基础上,可以将各分块图像对应的投影结果中的第一切割位置的均
值作为第一均值imeanreft,其计算公式可表示为imeanreft=(ireft1+ireft2+ireft3)/3,将各分块图像对应的投影结果中的第二切割位置的均值作为第二均值imeanright,其计算公式可表示为imeanright=(iright1+iright2+iright3)/3;并将第一均值imeanreft和第二均值imeanright的均值所对应的位置作为待切割字符串图像的切割线。
90.实施例二
91.图7为本发明实施例二提供的一种字符切割方法的流程示意图,本实施例二在上述各实施例的基础上进行细化。在本实施例中,对根据起始线多次截取连接字符串以及确定切割线的过程进行了具体描述。需要说明的是,未在本实施例中详尽描述的技术细节可参见上述任意实施例。
92.如图7所示,本发明实施例二提供的一种字符切割方法,该方法包括如下步骤:
93.s210、确定待识别图像中的连接字符串。
94.在本实施例中,对待识别图像进行预处理,得到待识别图像对应的二值图像;根据二值图像中字符的外接轮廓的宽度,将宽度大于外接轮廓宽度最小值的设定倍数的外接轮廓所对应的非单个字符,确定为连接字符串。
95.s220、从连接字符串对应的图像区域中,根据起始线,截取设定宽度的区域,得到待切割字符串图像。
96.在本实施例中,首次截取的起始线可以认为是连接字符串对应的图像区域的左侧边界线。之后每次所截取的起始线可以认为是上一次所确定的切割线。
97.s230、将待切割字符串图像分块,并对得到的分块图像进行列投影,得到各分块图像对应的投影结果。
98.在本实施例中,按照字符切割方向,根据设定比例将待切割字符串图像分为至少两个分块图像。
99.对于每个分块图像,将该分块图像进行列投影,得到该分块图像的列白点分布;在该分块图像的第一扫描范围内,按照第一预设方向扫描列白点分布,以确定列白点个数最少的列所在的位置,作为第一切割位置;在该分块图像的第二扫描范围内,按照第二预设方向扫描列白点分布,以确定列白点个数最少的列所在的位置,作为第二切割位置;其中,每个分块图像对应的投影结果包括该分块图像对应的第一切割位置和第二切割位置。
100.s240、根据各投影结果确定待切割字符串图像的切割线。
101.在本实施例中,确定各分块图像对应的投影结果中,符合预设条件的投影结果的数量,在此基础上,根据数量确定待切割字符串图像的切割线。
102.s250、根据切割线对待切割字符串图像进行切割。
103.s260、判定切割线与连接字符串对应的图像区域的右边界之间的宽度是否大于设定宽度,若是,则执行s270,否则执行s280。
104.s270、将切割线作为起始线,返回执行s220,继续截取下一个待切割字符串图像。
105.s280、截取结束。
106.在本实施例中,判定切割线与连接字符串对应的图像区域的右边界之间的宽度是否大于设定宽度。若大于设定宽度,则可以表明当前切割线与连接字符串对应的图像区域的右边界之间的范围内,还存在可截取的待切割字符串图像,在此基础上,可将切割线作为起始线,返回执行s220,继续截取下一个待切割字符串图像,从而得到待切割字符串图像的
切割线。若小于设定宽度,则可以表明当前切割线与连接字符串对应的图像区域的右边界之间的范围内,不存在可截取的待切割字符串图像,此时表明已将连接字符串截取完毕,即截取结束。在此过程中,所得到的切割线即为整个连接字符串的准确切割线,根据切割线对连接字符串进行切割,可以得到对应的单个字符。
107.需要说明的是,本实施例中对判定切割线与连接字符串对应的图像区域的右边界之间是否还存在待切割字符串的方法不作限定。
108.需要说明的是,对s250和s260的执行顺序不作限定,可以同时执行,也可以分开执行。
109.图8为本发明实施例二提供的一种根据起始线依次截取连接字符串的实现示意图。如图8所示,首次截取以连接字符串对应的图像区域的左侧边界为起始线,截取得到“89”;第二次截取以上一次“89”的切割线为起始线,截取得到“96”;第三次以上一次“96”的切割线为起始线,截取得到“65”,此时截取完毕。
110.本发明实施例二提供的一种字符切割方法,该方法根据起始线,从连接字符串的起始位置依次截取相邻两个字符作为待切割字符串图像,并根据所截取的待切割字符串图像确定相应的切割线,从而确定整个连接字符串的切割线,能够减小每次确定切割线的计算量,从而进一步提高字符切割的速率和准确率。
111.图9为本发明实施例二提供的一种基于字符切割方法实现连接字符串切割的示意图。如图9所示,利用本技术发明实施例所提供的字符切割方法,对待识别图像中的连接字符串进行切割的切割效果图。左侧为切割前的连接字符串,右侧为对连接字符串切割后的效果图。
112.实施例三
113.图10为本发明实施例三提供的一种字符切割装置的结构示意图,该装置可由软件和/或硬件实现。如图10所示,包括:确定模块310、截取模块320、投影模块330以及切割模块340;
114.其中,确定模块310,用于确定待识别图像中的连接字符串;
115.截取模块320,用于从所述连接字符串对应的图像区域中截取设定宽度的区域,得到待切割字符串图像;
116.投影模块330,用于将所述待切割字符串图像分块,并对得到的分块图像进行列投影,得到各所述分块图像对应的投影结果;
117.切割模块340,用于根据各所述投影结果确定所述待切割字符串图像的切割线,以根据所述切割线对所述待切割字符串图像进行切割。
118.在本实施例中,该装置首先通过确定模块310,确定待识别图像中的连接字符串;然后通过截取模块320,从连接字符串对应的图像区域中截取设定宽度的区域,得到待切割字符串图像;之后通过投影模块330,将待切割字符串图像分块,并对得到的分块图像进行列投影,得到各分块图像对应的投影结果;最后通过切割模块340,根据各投影结果确定待切割字符串图像的切割线,以根据切割线对待切割字符串图像进行切割。利用该装置,通过确定连接字符串,能够筛选掉无需进行字符切割的单个字符,从而提高字符切割速率;还通过对连接字符串进行截取、分块以及列投影等处理,能够进一步确定最优的切割位置和对应的切割线,从而提高了对连接字符串切割的准确率。
119.可选的,确定模块310具体包括:
120.预处理单元,用于对所述待识别图像进行预处理,得到所述待识别图像对应的二值图像;
121.连接字符串确定单元,用于根据所述二值图像中字符的外接轮廓的宽度,确定连接字符串。
122.可选的,在所述装置中,所述二值图像中包括单个字符的外接轮廓和非单个字符的外接轮廓;
123.连接字符串确定单元具体包括:
124.最小值确定子单元,用于确定所述二值图像中字符的外接轮廓的宽度最小值;
125.连接字符串确定子单元,用于将宽度大于所述宽度最小值的设定倍数的外接轮廓所对应的非单个字符,确定为所述连接字符串。
126.可选的,截取模块320具体用于:
127.从所述连接字符串对应的图像区域中,以所述待切割字符串图像的左侧边界为起始线,或者以上一次截取的待切割字符串图像所对应的切割线为起始线,截取设定宽度的区域,得到待切割字符串图像。
128.可选的,投影模块330,在执行“将所述待切割字符串图像分块”操作时,具体包括:
129.分块单元,用于按照字符切割方向,根据设定比例将所述待切割字符串图像分为至少两个分块图像。
130.可选的,投影模块330,在执行“对得到的分块图像进行列投影,得到各所述分块图像对应的投影结果”操作时,具体包括:
131.投影单元,用于对于每个分块图像,将该分块图像进行列投影,得到该分块图像的列白点分布;
132.第一确定单元,用于在该分块图像的第一扫描范围内,按照第一预设方向扫描所述列白点分布,以确定列白点个数最少的列所在的位置,作为第一切割位置;
133.第二确定单元,用于在该分块图像的第二扫描范围内,按照第二预设方向扫描所述列白点分布,以确定列白点个数最少的列所在的位置,作为第二切割位置;
134.其中,每个分块图像对应的投影结果包括该分块图像对应的第一切割位置和第二切割位置。
135.可选的,切割模块340具体包括:
136.数量确定单元,用于确定各所述分块图像对应的投影结果中,符合预设条件的投影结果的数量,其中,所述预设条件包括所述投影结果中的第一切割位置与第二切割位置一致;
137.切割线确定单元,用于根据所述数量确定所述待切割字符串图像的切割线。
138.可选的,切割线确定单元具体包括:
139.第一切割线确定子单元,用于若所述数量大于或等于1,则将任意一组符合预设条件的投影结果中的第一切割位置或第二切割位置作为所述待切割字符串图像的切割线;
140.第二切割线确定子单元,用于若所述数量为0,则将各所述分块图像对应的投影结果中的第一切割位置的均值作为第一均值,将各所述分块图像对应的投影结果中的第二切割位置的均值作为第二均值,并将所述第一均值和所述第二均值的均值所对应的位置作为
所述待切割字符串图像的切割线。
141.上述字符切割装置可执行本发明任意实施例所提供的字符切割方法,具备执行方法相应的功能模块和有益效果。
142.实施例四
143.图11为本发明实施例四提供的一种电子设备的结构示意图。如图11所示,本发明实施例四提供的电子设备包括:一个或多个处理器41和存储装置42;该电子设备中的处理器41可以是一个或多个,图11中以一个处理器41为例;存储装置42用于存储一个或多个程序;所述一个或多个程序被所述一个或多个处理器41执行,使得所述一个或多个处理器41实现如本发明实施例中任一项所述的字符切割方法。
144.所述电子设备还可以包括:通信装置43、输入装置44和输出装置45。
145.电子设备中的处理器41、存储装置42、通信装置43、输入装置44和输出装置45可以通过总线或其他方式连接,图11中以通过总线连接为例。
146.该电子设备中的存储装置42作为一种计算机可读存储介质,可用于存储一个或多个程序,所述程序可以是软件程序、计算机可执行程序以及模块,如本发明实施例一或二所提供字符切割方法对应的程序指令/模块(例如,附图10所示的字符切割装置中的模块,包括:确定模块310、截取模块320、投影模块330以及切割模块340)。处理器41通过运行存储在存储装置42中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述方法实施例中的字符切割方法。
147.存储装置42可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据业务服务器的使用所创建的数据等。此外,存储装置42可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储装置42可进一步包括相对于处理器41远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
148.通信装置43可以包括接收器和发送器。通信装置43设置为根据处理器41的控制进行信息收发通信。
149.输入装置44可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置45可包括显示屏等显示设备。
150.并且,当上述电子设备所包括一个或者多个程序被所述一个或者多个处理器41执行时,程序进行如下操作:确定待识别图像中的连接字符串;从所述连接字符串对应的图像区域中截取设定宽度的区域,得到待切割字符串图像;将所述待切割字符串图像分块,并对得到的分块图像进行列投影,得到各所述分块图像对应的投影结果;根据各所述投影结果确定所述待切割字符串图像的切割线,以根据所述切割线对所述待切割字符串图像进行切割。
151.实施例五
152.本发明实施例五提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可以用于执行字符切割方法,该方法包括:确定待识别图像中的连接字符串;从所述连接字符串对应的图像区域中截取设定宽度的区域,得到待切割字符串图像;
将所述待切割字符串图像分块,并对得到的分块图像进行列投影,得到各所述分块图像对应的投影结果;根据各所述投影结果确定所述待切割字符串图像的切割线,以根据所述切割线对所述待切割字符串图像进行切割。
153.可选的,该程序被处理器执行时还可用于执行本发明任意实施例所提供的字符切割方法。
154.本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(random access memory,ram)、只读存储器(read only memory,rom)、可擦式可编程只读存储器(erasable programmable read only memory,eprom)、闪存、光纤、便携式cd-rom、光存储器件、磁存储器件、或者上述的任意合适的组合。计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
155.计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于:电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
156.计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆或无线电频率(radio frequency,rf)等等,或者上述的任意合适的组合。
157.可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如java、smalltalk、c++,还包括常规的过程式程序设计语言,诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
158.注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

技术特征:
1.一种字符切割方法,其特征在于,所述方法包括:确定待识别图像中的连接字符串;从所述连接字符串对应的图像区域中截取设定宽度的区域,得到待切割字符串图像;将所述待切割字符串图像分块,并对得到的分块图像进行列投影,得到各所述分块图像对应的投影结果;根据各所述投影结果确定所述待切割字符串图像的切割线,以根据所述切割线对所述待切割字符串图像进行切割。2.根据权利要求1所述的方法,其特征在于,所述确定待识别图像中的连接字符串,包括:对所述待识别图像进行预处理,得到所述待识别图像对应的二值图像;根据所述二值图像中字符的外接轮廓的宽度,确定连接字符串。3.根据权利要求2所述的方法,其特征在于,所述二值图像中包括单个字符的外接轮廓和非单个字符的外接轮廓;所述根据所述二值图像中字符的外接轮廓的宽度,确定连接字符串,包括:确定所述二值图像中字符的外接轮廓的宽度最小值;将宽度大于所述宽度最小值的设定倍数的外接轮廓所对应的非单个字符,确定为所述连接字符串。4.根据权利要求1所述的方法,其特征在于,所述从所述连接字符串对应的图像区域中截取设定宽度的区域,得到待切割字符串图像,包括:从所述连接字符串对应的图像区域中,以所述待切割字符串图像的左侧边界为起始线,或者以上一次截取的待切割字符串图像所对应的切割线为起始线,截取设定宽度的区域,得到待切割字符串图像。5.根据权利要求1所述的方法,其特征在于,所述将所述待切割字符串图像分块,包括:按照字符切割方向,根据设定比例将所述待切割字符串图像分为至少两个分块图像。6.根据权利要求1所述的方法,其特征在于,所述对得到的分块图像进行列投影,得到各所述分块图像对应的投影结果,包括:对于每个分块图像,将该分块图像进行列投影,得到该分块图像的列白点分布;在该分块图像的第一扫描范围内,按照第一预设方向扫描所述列白点分布,以确定列白点个数最少的列所在的位置,作为第一切割位置;在该分块图像的第二扫描范围内,按照第二预设方向扫描所述列白点分布,以确定列白点个数最少的列所在的位置,作为第二切割位置;其中,每个分块图像对应的投影结果包括该分块图像对应的第一切割位置和第二切割位置。7.根据权利要求6所述的方法,其特征在于,所述根据各所述投影结果确定所述待切割字符串图像的切割线,包括:确定各所述分块图像对应的投影结果中,符合预设条件的投影结果的数量,其中,所述预设条件包括所述投影结果中的第一切割位置与第二切割位置一致;根据所述数量确定所述待切割字符串图像的切割线。8.根据权利要求7所述的方法,其特征在于,所述根据所述数量确定所述待切割字符串
图像的切割线,包括:若所述数量大于或等于1,则将任意一组符合预设条件的投影结果中的第一切割位置或第二切割位置作为所述待切割字符串图像的切割线;若所述数量为0,则将各所述分块图像对应的投影结果中的第一切割位置的均值作为第一均值,将各所述分块图像对应的投影结果中的第二切割位置的均值作为第二均值,并将所述第一均值和所述第二均值的均值所对应的位置作为所述待切割字符串图像的切割线。9.一种字符切割装置,其特征在于,包括:确定模块,用于确定待识别图像中的连接字符串;截取模块,用于从所述连接字符串对应的图像区域中截取设定宽度的区域,得到待切割字符串图像;投影模块,用于将所述待切割字符串图像分块,并对得到的分块图像进行列投影,得到各所述分块图像对应的投影结果;切割模块,用于根据各所述投影结果确定所述待切割字符串图像的切割线,以根据所述切割线对所述待切割字符串图像进行切割。10.一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的字符切割方法。11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的字符切割方法。

技术总结
本发明实施例公开了一种字符切割方法、装置、电子设备及存储介质。所述方法包括:确定待识别图像中的连接字符串;从连接字符串对应的图像区域中截取设定宽度的区域,得到待切割字符串图像;将待切割字符串图像分块,并对得到的分块图像进行列投影,得到各分块图像对应的投影结果;根据各投影结果确定待切割字符串图像的切割线,以根据切割线对待切割字符串图像进行切割。利用上述方法,通过确定连接字符串,能够筛选掉无需进行字符切割的单个字符,从而提高字符切割速率;还通过对连接字符串进行截取、分块以及列投影等处理,能够进一步确定最优的切割位置和对应的切割线,从而提高了对连接字符串切割的准确率。接字符串切割的准确率。接字符串切割的准确率。


技术研发人员:曹川
受保护的技术使用者:深圳市怡化金融智能研究院
技术研发日:2021.12.06
技术公布日:2022/3/8

最新回复(0)