1.本公开涉及计算机技术领域,具体而言,涉及一种数据处理方法、数据处理装置、计算机可读存储介质以及电子设备。
背景技术:
2.在保险销售时,为了提升保险代理人的业务水平和专业能力,会对保险代理人进行销售话术的培训,在培训的过程中,需要代理人背诵固定的销售话术。
3.为了避免保险代理人的背诵情况不佳或者有些保险代理人甚至不背诵的情况发生,可以对保险代理人的背诵情况进行检查。
4.相关技术中,主要是人工对保险代理人的背诵情况进行检查和评价。显然,人工检查和评价的方式效率较低,且人工检查和评价的方式主观性较强,缺乏一定的客观性。
5.需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现要素:
6.本公开的目的在于提供一种数据处理方法及装置、计算机可读存储介质及电子设备,进而至少在一定程度上改善人工对用户行为进行检查和评价时效率低下、且缺乏客观性的问题。
7.本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
8.根据本公开的第一方面,提供了一种数据处理方法,包括:获取待检测视频对应的多个视频序列帧,检测每个所述视频序列帧的人脸存在情况,所述待检测视频用于表征目标用户的行为;在检测到所述视频序列帧中存在人脸时,将所述视频序列帧中的人脸与所述待检测视频对应的目标用户的人脸进行匹配,并检测所述视频序列帧中的人眼状态;根据多个所述视频序列帧的人脸存在情况和人脸匹配结果,确定出所述待检测视频的第一评分;根据多个所述视频序列帧中的人眼状态,确定出所述待检测视频的第二评分;基于所述第一评分和所述第二评分,确定出所述待检测视频的目标评分,以根据所述目标评分对所述目标用户的行为进行评价。
9.在本公开的一种示例性实施例中,基于前述方案,所述根据多个所述视频序列帧的人脸存在情况和人脸匹配结果,确定出所述待检测视频的第一评分,包括:确定存在人脸的视频序列帧的数量和所述多个视频序列帧的数量之间的第一比值;确定人脸匹配结果为成功的视频序列帧的数量和所述多个视频序列帧的数量之间的第二比值;根据所述第一比值和所述第二比值,确定出所述待检测视频的第一评分。
10.在本公开的一种示例性实施例中,基于前述方案,所述根据多个所述视频序列帧中的人眼状态,确定出所述待检测视频的第二评分,包括:确定人眼状态为闭眼时的视频序列帧的数量和所述多个视频序列帧的数量之间的第三比值;确定人眼状态为睁眼时的视频
序列帧的数量和所述多个视频序列帧的数量之间的第四比值;根据所述第三比值和所述第四比值,确定出所述待检测视频的第二评分。
11.在本公开的一种示例性实施例中,基于前述方案,所述待检测视频包括所述目标用户的背诵视频,所述基于所述第一评分和所述第二评分,确定出所述待检测视频的目标评分,包括:根据时间序列确定出待检测视频的语音数据对应的文本数据;将所述待检测视频的语音数据对应的文本数据和所述待检测视频对应的目标文本数据进行匹配;根据匹配成功的字符数量和所述目标文本数据对应的字符数量之间的比值,确定出所述待检测视频的第三评分;基于所述第一评分、所述第二评分和所述第三评分,确定出所述待检测视频的目标评分。
12.在本公开的一种示例性实施例中,基于前述方案,所述根据所述目标评分对所述目标用户的行为进行评价,包括:根据所述目标评分对所述目标用户的背诵情况进行评价;所述根据所述目标评分对所述目标用户的背诵情况进行评价包括:对所述目标评分进行归一化处理,以确定出所述目标评分对应的归一化分值;在所述归一化分值大于预设值时,确定所述目标用户背诵通过。
13.在本公开的一种示例性实施例中,基于前述方案,所述获取所述待检测视频对应的多个视频序列帧,包括:对所述待检测视频进行格式校验,以确定所述待检测视频是否为预设格式;在所述待检测视频为预设格式时,对所述待检测视频对应的视频文件进行校验;在所述待检测视频对应的视频文件校验通过时,获取所述待检测视频对应的多个视频序列帧。
14.在本公开的一种示例性实施例中,基于前述方案,所述对所述待检测视频对应的视频文件进行校验,包括:根据单位时长的视频文件占据的存储空间对所述待检测视频对应的视频文件进行校验;和/或根据所述待检测视频对应的二进制流的尾部格式对所述待检测视频对应的视频文件进行校验。
15.根据本公开的第二方面,提供了一种数据处理装置,包括:人脸存在情况检测模块,被配置为获取待检测视频对应的多个视频序列帧,检测每个所述视频序列帧的人脸存在情况,所述待检测视频用于表征目标用户的行为;人脸匹配和人眼状态检测模块,被配置为在检测到所述视频序列帧中存在人脸时,将所述视频序列帧中的人脸与所述待检测视频对应的目标用户的人脸进行匹配,并检测所述视频序列帧中的人眼状态;第一评分确定模块,被配置为根据多个所述视频序列帧的人脸存在情况和人脸匹配结果,确定出所述待检测视频的第一评分;第二评分确定模块,被配置为根据多个所述视频序列帧中的人眼状态,确定出所述待检测视频的第二评分;目标评分确定模块,被配置为基于所述第一评分和所述第二评分,确定出所述待检测视频的目标评分,以根据所述目标评分对所述目标用户的行为进行评价。
16.根据本公开的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中第一方面所述的数据处理方法。
17.根据本公开实施例的第四方面,提供了一种电子设备,包括:处理器;以及,存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中第一方面所述的数据处理方法。
18.由上述技术方案可知,本公开示例性实施例中的数据处理方法、数据处理装置,以
及实现所述数据处理方法的计算机可读存储介质及电子设备,至少具备以下优点和积极效果:
19.在本公开的一些实施例所提供的技术方案中,首先,获取用于表征目标用户的行为的待检测视频对应的多个视频序列帧,检测每个所述视频序列帧的人脸存在情况,在检测到所述视频序列帧中存在人脸时,将视频序列帧中的人脸与目标用户的人脸进行匹配,并检测视频序列帧中的人眼状态;然后,根据多个视频序列帧的人脸存在情况和人脸匹配结果,确定出待检测视频的第一评分,根据多个视频序列帧中的人眼状态,确定出待检测视频的第二评分;最后,基于第一评分和所述第二评分,确定出待检测视频的目标评分,根据目标评分对目标用户的行为进行评价。与相关技术相比,一方面,本公开可以基于视频对目标用户的行为进行评价,提高对目标用户进行行为评价的效率;另一方面,本公开基于对视频中的人脸存在情况、人脸匹配情况、人眼状态情况的检测,可以从多个维度对用户的行为进行评价,提高用户行为评价的准确性和合理性。
20.本公开应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
21.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
22.图1示出本公开一示例性实施例中的数据处理方法的流程示意图;
23.图2示出本公开一示例性实施例中的对待检测视频进行校验的方法的流程示意图;
24.图3示出本公开一示例性实施例中的确定第一评分的方法的流程示意图;
25.图4示出本公开一示例性实施例中的确定第二评分的方法的流程示意图;
26.图5示出本公开一示例性实施例中的确定待检测视频的目标评分的方法的流程示意图;
27.图6示一示例性实施例中的可以应用本公开的数据处理方法及数据处理装置的系统结构的示意图;
28.图7示出本公开一示例性实施例中的数据流向示意图;
29.图8示出本公开一示例性实施例中的对背诵情况进行评价的方法的流程示意图;
30.图9示出本公开一示例性实施例中的数据处理装置的结构示意图;
31.图10示出本公开示例性实施例中计算机存储介质的结构示意图;
32.图11示出本公开示例性实施例中电子设备的结构示意图。
具体实施方式
33.现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结
构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
34.本说明书中使用用语“一个”、“一”、“该”和“所述”用以表示存在一个或多个要素/组成部分/等;用语“包括”和“具有”用以表示开放式的包括在内的意思并且是指除了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等;用语“第一”和“第二”等仅作为标记使用,不是对其对象的数量限制。
35.此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。
36.在保险销售时,为了提升保险代理人的业务水平和专业能力,会对保险代理人进行销售话术的培训,在培训的过程中,需要代理人背诵固定的销售话术。
37.为了避免保险代理人的背诵情况不佳或者有些保险代理人甚至不背诵的情况发生,可以对保险代理人的背诵情况进行检查。
38.相关技术中,主要是人工对保险代理人的背诵情况进行检查和评价。显然,人工检查和评价的方式效率较低,且人工检查和评价的方式主观性较强,缺乏一定的客观性。
39.在本公开的实施例中,首先提供了一种游戏中数据处理方法,至少在一定程度上克服上述相关技术中存在的缺陷。
40.图1示出本公开一示例性实施例中的数据处理方法的流程示意图,参考图1,该方法包括:
41.步骤s110,获取待检测视频对应的多个视频序列帧,检测每个所述视频序列帧的人脸存在情况;
42.步骤s120,在检测到所述视频序列帧中存在人脸时,将所述视频序列帧中的人脸与所述待检测视频对应的目标用户的人脸进行匹配,并检测所述视频序列帧中的人眼状态;
43.步骤s130,根据多个所述视频序列帧的人脸存在情况和人脸匹配结果,确定出所述待检测视频的第一评分;
44.步骤s140,根据多个所述视频序列帧中的人眼状态,确定出所述待检测视频的第二评分;
45.步骤s150,基于所述第一评分和所述第二评分,确定出所述待检测视频的目标评分,以根据所述目标评分对所述的目标用户的行为进行评价。
46.在图1所示实施例所提供的技术方案中,首先,获取用于表征目标用户的行为的待检测视频对应的多个视频序列帧,检测每个所述视频序列帧的人脸存在情况,在检测到所述视频序列帧中存在人脸时,将视频序列帧中的人脸与目标用户的人脸进行匹配,并检测视频序列帧中的人眼状态;然后,根据多个视频序列帧的人脸存在情况和人脸匹配结果,确定出待检测视频的第一评分,根据多个视频序列帧中的人眼状态,确定出待检测视频的第二评分;最后,基于第一评分和所述第二评分,确定出待检测视频的目标评分,根据目标评
分对目标用户的行为进行评价。与相关技术相比,一方面,本公开可以基于视频对目标用户的行为进行评价,提高对目标用户进行行为评价的效率;另一方面,本公开基于对视频中的人脸存在情况、人脸匹配情况、人眼状态情况的检测,可以从多个维度对用户的行为进行评价,提高用户行为评价的准确性和合理性。
47.以下对图1所示实施例中各个步骤的具体实施方式进行详细阐述:
48.在步骤s110中,获取待检测视频对应的多个视频序列帧,检测每个所述视频序列帧的人脸存在情况。
49.在示例性的实施方式中,待检测视频用于表征目标用户的行为,其可以理解为待检测视频就是对目标用户的在某一场景下的某一行为的记录视频。例如,在考试中,待检测视频可以包括记录用户在考试过程中的考试行为的视频,即在考试场景中,待检测视频可以用于表征目标用户在考试过程中的考试行为;在背诵场景中,待检测视频可以包括用户的背诵视频,背诵视频可以用于表征用户的背诵行为。
50.在待检测视频包括用户的考试行为记录视频时,其可以包括任何的考试场合,如校园的期中、期末考试、驾驶员考试等,本示例性实施方式对此不做特殊限定。
51.在待检测视频包括用户的背诵视频时,背诵视频的内容可以根据用户需求进行自定义。例如,在保险销售场景中,背诵视频中的背诵内容可以为保险销售时的固定销售话术,在教学场景中,背诵视频可以为书本中的内容,例如,古诗词、课文等,也可以为其它的任何的背诵内容。本示例性实施方式对此不做特殊限定。
52.以待检测视频为背诵视频为例,背诵者可以通过背诵者自己的客户端自行上传背诵视频,背诵者也可以将背诵视频发送给统一的管理者,然后由管理者通过管理者的客户端上传背诵视频。
53.示例性的,在获取待检测视频对应的多个视频序列帧之前,可以先根据时间序列对待检测视频进行处理,以将待检测视频转换为视频序列帧。其中,视频序列帧可以理解为待检测视频对应的与时间序列关联的图像帧。
54.在一种示例性的实施方式中,获取待检测视频对应的多个视频序列帧可以包括基于时间序列获取待检测视频对应的每个视频序列帧。例如,待检测视频对应的视频序列帧有120个,则基于这120个视频序列帧的时间先后顺序,依次获取这120个视频序列帧。
55.在另一种示例性的实施方式中,获取待检测视频对应的多个视频序列可以包括根据预设间隔对待检测视频对应的视频序列帧进行采样,以获取待检测视频对应的多个视频序列帧。其中,预设间隔可以包括采样时的时间间隔,也可以包括采样时间隔的视频帧的数量。例如,每隔1秒采集一个视频序列帧,或者每隔3帧采集一个视频序列帧。
56.在待检测视频包括背诵视频时,还可以对待检测视频进行校验,这样,可以有效的防止背诵者进行作弊,从而保证对背诵视频评分的准确性和合理性。
57.示例性的,图2示出本公开一示例性实施例中的对待检测视频进行校验的方法的流程示意图。参考图2,该方法可以包括步骤s210至步骤s220。
58.在步骤s210中,对所述待检测视频进行格式校验,以确定所述待检测视频是否为预设格式。
59.在示例性的实施方式中,预设格式可以理解为视频文件格式,即预设格式可以包括一种或多种视频文件格式。例如,预设格式可以包括asf、wmv、rm、rmvb、mepg、avi、mpg、
mp4中的一个或多个。
60.举例而言,在用户上述待检测视频后,服务器可以自动校验用户当前上传的待检测视频的后缀名是否为上述的asf、wmv、rm、rmvb、mepg、avi、mpg、mp4中的任一个,如果是,则待检测视频的格式校验通过,如果不是,则可以向用户返回视频格式校验失败的信息,以提醒用户重新上传。
61.接下来,在步骤s220中,在所述待检测视频为预设格式时,对所述待检测视频对应的视频文件进行校验。
62.在一种示例性的实施方式中,对待检测视频对应的视频文件进行校验包括:根据单位时长的视频文件占据的存储空间对所述待检测视频对应的视频文件进行校验。
63.举例而言,由于标准的单位时长的视频文件,即时长为1秒的视频文件所占的存储空间为64k,所以可以根据单位时长的视频文件占据的标准存储空间64k对待检测视频对应的视频文件进行校验。以待检测视频对应的视频文件a的时长为1分钟为例,可以将视频文件a所占的存储空间值除以60秒,得到单位时长的视频a所占的存储空间值x,如果x小于64k,则可以确定视频文件a校验不通过,否则,可以确定视频文件a校验通过。
64.在另一种示例性的实施方式中,对待检测视频对应的视频文件进行校验包括:根据所述待检测视频对应的二进制流的尾部格式对所述待检测视频对应的视频文件进行校验。
65.举例而言,由于待检测视频是通过二进制流传输到服务器端的,而视频文件对应的二进制流的尾部格式为'\\xff\\xd9'格式或者'aeb`\\x82'格式。所以,所以服务器在接收待检测视频对应的二进制流时,可以校验二进制流的尾部格式是否为'\\xff\\xd9'格式或者'aeb`\\x82'格式,对待检测视频对应的视频文件进行校验,以确定待检测视频对应的视频文件是否正确。如果二进制流的尾部格式为'\\xff\\xd9'格式或者'aeb`\\x82'格式,则待检测视频对应的视频文件的校验通过,可以继续执行后续的流程,否则,校验不通过,并向用户返回视频文件校验失败的消息。
66.通过上述的步骤s210至步骤s220,在待检测视频的格式校验通过后,还进一步校验待检测视频对应的视频文件本身是否正确。这样,可以进一步有效的防止用户的作弊行为。例如,对于用户将一个txt格式的文本文件改了后缀名之后变成mp4格式的视频文件的情况,如果仅进行格式校验,则会误将其校验通过,所以,通过对待检测视频对应的视频文件本身进行进一步的校验,可以有效防止此类情况的发生,进而提高基于视频对用户行为进行评价的方式的可靠性和真实性。
67.示例性的,在待检测视频格式校验和待检测视频对应的视频文件的正确性校验都通过时,可以获取所述待检测视频对应的多个视频序列帧,以继续执行后续的过程。当然,为了提高处理效率,也可以将待检测视频的格式校验过程和待检测视频对应的视频文件的正确性校验的过程通过异步处理器并行的方式同步执行,任何一个过程校验不通过,都可以直接中止评分,还可以同时对应的向用户返回中止评分的原因。本示例性实施方式对此不做特殊限定。
68.示例性的,获取待检测视频对应的多个视频序列帧后,针对每个视频序列帧,可以检测其人脸存在情况,即,检测每个视频序列帧中是否存在人脸。其中,检测视频序列帧中是否存在人脸的方式可以参考现有技术中的任一种人脸检测方法,本示例性实施方式对此
不做特殊限定。
69.接下来,在步骤s120中,在检测到所述视频序列帧中存在人脸时,将所述视频序列帧中的人脸与所述待检测视频对应的目标用户的人脸进行匹配,并检测所述视频序列帧中的人眼状态。
70.在示例性的实施方式中,目标用户可以包括与待检测视频所表征的行为关联的用户,例如,在考试行为评价场景中,待检测视频表征的是用户a的考试行为,那么目标用户就行是用户a。在背诵行为评价场景中,待检测视频对应的目标用户的人脸可以理解为背诵视频对应的背诵者的人脸。可以根据目标用户的用户标识从数据库中获取目标用户的人脸。
71.待检测视频可以由目标用户通过自己的客户端进行上传,也可以由管理者通过自己的客户端进行上传。
72.以待检测视频为背诵视频为例,在背诵者自行上传背诵视频的场景下,可以根据背诵视频的上传者对应的用户标识在数据库中获取背诵者的人脸注册图像,将背诵者的人脸注册图像中的人脸确定为待检测背诵视频对应的目标用户的人脸。在由管理者统一上传背诵视频的场景下,管理者可以为每个背诵视频配置背诵者标识,根据管理者配置的背诵者标识在数据库中获取背诵者的人脸注册图像,将背诵者的人脸注册图像确定为待检测背诵视频对应的目标用户的人脸。
73.其中,背诵者标识可以包括背诵者的姓名、身份证号、编号等。数据库中会预先将每个使用者的姓名、身份证号、编号和其对应的人脸图像、人脸特征等信息进行关联存储,根据背诵者唯一标识可以唯一的获取到该背诵者对应的人脸图像。
74.示例性的,将视频序列帧中的人脸与待检测视频对应的目标用户的人脸进行匹配的具体实施方式可以是,提取视频序列帧中的第一人脸特征和待检测视频对应的目标用户的人脸的第二人脸特征,计算第一人脸特征和第二人脸特征之间的相似度,在相似度大于第一预设值时,确定匹配成功,否则,确定二者匹配失败。
75.其中,进行人脸特征提取的方式可以为现有的任一种图像特征提取方式,本示例性实施方式对此不做特殊限定。
76.示例性的,在检测到视频序列帧中存在人脸时,还可以进一步检测视频序列帧存在的人脸对应的人眼状态。其中,人眼状态可以包括睁眼状态和闭眼状态。对于任一视频序列帧而言,其对应的人眼状态要么为睁眼状态,要么为闭眼状态。
77.接下来,在步骤s130中,根据多个所述视频序列帧的人脸存在情况和人脸匹配结果,确定出所述待检测视频的第一评分。
78.示例性的,在对多个视频序列帧的人脸存在情况和人脸匹配结果进行检测后,可以根据多个视频序列帧的人脸存在情况和人脸匹配结果确定待检测视频的第一评分。图3示出本公开一示例性实施例中的确定第一评分的方法的流程示意图。参考图3,该方法可以包括步骤s310至步骤s330。
79.在步骤s310中,确定存在人脸的视频序列帧的数量和所述多个视频序列帧的数量之间的第一比值。
80.示例性的,在获取待检测视频对应的多个视频序列帧的方式为基于时间序列依次获取待检测视频对应的每个视频序列帧时,可以根据待检测视频的帧率和时长确定出多个视频序列帧的数量。例如,待检测视频的时长为1分钟,待检测视频的帧率为每秒24帧,则多
个视频序列帧的数量为1440帧。
81.示例性的,在基于采样的方式获取待检测视频对应的多个视频序列帧时,可以鞥见待检测视频的帧率、时长和采样频率,确定出多个视频序列帧的数量。例如,待检测视频的时长为1分钟,待检测视频的帧率为每秒24帧,采样频率为每隔1秒采集1帧,则多个视频序列帧的数量为720帧。
82.在确定所获取的待处理视频对应的多个视频序列帧的数量后,可以确定出待处理视频对应的多个视频序列帧中存在人脸的视频序列帧的数量和多个视频序列帧的数量之间的第一比值。
83.接下来,在步骤s320中,确定人脸匹配结果为成功的视频序列帧的数量和所述多个视频序列帧的数量之间的第二比值。
84.示例性的,步骤s320中的多个视频序列帧的数量的确定方式和上述的步骤s310中多个视频序列帧的数量的确定方式完全相同,此处不再进行赘述。
85.同样的,可以在步骤s320中确定多个视频序列帧中人脸匹配结果为成功的视频序列帧的数量和多个视频序列帧的数量之间的第二比值。
86.确定出第一比值和第二比值后,在步骤s330中,根据所述第一比值和所述第二比值,确定出所述待检测视频的第一评分。
87.示例性的,步骤s330的具体实施方式可以是,将第一比值和第二比值之和的一半确定为所述待检测视频的第一评分。
88.举例而言,可以通过如下公式(1)根据多个视频序列帧中的人脸存在情况和人脸匹配结果,确定出待检测视频的第一评分。
[0089][0090]
在式(1)中,∑frame表示多个视频序列帧的总数量、∑face_existed_frame表示多个视频序列帧中存在人脸的视频序列帧的总数量、∑face_match_frame表示多个视频序列帧中人脸匹配成功的视频序列帧的总数量。
[0091]
示例性的,如果多个视频序列帧中存在人脸的视频序列帧的数量小于第二预设值,则可以不用确定第一评分,而是直接向用户返回人脸校验失败的相关信息。同样的,如果多个视频序列帧中人脸匹配成功的视频序列帧的数量小于第三预设值,也可以不用确定第一评分,而是直接向用户返回人脸校验识别的相关信息。其中,预设值可以根据需求进行自定义,第二预设值和第三预设值都小于或等于多个视频序列帧的总数量,第二预设值和第三预设值的具体数值可以根据需求进行自定义。
[0092]
例如,如果多个视频序列帧中的每个视频序列帧都没有人脸,则证明此视频不符合要求,此时可以结束流程并给用户返回人脸校验失败的相关信息,否则,可以记录每一帧的人脸存在情况并确定检测出的人脸是否为背诵者的人脸,如果检测出的人脸为背诵者的人脸的视频序列帧的数量满足预设条件,则可以基于上述的公式(1)根据检测出的人脸存在情况和人脸匹配情况确定出第一评分。
[0093]
接下来,在步骤s140中,根据多个所述视频序列帧中的人眼状态,确定出所述待检
测视频的第二评分。
[0094]
示例性的,还可以根据上述的步骤s120中检测出的多个视频序列帧的人眼状态,确定出待检测视频的第二评分。图4示出本公开一示例性实施例中的确定第二评分的方法的流程示意图。参考图4,该方法可以包括步骤s410至步骤s430。其中:在步骤s410中,确定人眼状态为闭眼时的视频序列帧的数量和所述多个视频序列帧的数量之间的第三比值;在步骤s420中,确定人眼状态为睁眼时的视频序列帧的数量和所述多个视频序列帧的数量之间的第四比值;在步骤s430中,根据所述第三比值和所述第四比值,确定出所述待检测视频的第二评分。
[0095]
在示例性的实施方式中,上述的步骤s410和步骤s420中的多个视频序列帧的数量的确定方式都可以参考上述的步骤s310中的多个视频序列帧的数量的确定方式,此处不再进行赘述。
[0096]
示例性的,在待检测视频为背诵视频时,步骤s430的具体实施方式可以是:计算第三比值减去第四比值的差值,将该差值确定为所述待检测视频的第二评分。
[0097]
举例而言,在待检测视频包括背诵视频时,可以基于如下的公式(2)根据多个视频序列帧的人眼状态确定出待检测视频的第二评分。
[0098][0099]
在式(2)中,∑frame表示多个视频序列帧的总数量、∑close_eye_frame表示多个视频序列帧中人眼状态为闭眼状态的视频序列帧的总数量、∑open_eye_frame表示多个视频序列帧中人眼状态为睁眼状态的视频序列帧的总数量。
[0100]
示例性的,在待检测视频包括背诵视频时,如果多个视频序列帧中的人眼状态为睁眼状态的视频序列帧的数量超过第四预设值,则可以认为当然背诵视频中的背诵者的背诵情况存疑,存在作弊的可能性,则可以直接中止评分,并向用户返回人眼状态校验不通过的相关信息,否则,则可以根据上述的公式(2)确定出待检测视频的第二评分。
[0101]
接下来,继续参考图1,在步骤s150中,基于所述第一评分和所述第二评分,确定出所述待检测视频的目标评分,以根据所述目标评分对所述目标用户的行为进行评价。
[0102]
示例性的,如前所述,待检测视频可以包括背诵视频或考试记录视频,所以,根据目标评分对目标用户的行为进行评价可以包括根据目标评分对目标用户的背诵情况进行评价,也可以包括根据目标评分对目标用户的考试行为进行评价。当然,也可以根据记录目标用户的其他行为的视频,基于目标评分对目标用户的其他行为进行评价,本示例性实施方式对此不做特殊限定。
[0103]
在待检测视频包括考试记录视频时,可以直接根据第一评分和第二评分之和确定出目标评分,然后根据目标评分对用户的考试行为进行评价。
[0104]
在待检测视频包括背诵视频时,待检测视频可以包括图像数据和音频数据,其中,图像数据可以理解为上述的视频序列帧,基于待检测视频中的图像数据可以确定出上述的第一评分和第二评分。此外,还可以基于待检测视频的音频数据,确定出第三评分,第三评分可以用于检查或评价背诵者对背诵内容的背诵的熟练程度。这样,可以从多个维度确定出背诵视频的目标评分,提高背诵视频评分的准确性和可靠性。
[0105]
示例性的,图5示出本公开一示例性实施例中的确定待检测视频的目标评分的方法的流程示意图。参考图5,该方法可以包括步骤s510至步骤s540。
[0106]
在步骤s510中,根据时间序列确定出待检测视频的语音数据对应的文本数据。
[0107]
在示例性的实施方式中,可以根据时间序列将待检测视频的语音数据转换为其对应的文本数据。
[0108]
示例性的,还可以对待检测视频的语音数据进行校验。具体的,可以根据所使用的音频转语音技术所能够识别的采样率对待检测视频的语音数据进行校验,从而使得用户上述的待检测视频中的音频可以被系统准确的转换成语音。以所使用的音频转语音技术的采样率为8k为例,可以校验待检测视频的语音数据对应的采样率是否为8k。如果是8k,则校验通过,可以继续后续的处理流程,如果不是8k,则可以向用户返回语音识别失败的消息。
[0109]
接下来,在步骤s520中,将所述待检测视频的语音数据对应的文本数据和所述待检测视频对应的目标文本数据进行匹配。
[0110]
示例性的,可以依次将待检测视频的语音数据对应的文本数据中的字符和待检测视频对应的目标文本数据中的字符按照顺序进行字符匹配。其中,待检测视频对应的目标文本数据可以理解为背诵视频对应的正确的背诵内容对应的文本数据。
[0111]
在步骤s530中,根据匹配成功的字符数量和所述目标文本数据对应的字符数量之间的比值,确定出所述待检测视频的第三评分。
[0112]
举例而言,可以根据如下公式(3)确定出待检测视频的第三评分。
[0113]
score_speech=∑speech_match/∑speech_standard
ꢀꢀ
(3)
[0114]
在式(3)中,score_speech表示第三评分、∑speech_match表示匹配成功的字符数量、∑speech_standard表示目标文本数据对应的字符数量。
[0115]
继续参考图5,在步骤s540中,基于所述第一评分、所述第二评分和所述第三评分,确定出所述待检测视频的目标评分。
[0116]
在示例性的实施方式中,可以根据第一评分、第二评分和第三评分之和确定出待检测视频的目标评分。
[0117]
以待检测视频包括背诵视频为例,确定出目标评分后,可以根据目标评分对目标用户的背诵情况进行评价。
[0118]
示例性的,根据目标评分对所述目标用户的背诵情况进行评价可以包括:对所述目标评分进行归一化处理,以确定出所述目标评分对应的归一化分值;在所述归一化分值大于预设值时,确定所述目标用户背诵通过。
[0119]
其中,预设值大于0且小于1,具体可以根据需求进行自定义,如果需要对用户的行为进行严格的评价,则可以选择0至1之间的一个较大值,将其确定为预设值,本示例性实施方式对此不做特殊限定。
[0120]
示例性的,可以利用反正切函数对目标评分进行归一化处理,以将目标评分映射在0至1之间。
[0121]
在一种示例性的实施方式中,可以通过如下公式(4)基于反正切函数对目标评分进行归一化处理,以确定出目标评分对应的归一化分值。
[0122][0123]
在公式(4)中,score_face为上述的第一评分、score_speech为上述的第三评分、score_blink_close_eye-score_blink_open_eye为上述的第二评分、score为上述的目标评分对应的归一化分值、atan表示上述的反正切函数、atan(1)表示将1作为反正切函数的输入得到的函数值。
[0124]
需要说明的是,发明人在实践中发现如果在公式(4)中不对目标评分除以4,则公式(4)中的归一化分值存在大于1的情况,这显然不符合归一化处理的目的,而对公式(4)中的目标评分除以4之后,则可以避免这种情况的发生。
[0125]
在另一种示例性的实施方式中,还可以通过如下公式(5)基于反正切函数对目标评分进行归一化处理,以确定出目标评分对应的归一化分值。
[0126][0127]
在公式(5)中,score_face为上述的第一评分、score_speech为上述的第三评分、score_blink_close_eye-score_blink_open_eye为上述的第二评分、score为上述的目标评分对应的归一化分值、atan表示上述的反正切函数。
[0128]
进一步的,图6示一示例性实施例中的可以应用本公开的数据处理方法及数据处理装置的系统结构的示意图。
[0129]
如图6所示,系统架构600可以包括终端设备601、602、603中的一个或多个,网络604和服务器605。网络604用以在终端设备601、602、603和服务器605之间提供通信链路的介质。网络604可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备601、602、603可以是具有显示屏的各种电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。
[0130]
应该理解,图6中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器605可以是多个服务器组成的服务器集群等。
[0131]
本公开实施例所提供的数据处理方法可以由终端设备601、602、603执行,相应地,数据处理装置可以设置于终端设备601、602、603中。本公开实施例所提供的数据处理方法也可以由服务器605执行,相应地,数据处理装置可以设置于服务器605中。本公开实施例所提供的数据处理方法还可以由终端设备601、602、603与服务器605共同执行,相应地,数据处理装置可以设置于终端设备601、602、603与服务器605中,本示例性实施例中对此不做特殊限定。
[0132]
举例而言,可以通过终端设备601、602、603上传待检测视频,然后通过网络604,将待检测视频传输至服务器605中。其中,服务器605可以为异步并行式的工作方式,从而可以基于待检测视频同步检测人脸存在情况、人脸匹配情况、文本数据字符匹配情况、人眼状态,当有任一个类型检测不通过时,则会中止,同时可以向对应的终端设备返回评分失败、请重新上传视频的消息,否则,服务器605可以根据检测情况,基于上述的图1所示的方法得到待检测视频的目标分值或者目标分值对应的归一化分值,并将其发送至对应的终端设备601、602、603中。
[0133]
其中,当进行人脸匹配时,可以通过redis(remote dictionary server,远程字典服务)缓存606先从存储用户新的数据库607中获取待检测视频对应的用户的注册图像,然后,服务器605再从redis缓存606中获取用户的注册图像,以完成人脸匹配识别的过程和匹配成功的视频序列帧的数量的统计。
[0134]
接下来,以待检测视频为保险代理人的背诵视频为例,图7示出本公开一示例性实施例中的数据流向示意图。参考图7,数据流向过程为:保险代理人71拍摄背诵视频,然后得到待检测视频72,保险代理人可以将待检测视频72传入到客户端的应用程序中,接下来,在73中,待检测视频传入后监听启动服务,在74中,待检测视频流入服务器,在75中,在服务器中计算待检测视频的评分;在76中,将待检测视频的评分返回至客户端的应用程序。然后,代理人71可以通过客户端的应用程序查看评分结果。
[0135]
进一步的,图8示出本公开一示例性实施例中的对背诵情况进行评价的方法的流程示意图。参考图8,该方法可以包括步骤s801至步骤s813。
[0136]
在步骤s801中,获取客户端上传的背诵视频;
[0137]
在步骤s802中,校验背诵视频的格式是否正确;如果正确,则执行步骤s803,否则,执行步骤s813;
[0138]
在步骤s803中,检测背诵视频的多个视频序列帧的人脸存在情况和人脸匹配情况是否满足第一预设条件,如果是,则转至步骤s804,如果,否则执行步骤s813;
[0139]
在步骤s804中,根据多个视频序列帧的人脸存在情况和人脸匹配情况,确定出人脸检测评分;
[0140]
在步骤s805中,检测背诵视频中的语音是否为预设格式,如果是,则执行步骤s806,如果否,则执行步骤s813;
[0141]
在步骤s806中,将背诵视频对应的语音数据转换为文本数据,并将该文本数据和标准文本数据进行字符匹配;
[0142]
在步骤s807中,判断匹配成功的字符数量是否满足第二预设条件,如果是,则执行步骤s808,如果否,则执行步骤s813;
[0143]
在步骤s808中,根据字符匹配情况,确定出背诵视频的文本匹配评分;
[0144]
在步骤s809中,检测背诵者的人眼状态是否满足第三预设条件,如果是,则转至步骤s810,如果否,则转至步骤s813;
[0145]
在步骤s810中,根据背诵者的人眼状态检测结果,确定出背诵视频的人眼眨眼评分;
[0146]
在步骤s811中,根据人脸检测评分、文本匹配评分、人眼眨眼评分确定出背诵视频的目标评分;
[0147]
在步骤s812中,向客户端返回背诵视频的目标评分;
[0148]
在步骤s813中,向客户端返回评分失败、请重新上传背诵视频的消息。
[0149]
其中,步骤s804中的人脸检测评分的确定方法可以参考上述的图3所示的第一评分的确定方法,步骤s808中的文本匹配评分的确定方法可以参考上述的图5中提及的第三评分的确定方法,步骤s810中的人眼眨眼评分的确定方法可以参考上述的图4中的第二评分的确定方法,此处不再进行赘述。
[0150]
示例性的,步骤s803中的第一预设条件可以理解为存在人脸且人脸匹配成功的视
频序列帧的数量是否大于预设值,步骤s807中的第二预设条件可以理解为匹配成功的字符数量是否大于预设值,步骤s809中的第三预设条件可以理解为背诵者的人眼状态为闭眼状态的视频序列帧的数量是否大于预设值。
[0151]
在本公开中,服务器可以采用异步并行式的处理方式,以对检测人脸存在情况和人脸匹配情况、检测语音对应的文本数据的匹配情况、检测人的睁眼闭眼情况的各个步骤都可以同步进行,从而提升处理效率。这些检测类型中,只要有一个不满足其对应的预设条件,都可以直接返回评分识别的消息。
[0152]
在本公开中,通过多个维度对表征用户行为的待检测视频进行评价,基于量化的评价指标,在保证对用户行为进行评分的可靠性和真实性的同时,提高了对用户行为进行评分的客观性和准确性,同时还提高了对用户行为进行评分的效率。
[0153]
本领域技术人员可以理解实现上述实施方式的全部或部分步骤被实现为由cpu执行的计算机程序。在该计算机程序被cpu执行时,执行本发明提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。
[0154]
此外,需要注意的是,上述附图仅是根据本发明示例性实施方式的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
[0155]
图9示出本公开示例性实施例中数据处理装置的结构示意图。参考图9,该装置900可以包括人脸存在情况检测模块910、人脸匹配和人眼状态检测模块920、第一评分模块930、第二评分模块940以及目标评分确定模块950。
[0156]
人脸存在情况检测模块910,被配置为获取待检测视频对应的多个视频序列帧,检测每个所述视频序列帧的人脸存在情况,所述待检测视频用于表征目标用户的行为;
[0157]
人脸匹配和人眼状态检测模块920,被配置为在检测到所述视频序列帧中存在人脸时,将所述视频序列帧中的人脸与所述待检测视频对应的目标用户的人脸进行匹配,并检测所述视频序列帧中的人眼状态;
[0158]
第一评分确定模块930,被配置为根据多个所述视频序列帧的人脸存在情况和人脸匹配结果,确定出所述待检测视频的第一评分;
[0159]
第二评分确定模块940,被配置为根据多个所述视频序列帧中的人眼状态,确定出所述待检测视频的第二评分;
[0160]
目标评分确定模块950,被配置为基于所述第一评分和所述第二评分,确定出所述待检测视频的目标评分,以根据所述目标评分对所述目标用户的行为进行评价。
[0161]
在一些示例性的实施方式中,基于前述实施例,上述的第一评分确定模块930可以被具体配置为:确定存在人脸的视频序列帧的数量和所述多个视频序列帧的数量之间的第一比值;确定人脸匹配结果为成功的视频序列帧的数量和所述多个视频序列帧的数量之间的第二比值;根据所述第一比值和所述第二比值,确定出所述待检测视频的第一评分。
[0162]
在一些示例性的实施方式中,基于前述实施例,上述的第二评分确定模块940可以被具体配置为:确定人眼状态为闭眼时的视频序列帧的数量和所述多个视频序列帧的数量之间的第三比值;确定人眼状态为睁眼时的视频序列帧的数量和所述多个视频序列帧的数
量之间的第四比值;根据所述第三比值和所述第四比值,确定出所述待检测视频的第二评分。
[0163]
在一些示例性的实施方式中,基于前述实施例,上述的目标评分确定模块950可以被具体配置为:根据时间序列确定出待检测视频的语音数据对应的文本数据;将所述待检测视频的语音数据对应的文本数据和所述待检测视频对应的目标文本数据进行匹配;根据匹配成功的字符数量和所述目标文本数据对应的字符数量之间的比值,确定出所述待检测视频的第三评分;基于所述第一评分、所述第二评分和所述第三评分,确定出所述待检测视频的目标评分。
[0164]
在一些示例性的实施方式中,基于前述实施例,上述的目标评分模块950可以被具体配为:根据所述目标评分对所述目标用户的背诵情况进行评价;所述根据所述目标评分对所述目标用户的背诵情况进行评价包括:对所述目标评分进行归一化处理,以确定出所述目标评分对应的归一化分值;在所述归一化分值大于预设值时,确定所述目标用户背诵通过。
[0165]
在一些示例性的实施方式中,基于前述实施例,上述的人脸存在情况检测模块910可以被具体配置为对所述待检测视频进行格式校验,以确定所述待检测视频是否为预设格式;在所述待检测视频为预设格式时,对所述待检测视频对应的视频文件进行校验;在所述待检测视频对应的视频文件校验通过时,获取所述待检测视频对应的多个视频序列帧。
[0166]
在一些示例性的实施方式中,基于前述实施例,所述对所述待检测视频对应的视频文件进行校验,包括:根据单位时长的视频文件占据的存储空间对所述待检测视频对应的视频文件进行校验;和/或根据所述待检测视频对应的二进制流的尾部格式对所述待检测视频对应的视频文件进行校验。
[0167]
上述数据处理装置中各单元的具体细节已经在对应的数据处理方法中进行了详细的描述,因此此处不再赘述。
[0168]
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
[0169]
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
[0170]
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
[0171]
在本公开示例性实施方式中,还提供了一种能够实现上述方法的计算机存储介质。其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本公开的
各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
[0172]
参考图10所示,描述了根据本公开的实施方式的用于实现上述方法的程序产品1100,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0173]
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0174]
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0175]
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
[0176]
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0177]
此外,在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
[0178]
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
[0179]
下面参照图11来描述根据本公开的这种实施方式的电子设备800。图11显示的电子设备1100仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0180]
如图11所示,电子设备1100以通用计算设备的形式表现。电子设备1100的组件可以包括但不限于:上述至少一个处理单元1110、上述至少一个存储单元1120、连接不同系统组件(包括存储单元1120和处理单元1110)的总线1130以及显示单元1140。
[0181]
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元1110执行,使得所述处理单元1110执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,所述处理单元1110可以执行如图1至图5以及图8中所示的各个步骤。
[0182]
存储单元1120可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)11201和/或高速缓存存储单元11202,还可以进一步包括只读存储单元(rom)11203。
[0183]
存储单元1120还可以包括具有一组(至少一个)程序模块11205的程序/实用工具11204,这样的程序模块11205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0184]
总线1130可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
[0185]
电子设备1100也可以与一个或多个外部设备1200(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1100交互的设备通信,和/或与使得该电子设备1100能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口1150进行。并且,电子设备1100还可以通过网络适配器1160与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器1160通过总线1130与电子设备1100的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1100使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0186]
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
[0187]
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
[0188]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
技术特征:
1.一种数据处理方法,其特征在于,包括:获取待检测视频对应的多个视频序列帧,检测每个所述视频序列帧的人脸存在情况,所述待检测视频用于表征目标用户的行为;在检测到所述视频序列帧中存在人脸时,将所述视频序列帧中的人脸与所述待检测视频对应的目标用户的人脸进行匹配,并检测所述视频序列帧中的人眼状态;根据多个所述视频序列帧的人脸存在情况和人脸匹配结果,确定出所述待检测视频的第一评分;根据多个所述视频序列帧中的人眼状态,确定出所述待检测视频的第二评分;基于所述第一评分和所述第二评分,确定出所述待检测视频的目标评分,以根据所述目标评分对所述目标用户的行为进行评价。2.根据权利要求1所述的数据处理方法,其特征在于,所述根据多个所述视频序列帧的人脸存在情况和人脸匹配结果,确定出所述待检测视频的第一评分,包括:确定存在人脸的视频序列帧的数量和所述多个视频序列帧的数量之间的第一比值;确定人脸匹配结果为成功的视频序列帧的数量和所述多个视频序列帧的数量之间的第二比值;根据所述第一比值和所述第二比值,确定出所述待检测视频的第一评分。3.根据权利要求1所述的数据处理方法,其特征在于,所述根据多个所述视频序列帧中的人眼状态,确定出所述待检测视频的第二评分,包括:确定人眼状态为闭眼时的视频序列帧的数量和所述多个视频序列帧的数量之间的第三比值;确定人眼状态为睁眼时的视频序列帧的数量和所述多个视频序列帧的数量之间的第四比值;根据所述第三比值和所述第四比值,确定出所述待检测视频的第二评分。4.根据权利要求1所述的数据处理方法,其特征在于,所述待检测视频包括所述目标用户的背诵视频,所述基于所述第一评分和所述第二评分,确定出所述待检测视频的目标评分,包括:根据时间序列确定出待检测视频的语音数据对应的文本数据;将所述待检测视频的语音数据对应的文本数据和所述待检测视频对应的目标文本数据进行匹配;根据匹配成功的字符数量和所述目标文本数据对应的字符数量之间的比值,确定出所述待检测视频的第三评分;基于所述第一评分、所述第二评分和所述第三评分,确定出所述待检测视频的目标评分。5.根据权利要求4所述的数据处理方法,其特征在于,所述根据所述目标评分对所述目标用户的行为进行评价,包括:根据所述目标评分对所述目标用户的背诵情况进行评价;所述根据所述目标评分对所述目标用户的背诵情况进行评价包括:对所述目标评分进行归一化处理,以确定出所述目标评分对应的归一化分值;在所述归一化分值大于预设值时,确定所述目标用户背诵通过。
6.根据权利要求1至5中任一项所述的数据处理方法,其特征在于,所述获取所述待检测视频对应的多个视频序列帧,包括:对所述待检测视频进行格式校验,以确定所述待检测视频是否为预设格式;在所述待检测视频为预设格式时,对所述待检测视频对应的视频文件进行校验;在所述待检测视频对应的视频文件校验通过时,获取所述待检测视频对应的多个视频序列帧。7.根据权利要求6所述的数据处理方法,其特征在于,所述对所述待检测视频对应的视频文件进行校验,包括:根据单位时长的视频文件占据的存储空间对所述待检测视频对应的视频文件进行校验;和/或根据所述待检测视频对应的二进制流的尾部格式对所述待检测视频对应的视频文件进行校验。8.一种数据处理装置,其特征在于,包括:人脸存在情况检测模块,被配置为获取待检测视频对应的多个视频序列帧,检测每个所述视频序列帧的人脸存在情况,所述待检测视频用于表征目标用户的行为;人脸匹配和人眼状态检测模块,被配置为在检测到所述视频序列帧中存在人脸时,将所述视频序列帧中的人脸与所述待检测视频对应的目标用户的人脸进行匹配,并检测所述视频序列帧中的人眼状态;第一评分确定模块,被配置为根据多个所述视频序列帧的人脸存在情况和人脸匹配结果,确定出所述待检测视频的第一评分;第二评分确定模块,被配置为根据多个所述视频序列帧中的人眼状态,确定出所述待检测视频的第二评分;目标评分确定模块,被配置为基于所述第一评分和所述第二评分,确定出所述待检测视频的目标评分,以根据所述目标评分对所述目标用户的行为进行评价。9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述的数据处理方法。10.一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的数据处理方法。
技术总结
本公开涉及计算机技术领域,提供了一种数据处理方法及装置、计算机可读存储介质和电子设备。其中,上述方法包括:获取待检测视频对应的多个视频序列帧,检测每个所述视频序列帧的人脸存在情况;在检测到视频序列帧中存在人脸时,将视频序列帧中的人脸与目标用户的人脸进行匹配,并检测视频序列帧中的人眼状态;根据多个视频序列帧的人脸存在情况和人脸匹配结果,确定待检测视频的第一评分;根据多个视频序列帧中的人眼状态,确定出待检测视频的第二评分;基于第一评分和所述第二评分,确定出待检测视频的目标评分,以根据目标评分对目标用户进行评价。本方案能基于视频数据对目标用户的行为进行评价,提高对用户行为评价的效率。提高对用户行为评价的效率。提高对用户行为评价的效率。
技术研发人员:李耀高 丁宁 倪旻
受保护的技术使用者:泰康人寿保险有限责任公司
技术研发日:2021.11.30
技术公布日:2022/3/8