确定目标物品的方法、装置、设备及介质与流程

专利查询11月前  77



1.本发明实施例涉及计算机技术领域,尤其涉及一种确定目标物品的方法、装置、设备及介质。


背景技术:

2.目前,为了对某个物品进行日后规划,通常采取的措施是确定与该物品相似的相似物品,并将相似物品的处理量数据作为该物品的参照依据。
3.在确定该物品的相似物品时,经常采用的方式为:基于pearson相关系数确定两个物品之间的相似度,可选的,确定两个物品的出货时间序列,并确定与时间序列对应的多维向量,通过计算两个多维向量的协方差和它们各自方差的比值,得到一个相关性系数,基于相关性系数来确定两位物品之间的相似度,可选的,如果系数值接近1时表征两个物品之间的相似度较高,系数值接近0时表示两个物品之间没有明显相关性,系数值接近-1时表示两者负相关性很高。还可以是:基于欧式距离确定相似物品。对于一条处理量时间序列,可以将每个时间点的处理量按顺序构成欧几里得空间中的一个点,计算两点间差的平方和后再开方得到最终的距离值,该距离越小说明两销量序列间越相似。
4.发明人在基于上述方式实施本技术方案时,发现存在如下问题:
5.上述相似品的确定方式多是在时间同期、等长的条件下确定的,如果不符合上述条件,则无法确定两个物品之间的相似度,进而无法进行规划指导。进一步的,确定相似品时,多是基于物品属性特征来确定,但属性特征相似只能表征两个物品的相似度很高,不能表征可以将该相似物品的数据作为当前物品后续数据的参考依据,从而导致无法进行有效规划的问题。


技术实现要素:

6.本发明提供一种确定目标物品的方法、装置、电子设备及存储介质,以实现准确的确定出待匹配物品的指导已处理属性信息,进而基于指导已处理属性信息对待匹配物品进行有效指导的技术效果。
7.第一方面,本发明实施例提供了一种确定目标物品的方法,该方法包括:
8.确定与待匹配物品相对应的目标源域数据集;其中,所述源域数据集中包括各待选择物品的第一出货量信息;
9.根据所述待匹配物品的目标类型以及与所述目标类型相对应的目标数据处理方式,对所述待匹配物品的第二出货量信息和各第一出货量信息进行处理,确定所述待匹配物品与各待选择物品的距离值;
10.根据各距离值,确定与所述待匹配物品相对应的目标待选择物品,并将所述目标待选择物品的第一出货量信息作为所述待匹配物品的指导已处理属性信息。
11.第二方面,本发明实施例还提供了一种确定目标物品的装置,该装置包括:
12.目标源域数据集确定模块,用于确定与待匹配物品相对应的目标源域数据集;其
中,所述源域数据集中包括各待选择物品的第一出货量信息;
13.距离值确定模块,用于根据所述待匹配物品的目标类型以及与所述目标类型相对应的目标数据处理方式,对所述待匹配物品的第二出货量信息和各第一出货量信息进行处理,确定所述待匹配物品与各待选择物品的距离值;
14.目标物品确定模块,用于根据各距离值,确定与所述待匹配物品相对应的目标待选择物品,并将所述目标待选择物品的第一出货量信息作为所述待匹配物品的指导已处理属性信息。
15.第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
16.一个或多个处理器;
17.存储装置,用于存储一个或多个程序,
18.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例任一所述的确定目标物品的方法。
19.第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明实施例任一所述的确定目标物品的方法。
20.本发明实施例的技术方案,通过确定与待匹配物品相对应的目标源域数据集,并根据待匹配物品的目标类型以及与目标类型相对应的数据处理方式,对待匹配物品的已处理属性信息和目标源域数据集中的各个第一出货量信息进行匹配处理,可以得到各待选择物品与待匹配物品之间的距离值,由于第一出货量信息和第二出货量信息中均是时间序列和相应的处理量信息,因此在将距离值小于预设距离阈值的待选择物品作为目标待选择物品时,可以将目标待选择物品的第一出货量信息作为待匹配物品的后续规划依据,实现了根据各个物品的销售时间序列确定目标待选择物品,提高确定出的目标待选择物品与待匹配物品之间的处理量相似度,进而在将目标待选择物品的已处理属性信息作为后续规划依据时,提高了对待匹配物品的规划精度和准确度。
附图说明
21.为了更加清楚地说明本发明示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本发明所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。
22.图1为本发明实施例一所提供的一种确定目标物品的方法流程示意图;
23.图2为本发明实施例二所提供的一种确定目标物品的方法流程示意图;
24.图3为本发明实施例三所提供的一种确定目标物品的方法流程示意图;
25.图4为本发明实施例四所提供的一种确定目标物品的方法流程示意图;
26.图5为本发明实施例四所提供的第一出货量信息中包括峰值处理量的示意图;
27.图6为本发明实施例四所提供的将第一出货量信息中去除峰值处理量的示意图;
28.图7为本发明实施例五所提供的一种确定目标物品的方法流程示意图;
29.图8为本发明实施例六所提供的一种确定目标物品的装置结构示意图;
30.图9为本发明实施例七所提供的一种电子设备结构示意图。
具体实施方式
31.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
32.实施例一
33.图1为本发明实施例一所提供的一种确定目标物品的方法流程示意图,本实施例可适用于根据各物品的已处理属性信息,确定与当前物品相对应的目标物品,并将目标物品的已处理属性信息作为当前物品的指导已处理属性信息,以基于指导已处理属性信息对当前物品进行指导处理,即后续规划处理,该方法可以有确定目标物品的装置来执行,该装置可以通过软件和/或硬件的形式实现,硬件可以是电子设备,如,移动终端或pc端等。
34.在介绍本发明实施例的技术方案之前,可以先对应用场景进行示例性说明。相似物品的查找是各个厂商对相应物品的后续规划中的重要一步。例如,应用场景为各个零售业或者电商领域中时,如果要确定目标物品a的后续规划,如,囤货等,可以确定与目标物品a相似的物品b,并将物品b的物品处理量信息作为目标物品a的指导依据。也就是说,确定与各个物品对应的相似物品,根据相似物品的物品处理量信息,可以使厂商或者用户提前对库存进行规划,对物品的调度可以提前准备,即确定相似物品的处理量信息对目标物品的库存成本控制起着重要的作用。
35.目前所采用的相似物品确定方法,存在物品属性相似的物品在一定程度上无法保证处理量(出售)趋势上的相似,基于此相似物品进行库存规划进时,存在一定的错误指导。同时,对于某些看似没有关系的关联物品(比如啤酒与纸尿布),如果他们的处理量趋势相同,则可以作为相互的参考依据,但是基于现有技术的特征属性匹配方法,啤酒与纸尿布是完全无关的,因此无法将彼此的处理量数据作为参考依据。最后,各个物品的处理量多且处理时间无法统一,现有相似物品确定方法存在数据拉伸、平移的情况下(也就是处理量趋势相似但不在同一段时间内发生或发生时长有差别),对于相似性的度量会很差,导致无法确定出真正相似的物品。
36.基于上述因素可以采用本发明实施例的技术方案,来确定与待匹配物品相似的目标待选择物品,由于此时是基于处理量来确定的,因此确定出的目标待选择物品的已处理属性信息和待匹配物品的已处理属性信息高度相似,从而可以将目目标待选择物品的已处理属性信息作为待匹配物品的指导依据。
37.如图1所述,本实施例的方法包括:
38.s110、确定与待匹配物品相对应的目标源域数据集。
39.其中,如果要确定与物品a相匹配的目标待选择物品,则可以将物品a作为待匹配物品,即待匹配物品是当前将要确定与其相关联的物品。目标源域数据集中包括多个元素,每个元素可以是待选择物品和与待选择物品相对应的第一出货量信息。可以从待选择物品中确定与待匹配物品相对应的目标物品。相应的,目标源域数据集可以理解为各个待选择物品和其相应的出货量信息的集合。可以将所有物品的处理属性信息作为目标源域数据集中的元素。出货量信息包括出货时间序列和出货时间序列中各个时间点的处理量信息。例如,物品a的出货量信息的时间序列中的各个时间点可以是每天的日期,处理量可以是每天的出货量。
40.具体的,可以获取除待匹配物品之外的所有物品的出货量信息,作为待选择物品,并将各待选择物品所对应的日期作为时间序列中的每个时间点,将每个日期的出货量作为出货量信息中的处理量。在实际应用中,可能出现某些日期没有出货量的情况,为了保证数据的规整性,可以将此日期的出货量标记为0。即出货量信息的时间序列中的各个时间点为连续日期。
41.在本实施例中,为了提高确定的目标源域数据集中各个待选择物品与待匹配物品之间的相似性,可以采用的措施是:根据所述待匹配物品的品类和/或定价信息,确定与所述待匹配物品相对应的目标源域数据集。
42.其中,可以确定待匹配物品的品类,并将品类相同的物品作为与待匹配物品相对应的待选择物品,并将该待选择物品的时间序列和与时间序列对应的处理量作为目标源域数据集中的一个元素。通常,定价相同的物品之间的出货量具备一定的参考性,可以确定待匹配物品的定价信息相一致的物品作为待选择物品,相应的,可以将相应的第一出货量信息作为源域数据集中的一个元素。也可以是将价格在待匹配物品的定价信息的0.5倍至定价信息的2倍范围之内的物品作为待选择物品。
43.可以理解为,为了提高确定出的待选择物品与待匹配物品之间的相似度,可以基于待匹配物品的品类和定价信息来确定目标源域数据集中的待选择物品。
44.需要说明的是,目标源域数据集中包括与各待选择物品相对应的时间序列,和与时间序列中每个时间点所对应的出货量,即处理量,此时,时间序列中的日期为连续日期,某个日期对应的出货量可以是0也可以是其他具体数值。
45.s120、根据与所述待匹配物品相对应的目标数据处理方式,对所述待匹配物品的第二出货量信息和各第一出货量信息进行处理,确定所述待匹配物品与各待选择物品的距离值。
46.其中,目标类型可以是用户预先编辑的,也可以是根据待匹配物品的出货量信息确定的。距离值用于表征待匹配物品与待选择物品之间的相似度,可选的,距离值越小,待匹配物品与待选择物品之间的相似度值越高,反之,距离值越大,待匹配物品与待选择物品之间的相似度值越低。第二出货量信息中依然包括待匹配物品的在各日期的出货量,即包括时间序列和时间序列中各个时间点的出货量,此时的时间主要是日期,时间序列中的日期为连续日期。在实际应用中,可能某个日期的出货量为0,会省略某个日期,此时可以将此日期添加在时间序列中,并将该日期的出货量标记为0。与不同目标类型所对应的处理方式不同,可以将与待匹配物品的目标类型对应的处理方式作为目标数据处理方式。
47.具体的,可以确定待匹配物品的目标类型,并确定与该类型所对应的数据处理方式,作为目标数据处理方式,基于目标数据处理方式和目标类型,对待匹配物品的第二出货量信息和各待选择物品的第一出货量信息进行匹配处理,可以得到每个待选择物品与待匹配物品的距离值。
48.s130、根据各距离值,确定与所述待匹配物品相对应的目标待选择物品,并将所述目标待选择物品的第一出货量信息作为所述待匹配物品的目标处理属性。
49.其中,可以将待选择物品中与待匹配物品相似度最高的物品作为目标待选择物品,即目标待选择物品是最终确定出与待匹配物品相适配的物品。在确定目标待选择物品后,可以根据目标待选择物品的第一出货量信息作为待匹配物品的目标处理属性。由于第
一出货量信息中包括待选择物品的在不同日期的出货量,因此将物品的总出货量信息,作为待匹配物品的指导进出货信息。当然,如果应用场景为商品的进货或出货,则可以将出货量信息,作为该商品的指导进货和囤货的参考依据。
50.具体的,在确定各待选择物品与待匹配物品之间的距离值后,可以将距离值最小,即相似度最高的待选择物品作为目标待选择物品,并从目标源域数据集中调取与该目标待选择物品相对应的第一出货量信息,并将其第一出货量信息作为待匹配物品后续进货和囤货的参考依据。
51.还需要说明的是,由于本发明实施例的技术方案是基于各个待选择物品的出货量信息,可选的,销售趋势信息,确定出的目标待选择物品,因此此时确定出的目标待选择物品与待匹配物品的销售趋势相匹配,可以将目标待选择物品的出货量信息作为指导出货量信息,提高了后续指导的准确性和高效性的技术效果。
52.在本发明实施例中,所述根据各距离值,确定与所述待匹配物品相对应的目标待选择物品,包括:将距离值小于预设距离阈值的待选择物品作为所述目标待选择物品。
53.其中,预设距离阈值可以是根据实际经验预先设置的,为了进一步提高确定出的目标待选择物品与待匹配物品之间的准确性,可以将距离值小于预设距离阈值的待选择物品均作为目标待选择物品。即此时,确定出的目标待选择物品的数量可以是多个,可以将多个目标待选择物品的第一出货量信息作为指导出货量信息。
54.本发明实施例的技术方案,通过确定与待匹配物品相对应的目标源域数据集,并根据待匹配物品的目标类型以及与目标类型相对应的数据处理方式,对待匹配物品的出货量信息和目标源域数据集中的各个第一出货量信息进行匹配处理,可以得到各待选择物品与待匹配物品之间的距离值,由于第一出货量信息和第二出货量信息中均是时间序列和相应的处理量信息,因此在将距离值小于预设距离阈值的待选择物品作为目标待选择物品时,可以将目标待选择物品的第一出货量信息作为待匹配物品的后续规划依据,实现了根据各个物品的销售时间序列确定目标待选择物品,提高确定出的目标待选择物品与待匹配物品之间的处理量相似度,进而在将目标待选择物品的出货量信息作为后续规划依据时,提高了对待匹配物品的规划精度和准确度。
55.实施例二
56.图2为本发明实施例二所提供的一种确定目标物品的方法流程示意图,在前述实施例的基础上,当目标类型不同时,与目标类型所对应的目标数据处理方式也不相同,相应的,确定各待选择物品与待匹配物品之间的距离值的方式也不相同,可以对上述实施例中的s120进行进一步细化,其具体的实施方式可以参见本实施例的详细阐述。其中,与上述实施例相同或者相应的技术术语在此不赘述。
57.如图2所示,所述方法包括:
58.s210、确定与待匹配物品相对应的目标源域数据集。
59.s220、如果所述目标类型为已上线类型,则基于所述动态时间规整算法将第二出货量信息与每个第一出货量信息进行匹配处理,得到所述待匹配物品与各待选择物品的距离值。
60.其中,目标类型包括已上线类型。确定其为已上线类型主要是根据第一出货量信息中的时间序列的初始时刻和当前时刻之间的间隔时长确定的,例如,间隔时长大于6个月
warping,动态时间归整算法),该算法用于动态规划思想,对时间序列不一致的信息进行处理,得到相应的处理结果,即可以得到相应的距离值。
72.通常,初上线的物品所对应的时间序列中的天数较少,此时,为了提高确定出的目标待选择物品与待匹配物品之间的相似度,可以对目标源域数据集中各待选择物品的第一出货量信息进行处理,以匹配初上线类型。可以将待匹配物品的第二出货量信息中的时间序列作为待截取时间序列。例如,第二出货量信息中的时间序列为2个月,则可以将两个月作为待截取时间序列。可以依据待截取时间序列,对各第一出货量信息中的时间序列进行截取处理,得到待比较时间序列和相应的出货量,即处理量。可以将待比较时长序列和相应的处理量,作为出货量信息第三出货量信息。
73.在本实施例中,根据第二出货量信息中的待截取时间序列,对各第一出货量信息进行截取处理,得到与各选择出货量信息出货量信息第三出货量信息,包括:将所述第二出货量信息中的时间序列作为所述待截取时间序列,并确定所述待截取时间序列的截取时长;针对各第一出货量信息,根据当前第一出货量信息中时间序列的起始时刻和所述截取时长,从所述当前第一出货量信息确定出第三出货量信息。
74.其中,截取时长可以理解为待截取时间序列所对应的天数。针对每个第一出货量信息,可以从当前第一出货量信息中的初始时刻,即待选择物品刚上线的日期,截取与截取时长相对应的时间序列,并将截取的时间序列和相应的处理量,作为出货量信息第三出货量信息。
75.对于其他待选择物品的第一出货量信息,可以重复执行上述步骤,得到与每个待选择物品相对应的第三出货量信息,此时,第三出货量信息中的时间序列与待匹配物品的时间序列的长度相一致,同时,还包括与时间序列中各个日期所对应的出货量,即处理量,此时的出货量和处理量都可以理解为物品在相应日期的售出量。
76.s330、采用所述动态时间规整算法对所述第二出货量信息和各第三出货量信息进行处理,确定所述待匹配物品与各待选择物品的距离值。
77.具体的,依然可以采用动态时间规整算法,对第二出货量信息和各出货量信息第三出货量信息中的时间序列和相应的处理量进行处理,得到每个出货量信息第三出货量信息与待匹配物品的距离值,并将此距离值作为相应待选择物品与待匹配物品的距离值。
78.示例性的,参见表1与待匹配物品相对应的第二出货量信息,第二出货量信息中包括的时间序列和与时间序列中各个时间点,即日期,所对应的出货量。时间序列中的日期和相应的处理量(出货量或销售量)依次为2021-01-01-132、2021-01-02-67...2021-03-01-35,可以确定待匹配物品的时间序列长度为60天,可以将此时间作为截取时长,将各待选择物品的第一出货量信息中前60天的日期和每个日期的处理量作为出货量信息第三出货量信息。如,提取待选择物品a前60天的日期和处理量,作为出货量信息第三出货量信息,参见表2。
79.表1
[0080][0081][0082]
表2
[0083][0084]
s340、根据各距离值,确定与所述待匹配物品相对应的目标待选择物品,并将所述目标待选择物品的第一出货量信息作为所述待匹配物品的目标处理属性。
[0085]
具体的,在确定每个待选择物品与待匹配物品之间的距离值后,可以将距离值最小或者小于预设距离值阈值的待选择物品,作为目标待选择物品,并将目标待选择物品的第一出货量信息作为待匹配物品的指导出货量信息。
[0086]
示例性的,在确定与待匹配物品相对应的待选择物品为b,则可以将待选择物品b的第一出货量信息,即,历史销售量信息作为对待匹配物品进行的指导的依据。
[0087]
作为上述技术方案的可选实施例,示例性的,某新上市两个月的待匹配物品sku,为了寻找与其新品时期销量趋势相似的物品,可以采用的方式是:待匹配物品sku的第二出货量信息为:2021-03-01-1099、2021-03-02-527、2021-03-03-272、2021-03-04-303、2021-03-05-213

2021-05-01-137,其中,2021-03-01表示时间序列中的日期,1099表示与2021-03-01时间点所对应的处理量,即出货量。该sku品类为养生茶饮,定价为x,锁定品类同样为养生茶饮,价格在0.5x至2x之间的sku作为目标源域数据集待选择物品,同时,还包括各待
选择物品的第一出货量信息。通过截取目标源域数据集新品前两个月时期数据后,使用dtw算法,确定最相似的相似品第一出货量信息为:2020-05-09-983、2020-05-10-444、2020-05-11-249、2020-05-12-238、2020-05-13-189、

、2020-07-09-126。可以将第一出货量信息作为待匹配物品的指导出货量信息。
[0088]
需要说明的是,通常消费品场景下的各个物品存处理量多且处理时间无法统一的情形,目前,在对数据进行处理时,存在对数据拉伸、平移的情况,此时对相似性的度量会很差,通过垂线下点对点的距离计算无法得出正确的结果,导致遗漏大量趋势真正相似的物品,而本技术方案采用动态时间规整算法有效的解决了此类问题,同时,动态时间规整算法有效解决了时间周期不同和长度不一致,无法确定物品相似度的情形。
[0089]
本发明实施的技术方案,在确定待匹配物品的类型为初上线类型时,可以对源域数据中的数据进行处理,以基于处理后的第一出货量信息和第二出货量信息进行动态时间规整处理时,解决了现有技术中时间序列不一致,导致无法确定物品之间的相似度,提高了确定目标待选择物品的准确性和便捷性的技术效果。
[0090]
实施例四
[0091]
图4为本发明实施例四所提供的一种确定目标物品的方法流程示意图,在前述实施例的基础上,如果目标类型为促销类型,则可以确定依据与促销类型相对应的目标数据处理方式,确定各待选择物品与待处理物品之间的距离值,其具体的实施方式可以参见本实施例详细阐述。其中,与上述实施例相同或者相应的技术术语在此不再赘述。
[0092]
如图4所示,方法包括:
[0093]
s410、确定与待匹配物品相对应的目标源域数据集。
[0094]
s420、如果待匹配物品的目标类型为促销类型,则针对各第一出货量信息,确定当前第一出货量信息中每个时间点所对应的处理量,并对处理量去峰值处理,得到各第三出货量信息。
[0095]
其中,如果平台想要对某个物品进行促销,可以将待匹配物品的目标类型标记为促销类型,即,如果物品的类型被标记为促销类型,则可以确定该物品要进行促销,此时,可以将目标待选择物品的第一出货量信息作为指导出货量信息,以根据指导出货量信息进行进货或者囤货,以确保促销的正常进行。去峰值处理可以理解为,针对某个待选择物品的第一出货量信息,确定某个时间点的处理量(出货量)大于预设阈值的处理量,可选的,对于销量时间序列中某天销量大于百分之九十九分位点的处理量,可以将此处理量替换为时间序列所对应的处理量均值。将替换为均值的属性信息作为出货量信息第三出货量信息。特征提取算法可以理解为:基于单维度的时间序列数据,通过计算各种统计量来提取预设好的各种时间序列的特征值,每条时间序列会得到一列固定维度的特征,多条销量时间序列组合到一起就可以构成一个特征矩阵。
[0096]
示例性的,针对某个待选择物品的第一出货量信息,参见图5,时间序列和相应的处理量(出货量)示意图,由图5可知,其中某个时间点的处理量大于预设处理量阈值,此时,可以确定处理量的均值,并将大于预设处理量阈值的处理量替换为均值处理量,得到出货量信息第三出货量信息,参见图6。
[0097]
在本实施例中,去峰值处理的好处在于:待匹配物品还未进行过促销活动,因此,可以将目标源域数据集中做过促销活动的待选择物品的第一出货量信息去峰值处理,以选
择出与待匹配物品最为合适的目标待选择物品,进而基于目标待选择物品的促销信息,为待匹配物品进行促销指导。
[0098]
s430、基于所述特征提取算法确定包括各第三出货量信息的待比较特征矩阵,以及第二出货量信息的待匹配特征矩阵。
[0099]
其中,特征提取算法可以理解为,提取出货量信息中的时间序列特征和处理量特征,并基于上述特征得到相应的特征矩阵,进而确定特征矩阵之间的相似度。为了提高确定出的距离值的准确性,可以提取多个维度的特征,例如,特征类型:趋势性特征、序列相关性特征、偏度特征、峰度特征、长期销量趋势特征、数据离散性特征、区间趋势性特征、稀疏性特征等等。可以采用特征提取算法提取多个维度特征,得到相应的特征矩阵。待比较特征矩阵与各第三出货量信息相对应。
[0100]
还需要说明的是,其他维度的特征还可以是:时间序列分位数值、促销活动方面特征,例如,促销活动周期、促销活动力度以及促销定价等,可以根据实际需求灵活调整各特征维度和相应的特征。
[0101]
示例性的,基于特征提取算法对每个待选择物品的第一出货量信息进行特征提取,得到与每个待选择物品相对应的待组合特征矩阵;其中,所述待组合特征矩阵为n
×
1阶矩阵,n表示特征的数量;基于各待组合特征矩阵,确定比较特征矩阵。待比较特征矩阵中的每一列与每个第三出货量信息相对应,即与待选择物品相对应。如果待选择物品的数量有100个,则待比较特征矩阵为n
×
100阶。
[0102]
s440、基于待比较特征矩阵和待匹配特征矩阵,确定各待选择物品与待匹配物品之间的距离值。
[0103]
其中,待比较特征矩阵与目标源域数据集中待选择物品的第一出货量信息相对应。待匹配特征矩阵与待匹配物品的第二出货量信息相对应。距离值可以理解为待选择物品与待匹配物品之间的相似度值。
[0104]
在本实施例中,在基于待比较特征矩阵和待匹配特征矩阵,确定各待选择物品与待匹配物品之间的距离值之前,还包括:分别确定待比较特征矩阵和待匹配特征矩阵中每列特征值的均值和方差,并基于均值和方差对相应列进行标准化处理,得到标准化处理后的待比较特征矩阵和待匹配特征矩阵。
[0105]
具体的,销量时间序列特征矩阵进行标准化处理,记录每列标准化过程中的均值与方差,对目标域数据根据该均值与方差做同样的标准化处理以方便后续距离计算。
[0106]
由于已经提取出了不同时间长度时间序列相同维度的特征,此时可以直接使用欧式距离计算它们间的相似性。即采用欧氏距离计算方法确定待比较特征矩阵和待匹配特征矩阵的相似度值,即距离值。
[0107]
s450、根据各距离值,确定与所述待匹配物品相对应的目标待选择物品,并将所述目标待选择物品的第一出货量信息作为所述待匹配物品的目标处理属性。
[0108]
示例性的,某需要进行促销销量预测的待匹配物品sku,需求寻找与其日常销量趋势相似且促销活动类似的物品。待匹配物品的第二出货量信息为:2020-03-17-98、2020-03-18-86、2020-03-19-80、2020-03-20-74、2020-03-21-82

2021-04-01-41,待匹配物品的特征维度所对应的数据分别为:sku编号/特征:1;趋势性:0;序列相关性:0.36;偏度:1.12;峰度:0.35;

促销周期:3;促销力度:0.18。该sku品类为狗玩具,可以将品类同样为
狗玩具的sku作为目标源域数据集中的待选择物品。通过将目标源域数据集中的各待选择物品的第一出货量信息作去波峰处理后使用特征提取算法,确定的目标待选择物品的第一出货量信息为:2018-07-07-94、2018-07-08-76、2018-07-09-82、2018-07-10-106、2018-07-11-78

2020-11-29-36;与其相对应的特征矩阵可以是:sku编号/特征:1;趋势性:0;序列相关性:0.29;偏度:1.36;峰度:0.47;

促销周期:3;促销力度:0.22。
[0109]
由上可以看出,采用特征提取法可以解决数据不等长以及有额外特征输入的情况下传统消费品相似品搜索算法无法使用的问题,并且在性能表现上完全不弱于传统搜索算法。由此可见,在拥有海量的性质不一的数据的场景下,上述两算法可以良好的处理这些不统一的数据,并且搜索出符合目标域数据性质的相似品数据,为之后的经营规划做出指导。
[0110]
本发明实施例的技术方案,在确定待匹配物品的目标类型为促销类型时,可以确定促销类型所对应的目标数据处理方式,进而在基于该数据处理方式进行处理时,可以有效的从源域数据中确定与目标待选择数据,进而基于目标待选择物品的第一出货量信息确定待匹配物品的出货量信息,基于第一出货量信息中的出货量信息,可以有效的确定与待匹配物品相对应的囤货量信息,从而实现了有效控制库存成本的技术效果。
[0111]
实施例五
[0112]
作为上述实施例的一可选实施例,图7为本发明实施例五所提供的一种确定目标物品的方法示意图。
[0113]
如图7所示,所述方法包括:
[0114]
获取目标域数据和源域数据。其中,目标域数据可以理解为待匹配物品,还包括与待匹配物品相对应的第二出货量信息;源域数据,即目标源域数据集,可以理解为源域数据包括多个待选择物品的第一出货量信息。出货量信息中包括出货时间序列和时间序列中各个时间点的处理量。对数据清洗以及处理。可以理解为,在实际应用中存在某天的出货量即处理量为0,隐藏该日期的情况,可以将此种情况的数据补零处理,得到为连续数值的时间序列。判断待匹配物品的目标类型(即确定待匹配物品对应的为常规品还是新品场景),并确定与目标类型对应的数据处理方式。如果目标类型为已上线类型或初上线类型(即,待匹配物品为常规品场景),则采用动态时间规整算法进行处理。如果目标类型为促销类型(新品场景),则采用特征提取算法进行处理。如果目标类型为初上线类型,则根据待匹配物品的第二出货量信息中的时间序列长度,对第一出货量信息中的时间序列进行截取处理,并对截取处理后的第一出货量信息和第二出货量信息进行匹配处理(即,根据目标域数据的时间长度对源域数据截取处理后,采用动态时间规整算法进行处理),也就是从源域数据集中确定相似物品,以得到与待匹配物品相对应的目标待选择物品,可以将此结果输出。
[0115]
本发明实施例的技术方案,通过确定与待匹配物品相对应的目标源域数据集,并根据待匹配物品的目标类型以及与目标类型相对应的数据处理方式,对待匹配物品的出货量信息和目标源域数据集中的各个第一出货量信息进行匹配处理,可以得到各待选择物品与待匹配物品之间的距离值,由于第一出货量信息和第二出货量信息中均是时间序列和相应的处理量信息,因此在将距离值小于预设距离阈值的待选择物品作为目标待选择物品时,可以将目标待选择物品的第一出货量信息作为待匹配物品的后续规划依据,实现了根据各个物品的销售时间序列确定目标待选择物品,提高确定出的目标待选择物品与待匹配物品之间的处理量相似度,进而在将目标待选择物品的出货量信息作为后续规划依据时,
提高了对待匹配物品的规划精度和准确度。
[0116]
实施例六
[0117]
图8为本发明实施例六提供的一种确定目标物品的装置结构示意图,该装置包括:目标源域数据集确定模块510、距离值确定模块520以及目标物品确定模块530。
[0118]
其中,目标源域数据集确定模块510,用于确定与待匹配物品相对应的目标源域数据集;其中,所述目标源域数据集中包括各待选择物品的第一出货量信息;距离值确定模块520,用于根据与所述待匹配物品相对应的目标数据处理方式,对所述待匹配物品的第二出货量信息和各第一出货量信息进行处理,确定所述待匹配物品与各待选择物品的距离值;目标物品确定模块530,用于根据各距离值,确定与所述待匹配物品相对应的目标待选择物品,并将所述目标待选择物品的第一出货量信息作为所述待匹配物品的目标处理属性。
[0119]
在上述技术方案的基础上,所述第一出货量信息中包括出货时间序列和所述出货时间序列中每个时间点的处理量。
[0120]
在上述技术方案的基础上,所述目标源域数据集确定模块,还用于:根据所述待匹配物品的品类和/或定价信息,确定与所述待匹配物品相对应的目标源域数据集品类。
[0121]
在上述技术方案的基础上,所述装置还包括:数据处理方式确定模块,用于确定所述待匹配物品的目标类型,并确定与所述目标类型相对应的目标数据处理方式
[0122]
在上述技术方案的基础上,数据处理方式确定模块,用于若所述待匹配物品的目标类型为已上线类型或初上线类型,则所述目标数据处理方式为动态时间规整算法;若所述待匹配物品的目标类型为促销类型,则所述目标数据处理方式为特征提取算法。
[0123]
在上述技术方案的基础上,所述的距离值确定模块,还用于:
[0124]
如果所述目标类型为已上线类型,则基于所述动态时间规整算法将第二出货量信息与每个第一出货量信息进行匹配处理,得到所述待匹配物品与各待选择物品的距离值。
[0125]
在上述技术方案的基础上,所述的距离值确定模块,包括:
[0126]
第三出货量信息确定单元,用于如果所述目标类型为初上线类型,则根据所述第二出货量信息中的待截取时间序列,对各第一出货量信息进行截取处理,得到各待选择物品的第三出货量信息;
[0127]
距离值确定单元,用于采用所述动态时间规整算法对所述第二出货量信息和各第三出货量信息进行处理,确定所述待匹配物品与各待选择物品的距离值。
[0128]
在上述技术方案的基础上,所述第三出货量信息确定单元,包括:
[0129]
截取时长确定子单元,用于将所述第二出货量信息中的时间序列作为所述待截取时间序列,并确定所述待截取时间序列的截取时长;
[0130]
第三出货量信息确定子单元,用于针对各第一出货量信息,根据当前第一出货量信息中时间序列的起始时刻和所述截取时长,从所述当前第一出货量信息确定出第三出货量信息。
[0131]
在上述技术方案的基础上,所述的距离值确定模块,包括:
[0132]
第三出货量信息第二确定单元,用于如果所述待匹配物品的目标类型为促销类型,则针对各第一出货量信息,确定当前第一出货量信息中每个时间点所对应的处理量,并对所述处理量去峰值处理,得到各第三出货量信息;
[0133]
待匹配特征矩阵确定单元,用于基于所述特征提取算法确定包括各第三出货量信
息的待比较特征矩阵,以及第二出货量信息的待匹配特征矩阵;
[0134]
距离值确定单元,用于基于所述待比较特征矩阵和所述待匹配特征矩阵,确定各待选择物品与所述待匹配物品之间的距离值。
[0135]
在上述技术方案的基础上,所述距离值确定单元,用于在所述基于所述待比较特征矩阵和所述待匹配特征矩阵,确定各待选择物品与所述待匹配物品之间的距离值之前,还用于:
[0136]
分别确定所述待比较特征矩阵和所述待匹配特征矩阵中每列特征值的均值和方差,并基于均值和方差对相应列进行标准化处理,得到标准化处理后的待比较特征矩阵和待匹配特征矩阵。
[0137]
在上述技术方案的基础上,所述目标物品确定模块,用于:将距离值小于预设距离阈值的待选择物品作为所述目标待选择物品。
[0138]
本发明实施例的技术方案,通过确定与待匹配物品相对应的目标源域数据集,并根据待匹配物品的目标类型以及与目标类型相对应的数据处理方式,对待匹配物品的已处理属性信息和目标源域数据集中的各个第一出货量信息进行匹配处理,可以得到各待选择物品与待匹配物品之间的距离值,由于第一出货量信息和第二出货量信息中均是时间序列和相应的处理量信息,因此在将距离值小于预设距离阈值的待选择物品作为目标待选择物品时,可以将目标待选择物品的第一出货量信息作为待匹配物品的后续规划依据,实现了根据各个物品的销售时间序列确定目标待选择物品,提高确定出的目标待选择物品与待匹配物品之间的处理量相似度,进而在将目标待选择物品的已处理属性信息作为后续规划依据时,提高了对待匹配物品的规划精度和准确度。
[0139]
本发明实施例所提供的确定目标物品的装置可执行本发明任意实施例所提供的确定目标物品的方法,具备执行方法相应的功能模块和有益效果。
[0140]
值得注意的是,上述装置所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明实施例的保护范围。
[0141]
实施例七
[0142]
图9为本发明实施例七提供的一种电子设备的结构示意图。图9示出了适于用来实现本发明实施例实施方式的示例性电子设备60的框图。图9显示的电子设备60仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0143]
如图9所示,电子设备60以通用计算设备的形式表现。电子设备60的组件可以包括但不限于:一个或者多个处理器或者处理单元601,系统存储器602,连接不同系统组件(包括系统存储器602和处理单元601)的总线603。
[0144]
总线603表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。
[0145]
电子设备60典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备60访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
[0146]
系统存储器602可以包括易失性存储器形式的计算机系统可读介质,例如随机存
取存储器(ram)604和/或高速缓存存储器605。电子设备60可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统606可以用于读写不可移动的、非易失性磁介质(图9未显示,通常称为“硬盘驱动器”)。尽管图9中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线603相连。存储器602可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
[0147]
具有一组(至少一个)程序模块607的程序/实用工具608,可以存储在例如存储器602中,这样的程序模块607包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块607通常执行本发明所描述的实施例中的功能和/或方法。
[0148]
电子设备60也可以与一个或多个外部设备609(例如键盘、指向设备、显示器610等)通信,还可与一个或者多个使得用户能与该电子设备60交互的设备通信,和/或与使得该电子设备60能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口611进行。并且,电子设备60还可以通过网络适配器612与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器612通过总线603与电子设备60的其它模块通信。应当明白,尽管图9中未示出,可以结合电子设备60使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0149]
处理单元601通过运行存储在系统存储器602中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的确定目标物品的方法。
[0150]
实施例八
[0151]
本发明实施例八还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行确定目标物品的方法。
[0152]
该方法包括:
[0153]
确定与待匹配物品相对应的目标源域数据集;其中,所述源域数据集中包括各待选择物品的第一出货量信息;
[0154]
根据所述待匹配物品的目标类型以及与所述目标类型相对应的目标数据处理方式,对所述待匹配物品的第二出货量信息和各第一出货量信息进行处理,确定所述待匹配物品与各待选择物品的距离值;
[0155]
根据各距离值,确定与所述待匹配物品相对应的目标待选择物品,并将所述目标待选择物品的第一出货量信息作为所述待匹配物品的指导已处理属性信息。
[0156]
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器
(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0157]
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0158]
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0159]
可以以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言——诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0160]
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

技术特征:
1.一种确定目标物品的方法,其特征在于,包括:确定与待匹配物品相对应的目标源域数据集;其中,所述目标源域数据集中包括各待选择物品的第一出货量信息;根据与所述待匹配物品相对应的目标数据处理方式,对所述待匹配物品的第二出货量信息和各所述第一出货量信息进行处理,确定所述待匹配物品与各待选择物品的距离值;根据各距离值,确定与所述待匹配物品相对应的目标待选择物品,并将所述目标待选择物品的第一出货量信息作为所述待匹配物品的目标处理属性。2.根据权利要求1所述的方法,其特征在于,所述第一出货量信息中包括出货时间序列和所述出货时间序列中每个时间点的处理量。3.根据权利要求1所述的方法,其特征在于,所述确定与待匹配物品相对应的目标源域数据集,包括:根据所述待匹配物品的品类和/或定价信息,确定与所述待匹配物品相对应的目标源域数据集。4.根据权利要求1所述的方法,其特征在于,还包括:确定所述待匹配物品的目标类型,并确定与所述目标类型相对应的目标数据处理方式。5.根据权利要求4所述的方法,其特征在于,所述确定所述待匹配物品的目标类型,并确定与所述目标类型相对应的目标数据处理方式,包括:若所述待匹配物品的目标类型为已上线类型或初上线类型,则所述目标数据处理方式为动态时间规整算法;若所述待匹配物品的目标类型为促销类型,则所述目标数据处理方式为特征提取算法。6.根据权利要求5所述的方法,其特征在于,所述根据与所述待匹配物品相对应的目标数据处理方式,对所述待匹配物品的第二出货量信息和各第一出货量信息进行处理,确定所述待匹配物品与各待选择物品的距离值,包括:如果所述目标类型为已上线类型,则基于所述动态时间规整算法将第二出货量信息与每个第一出货量信息进行匹配处理,得到所述待匹配物品与各待选择物品的距离值。7.根据权利要求5所述的方法,其特征在于,所述根据与所述待匹配物品相对应的目标数据处理方式,对所述待匹配物品的第二出货量信息和各第一出货量信息进行处理,确定所述待匹配物品与各待选择物品的距离值,包括:如果所述目标类型为初上线类型,则根据所述第二出货量信息中的待截取时间序列,对各第一出货量信息进行截取处理,得到各待选择物品的第三出货量信息;采用所述动态时间规整算法对所述第二出货量信息和各第三出货量信息进行处理,确定所述待匹配物品与各待选择物品的距离值。8.根据权利要求7所述的方法,其特征在于,所述根据所述第二出货量信息中的待截取时间序列,对各第一出货量信息进行截取处理,得到各待选择物品的第三出货量信息,包括:将所述第二出货量信息中的时间序列作为所述待截取时间序列,并确定所述待截取时间序列的截取时长;
针对各第一出货量信息,根据当前第一出货量信息中时间序列的起始时刻和所述截取时长,从所述当前第一出货量信息确定出第三出货量信息。9.根据权利要求5所述的方法,其特征在于,所述根据与所述待匹配物品相对应的目标数据处理方式,对所述待匹配物品的第二出货量信息和各第一出货量信息进行处理,确定所述待匹配物品与各待选择物品的距离值,包括:如果所述待匹配物品的目标类型为促销类型,则针对各第一出货量信息,确定当前第一出货量信息中每个时间点所对应的处理量,并对所述处理量去峰值处理,得到各第三出货量信息;基于所述特征提取算法确定包括各第三出货量信息的待比较特征矩阵,以及第二出货量信息的待匹配特征矩阵;基于所述待比较特征矩阵和所述待匹配特征矩阵,确定各待选择物品与所述待匹配物品之间的距离值。10.根据权利要求9所述的方法,其特征在于,在所述基于所述待比较特征矩阵和所述待匹配特征矩阵,确定各待选择物品与所述待匹配物品之间的距离值之前,还包括:分别确定所述待比较特征矩阵和所述待匹配特征矩阵中每列特征值的均值和方差,并基于均值和方差对相应列进行标准化处理,得到标准化处理后的待比较特征矩阵和待匹配特征矩阵。11.根据权利要求1所述的方法,其特征在于,所述根据各距离值,确定与所述待匹配物品相对应的目标待选择物品,包括:将距离值小于预设距离阈值的待选择物品作为所述目标待选择物品。12.一种确定目标物品的装置,其特征在于,包括:目标源域数据集确定模块,用于确定与待匹配物品相对应的目标源域数据集;其中,所述目标源域数据集中包括各待选择物品的第一出货量信息;距离值确定模块,用于根据与所述待匹配物品相对应的目标数据处理方式,对所述待匹配物品的第二出货量信息和各第一出货量信息进行处理,确定所述待匹配物品与各待选择物品的距离值;目标物品确定模块,用于根据各距离值,确定与所述待匹配物品相对应的目标待选择物品,并将所述目标待选择物品的第一出货量信息作为所述待匹配物品的目标处理属性。13.一种电子设备,其特征在于,所述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-11中任一所述的确定目标物品的方法。14.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-11中任一所述的确定目标物品的方法。

技术总结
本发明实施例公开了一种确定目标物品的方法、装置、设备及介质,该方法包括:确定与待匹配物品相对应的目标源域数据集;其中,目标源域数据集中包括各待选择物品的第一出货量信息;根据与待匹配物品相对应的目标数据处理方式,对待匹配物品的第二出货量信息和各第一出货量信息进行处理,确定待匹配物品与各待选择物品的距离值;根据各距离值,确定与待匹配物品相对应的目标待选择物品,并将目标待选择物品的第一出货量信息作为待匹配物品的目标处理属性。本发明实施例的技术方案,实现准确的确定出待匹配物品的指导已处理属性信息,进而基于指导已处理属性信息对待匹配物品进行有效指导的技术效果。有效指导的技术效果。有效指导的技术效果。


技术研发人员:黄智杰
受保护的技术使用者:北京京东振世信息技术有限公司
技术研发日:2021.11.30
技术公布日:2022/3/8

最新回复(0)