1.本说明书实施方式涉及临床试验数据处理技术领域,具体涉及一种临床试验数据处理方法、装置、计算机设备、存储介质及计算机程序产品。
背景技术:
2.电子数据采集(electronic data capture,edc)是一种基于计算机网络的用于临床试验数据采集的技术,通过软件、硬件、sop(standard operating procedure,标准操作规程)和人员配置的有机结合,以电子化的形式直接采集和传递临床数据。edc系统采用电子化病例报告表(electronic case report form)代替纸质病例报告表来对临床试验数据进行收集和管理。且临床试验的crf(case report form,病例报告表)是在临床试验中用以记录每一名受试者在试验过程中的症状、体征或实验室检查数据的文件。
3.在传统技术中,在电子数据采集系统中存在多个版本的电子化病例报告表。因此,在临床试验过程中会采用不同版本的电子化病例报告采集到格式多样化的临床试验数据。进一步地,为了评估临床试验方案,需要对采集到的临床试验数据进行分析,以完成对临床试验方案的评估。
4.然而,传统技术中格式多样化的临床试验数据会影响到临床试验数据的分析。
技术实现要素:
5.有鉴于此,本说明书实施方式致力于提供一种临床试验数据处理方法、装置、计算机设备、存储介质及计算机程序产品,以解决传统技术中格式多样化的临床试验数据影响临床试验数据分析准确度的技术问题。
6.本说明书实施方式提供了一种临床试验数据处理方法,所述方法包括:获取多个版本的源临床试验数据;其中,所述源临床试验数据是分别通过不同版本的病例报告表采集而得到的,且所述源临床试验数据与所述病例报告表中的目标字段对应;其中,在所述病例报告表中所述目标字段设有对应的字段数据类型;将各版本的所述源临床试验数据的数据类型由所述字段数据类型转换为目标类型,得到对应的目标临床试验数据;其中,所述目标类型为能够适配所述目标字段在各版本所述病例报告表中的字段数据类型;以所述目标类型将所述目标临床试验数据与目标变量对应存储;其中,所述目标变量与所述目标字段具有映射关系。
7.本说明书实施方式提供一种临床试验数据处理装置,所述装置包括:源试验数据获取模块,用于获取多个版本的源临床试验数据;其中,所述源临床试验数据是分别通过不同版本的病例报告表采集而得到的,且所述源临床试验数据与所述病例报告表中的目标字段对应;其中,在所述病例报告表中所述目标字段设有对应的字段数据类型;数据类型转换模块,用于将各版本的所述源临床试验数据的数据类型由所述字段数据类型转换为目标类型,得到对应的目标临床试验数据;其中,所述目标类型为能够适配所述目标字段在各版本所述病例报告表中的字段数据类型;目标数据存储模块,用于以所述目标类型将所述目标
临床试验数据与目标变量对应存储;其中,所述目标变量与所述目标字段具有映射关系。
8.本说明书实施方式提供一种临床试验数据处理装置,所述装置包括:源试验数据获取模块,用于获取多个版本的源临床试验数据;其中,所述源临床试验数据是分别通过不同版本的病例报告表采集而得到的,且所述源临床试验数据与所述病例报告表中的目标字段对应;其中,在所述病例报告表中所述目标字段设有对应的字段数据类型;数据类型转换模块,用于将各版本的所述源临床试验数据的数据类型由所述字段数据类型转换为目标类型,得到对应的目标临床试验数据;其中,所述目标类型为能够适配所述目标字段在各版本所述病例报告表中的字段数据类型;目标数据存储模块,用于以所述目标类型将所述目标临床试验数据与目标变量对应存储;其中,所述目标变量与所述目标字段具有映射关系。
9.本说明书实施方式提供一种计算设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述实施方式中的方法步骤。
10.本说明书实施方式提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施方式中的方法步骤。
11.本说明书实施方式提供一种计算机程序产品,所述计算机程序产品中包括指令,所述指令被计算机设备的处理器执行时,使得所述计算机设备能够执行上述实施方式中的方法步骤。
12.本说明书实施方式,通过获取多个版本的源临床试验数据,将各版本的源临床试验数据的数据类型由字段数据类型转换为目标类型,得到对应的目标临床试验数据,并以目标类型将目标临床试验数据与目标变量对应存储,从而目标临床试验数据能够适配于多个版本的源临床试验数据,实现各个版本源临床试验数据之间的数据兼容。
附图说明
13.图1所示为一实施方式提供的临床试验数据处理方法的应用环境图;
14.图2所示为一实施方式提供的临床试验数据处理方法的流程示意图;
15.图3所示为一实施方式提供的临床试验数据处理方法的流程示意图;
16.图4为一实施方式提供的临床试验数据处理装置的结构框图;
17.图5为一实施方式提供的计算机设备的内部结构图。
具体实施方式
18.下面将结合本说明书实施方式中的附图,对本说明书实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅是本说明书一部分实施方式,而不是全部的实施方式。基于本说明书中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本说明书保护的范围。
19.以下对本说明书中涉及的部分名词进行解释,药物的临床试验指的是在人体进行的药物系统性研究,以确定药物的疗效和安全性。药物临床试验阶段分为i期、ii期、iii期临床试验、iv期临床试验。i期主要是涉及初步的临床药理学及人体安全性评价试验。ii期可以理解为治疗作用初步评价阶段,主要涉及初步评价药物对目标适应症患者的治疗作用和安全性,也包括为iii期临床试验研究设计和给药剂量方案的确定提供依据。iii期可以理解为治疗作用确证阶段,主要进一步验证药物对目标适应症患者的治疗作用和安全性,
评价利益与风险关系,最终为药物注册申请的审查提供充分的依据。iv期主要是药物上市后的临床试验,在药物上市后,可以继续追踪在广泛使用条件下的药物的疗效和不良反应,以评价在普通或者特殊人群中使用的利益与风险关系以及改进给药剂量等。
20.在临床试验过程中,可以按照临床试验方案制定设定病例报告表(case report form,crf),用于记录每一名受试者在试验过程中的临床试验数据。病例报告表包括人口学属性表单、不良事件表单、合并/既往用药表单、pk样本采集表单、既往病史数据表单、献血史表单、过敏史表单、给药记录表单、凝血功能表单、尿常规表单、血常规表单等。edc(electronic data capture system,电子数据捕获系统)是适用于临床试验数据采集和传输的平台软件。edc系统的基本功能主要包含ecrf构建、数据保存和稽查轨迹、自动核查、数据质疑管理、源数据核查确认、电子签名、数据库的锁定、数据存储和导出等功能。通过edc系统采集的临床试验数据可以存储至源数据库中。
21.请参阅图1,本说明书实施方式提供一种临床试验数据处理系统,且本说明书提供的临床试验数据处理方法应用于该临床试验数据处理系统。该临床试验数据处理系统可以包括由终端110和服务器120形成的硬件环境。终端110通过网络与服务器120进行通信。
22.在传统技术中,一方面,源数据库中存储的临床试验数据并不能直接用于临床试验数据分析。另一方面,源数据库中存储的临床试验数据并不能满足药政监管部门所要求的数据格式。因此需要对源数据库中的源临床试验数据进行清洗(比如数据类型转换),以新的数据类型存储临床试验数据。基于此,服务器120获取多个版本的源临床试验数据;其中,源临床试验数据是分别通过不同版本的病例报告表采集而得到的,且源临床试验数据与病例报告表中的目标字段对应;其中,在病例报告表中目标字段设有对应的字段数据类型;将各版本的源临床试验数据的数据类型由字段数据类型转换为目标类型,得到对应的目标临床试验数据;其中,目标类型为能够适配目标字段在各版本病例报告表中的字段数据类型;以目标类型将目标临床试验数据与目标变量对应存储;其中,目标变量与目标字段具有映射关系。
23.其中,终端110可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。随着科学技术的发展,可能会出现一些新型计算设备,比如量子计算服务器,这些新型计算设备也可以应用于本说明书的实施方式中。
24.请参阅图2,本说明书实施方式提供一种临床试验数据处理方法。该临床试验数据处理方法包括以下步骤。
25.s210、获取多个版本的源临床试验数据。
26.其中,源临床试验数据是分别通过不同版本的病例报告表采集而得到的,且源临床试验数据与病例报告表中的目标字段对应。其中,在病例报告表中目标字段设有对应的字段数据类型。
27.其中,字段数据类型可以是病例报告表所涉及的字段的数据类型,比如整数类型、数值类型、浮点类型、日期类型、字符类型等。
28.具体地,通过edc系统采集临床试验数据之前,需要设计病例报告表。随着临床试验项目的研究过程,病例报告表会存在表更,因此,临床试验项目会涉及到不同版本的病例报告表。病例报告表包括若干表单,各表单会包括若干字段。与获取的各版本的源临床试验
数据对应的字段记为目标字段。利用不同版本的病例报告表采集源临床试验数据,可以得到多个版本的源临床试验数据。
29.在一些实施方式中,将edc系统采集的源临床试验数据存储至源数据库中,为了满足sdtm格式要求或者临床试验数据分析的需求,需要对源数据库中的源临床试验数据进行清洗,因此,从源数据库中读取多个版本的源临床试验数据。
30.在一些实施方式中,在一次临床试验数据采集时,终端展示一个版本病例报告表的录入页面,通过该版本病例报告表的录入页面响应于针对目标字段的录入操作,终端向服务器发送数据录入请求,数据录入请求中携带有目标字段、该版本病例报告表的版本标识、该版本的源临床试验数据,即服务器接收到该版本的源临床试验数据,并对应存储目标字段、该版本病例报告表的版本标识、源临床试验数据至源数据库。在又一次临床试验数据采集时,终端展示新版本病例报告表的录入页面,通过该新版本病例报告表的录入页面响应于针对目标字段的录入操作,终端向服务器发送数据录入请求,数据录入请求中携带有目标字段、该新版本病例报告表的版本标识、该新版本的源临床试验数据,即服务器接收到该新版本的源临床试验数据,并对应存储目标字段、该新版本病例报告表的版本标识、源临床试验数据至源数据库。因此,服务器获取到多个版本的源临床试验数据。
31.s220、将各版本的源临床试验数据的数据类型由字段数据类型转换为目标类型,得到对应的目标临床试验数据。
32.其中,目标类型为能够适配目标字段在各版本病例报告表中的字段数据类型。如前文,目标字段的字段数据类型可以是整数类型、数值类型、浮点类型、日期类型、字符类型中的任一个。目标类型可以是能够兼容各中字段数据类型的数据类型。在不同版本的病例报告表中,目标字段的字段数据类型可以采用同一数据类型,也可以采用不同的数据类型。
33.具体地,由于利用各个不同版本的病例报告表采集源临床试验数据,各版本的源临床试验数据具有不同的数据类型。各版本的源临床试验数据是不能相互兼容的,最终影响临床试验数据的分析或者导出。因此,需要对各版本的源临床试验数据进行数据类型转换处理。在一些实施方式中,在设计不同版本的病例报告表时,目标字段配置有不同的字段数据类型,为了生成具有兼容性的目标临床试验数据,可以基于不同版本中目标字的字段数据类型确定目标类型,将各版本的源临床试验数据的数据类型转换为目标类型,得到目标临床试验数据。
34.s230、以目标类型将目标临床试验数据与目标变量对应存储。
35.其中,目标变量与目标字段具有映射关系。其中,目标变量可以是数据域表中的与目标字段对应的变量。按照映射关系存储采集的目标字段下的源临床试验数据至数据域表的目标变量,以对采集的源临床试验数据进行清洗。具体地,在得到目标临床试验数据之后,可以将目标临床试验数据存储至数据域表的目标变量下。为了提升临床试验数据的兼容性,以目标类型将目标临床试验数据对应存储至数据域表的目标变量下。
36.上述临床试验数据处理方法,通过获取多个版本的源临床试验数据,将各版本的源临床试验数据的数据类型由字段数据类型转换为目标类型,得到对应的目标临床试验数据,并以目标类型将目标临床试验数据与目标变量对应存储,从而目标临床试验数据能够适配于多个版本的源临床试验数据,实现各个版本源临床试验数据之间的数据兼容。
37.在一些实施方式中,在将各版本的源临床试验数据的数据类型由字段数据类型转
换为目标类型之前,该临床试验数据处理方法还包括:根据目标字段在各版本病例报告表中的字段数据类型确定目标类型。
38.具体地,在各版本的病例报告表中,目标字段的字段数据类型可以相同,也可以不同。若各版本的目标字段的字段数据类型相同,则可以将该字段数据类型作为目标类型。若各版本的目标字段的字段数据类型不相同,可以基于各版本的目标字段的字段数据类型生成目标类型,目标类型能够兼容各个版本的目标字段的源临床试验数据。
39.示例性地,在v1.10病例报告表中目标字段的字段数据类型可以采用$n字符型(比如$100,表示该目标字段下的源临床试验数据的字符数量为100)。在v1.11病例报告表中目标字段的字段数据类型可以采用$n字符型(比如$200,表示该目标字段下的源临床试验数据的字符数量为200)。能够兼容v1.10病例报告表和v1.11病例报告表的目标字段的目标类型可以是$200字符型。
40.示例性地,在v1.12病例报告表中目标字段的字段数据类型可以采用日期型({yyyy}-{mm}-{dd})。在v1.13病例报告表中目标字段的字段数据类型可以采用日期型(比如{yyyy}-{mm}-{dd}{hh})。能够兼容v1.12病例报告表和v1.13病例报告表的目标字段的目标类型可以是{yyyy}-{mm}-{dd}{hh}。
41.示例性地,目标字段的字段数据类型可以采用x.y浮点型。其中,x表示整数长度,y表示小数长度。在v1.14病例报告表中目标字段的字段数据类型可以采用5.6,5.3表示整数长度为5,小数长度为6。在v1.15病例报告表中目标字段的字段数据类型可以采用6.4,6.4表示整数长度为6,小数长度为4。能够兼容v1.14病例报告表和v1.15病例报告表的目标字段的目标类型可以是6.6。
42.示例性地,在v1.16病例报告表中目标字段的字段数据类型可以采用{yyyy}、{mm}、{dd}、{hh}中任一日期型。在v1.12病例报告表中目标字段的字段数据类型可以采用日期型({yyyy}-{mm}-{dd})。能够兼容v1.12病例报告表和v1.16病例报告表的目标字段的目标类型可以是$10字符型。
43.本实施方式中,通过目标字段在各版本病例报告表中的字段数据类型确定目标类型,实现对源临床试验数据的兼容性存储。
44.在一些实施方式中,请参阅图3,根据目标字段在各版本病例报告表中的字段数据类型确定目标类型,包括以下步骤。
45.s310、对目标字段在各版本病例报告表中的字段数据类型进行解析,得到各字段数据类型的字符长度数据。
46.s320、基于各字段数据类型的字符长度数据,确定目标类型的字符长度范围。
47.具体地,获取各个版本的源临床试验数据,对各个版本中目标字段对应的源临床试验数据进行解析,确定各个版本中的各字段数据类型以及各字段数据类型的字符长度数据。各个版本中的各字段数据类型可以相同,也可以不同。比较各字段数据类型的字符长度数据,确定能够兼容各版本的目标类型的字符长度范围。
48.在一些实施方式中,基于各字段数据类型的字符长度数据,确定目标类型的字符长度范围,至少包括以下之一。
49.在各字段数据类型属于单一数据类型的情况下,将各字段数据类型的字符长度数据作为目标类型的字符长度范围。或者
50.在各字段数据类型属于不同的数据类型的情况下,根据各字段数据类型的字符长度数据,确定出最大范围的字符长度数据;并将最大范围的字符长度数据作为目标类型的字符长度范围。
51.具体地,在各字段数据类型属于单一数据类型的情况下,各字段数据类型的字符长度数据是相同的。单一数据类型可以是日期型、整数型、字符型、数值型中的任一个。在一些实施方式中,当各字段数据类型分别为日期型时,则目标类型可以设置为日期型,获取日期型的字符长度数据,并作为目标类型的字符长度范围。在一些实施方式中,当各字段数据类型分别为整数型时,则目标类型可以设置为整数型,获取整数型的字符长度数据,并作为目标类型的字符长度范围。在一些实施方式中,当各字段数据类型分别为字符型时,则目标类型可以设置为字符型,获取字符型的字符长度数据,并作为目标类型的字符长度范围。在一些实施方式中,当各字段数据类型分别为数值型时,则目标类型可以设置为数值型,获取数值型的字符长度数据,并作为目标类型的字符长度范围。
52.具体地,在各字段数据类型属于不同的数据类型的情况下,各字段数据类型可以具有不同的字符长度数据。比较各字段数据类型的字符长度数据,确定出最大范围的字符长度数据。为了能兼容各种字段数据类型,可以基于各字段数据类型确定具有兼容性的目标类型,并将最大范围的字符长度数据作为目标类型的字符长度范围。
53.在一些实施方式中,针对同一目标字段在不同版本中,目标字段的字段数据类型在一些版本中可以是日期型,目标字段的字段数据类型在一些版本中可以是浮点型,若解析到日期型的字符长度数据为10,浮点型的字符长度数据为8,则目标类型为字符型,且目标类型的字符长度数据为10。
54.在一些实施方式中,针对同一目标字段在不同版本中,目标字段的字段数据类型在一些版本中可以是字符型,目标字段的字段数据类型在一些版本中可以是日期型,若解析到日期型的字符长度数据为10,字符型的字符长度数据为$100,则目标类型为字符型,且目标类型的字符长度数据为100。
55.在一些实施方式中,在各字段数据类型属于不同的数据类型的情况下,该临床试验数据处理方法至少还包括以下之一。
56.在各字段数据类型中存在字符类型的情况下,设置目标类型为字符类型。或者
57.在各字段数据类型中存在不完整的第一日期类型和完整的第二日期类型的情况下,设置目标类型为字符类型。
58.具体地,在一些实施方式中,在各字段数据类型属于不同的数据类型的情况下,由于字符类型的兼容性比较强,因此可以将目标类型设置为字符类型。示例性地,不同的数据类型可以包括字符类型和日期类型,将目标类型设置为字符类型。示例性地,不同的数据类型可以包括字符类型、数值类型、日期类型,将目标类型设置为字符类型。示例性地,不同的数据类型可以包括数值类型、日期类型、整数类型,将目标类型设置为字符类型。
59.在一些实施方式中,不完整的第一日期类型可以是{yyyy}、{mm}、{dd}、{hh}中的任一种。完整的第二日期类型可以是{yyyy}-{mm}-{dd}、{yyyy}-{mm}-{dd}-{hh}中的任一种。在各字段数据类型中存在不完整的第一日期类型和完整的第二日期类型的情况下,设置目标类型为字符类型。示例性地,各字段数据类型中存在{yyyy}和{yyyy}-{mm}-{dd}。则可以设置目标字段的目标类型可以是$10字符型。
60.在一些实施方式中,在各字段数据类型属于不同的数据类型的情况下,根据各字段数据类型的字符长度数据,确定出最大范围的字符长度数据,至少可以包括以下之一。
61.在各字段数据类型中存在第一完整日期类型和第二完整日期类型的情况下,在第一完整日期类型的字符长度数据以及第二完整日期类型的字符长度数据中确定较大的字符长度数据,并作为最大范围的字符长度数据。或者
62.在各字段数据类型中存在第一数值类型和第二数值类型的情况下,在第一数值类型的整数长度与第二数值类型的整数长度中确定较大的目标整数长度,在第一数值类型的小数长度与第二数值类型的小数长度中确定较大的目标小数长度;并基于目标整数长度和目标小数长度确定最大范围的字符长度数据。
63.具体地,在各字段数据类型中存在第一完整日期类型和第二完整日期类型的情况下,获取第一完整日期类型的字符长度数据和第二完整日期类型的字符长度数据。比较第一完整日期类型的字符长度数据和第二完整日期类型的字符长度数据,在第一完整日期类型的字符长度数据以及第二完整日期类型的字符长度数据中确定较大的字符长度数据,并作为最大范围的字符长度数据。示例性地,第一完整日期类型可以是{yyyy}-{mm}-{dd};第二完整日期类型可以是{yyyy}-{mm}-{dd}-{hh};由于{yyyy}-{mm}-{dd}-{hh}的字符长度数据大于{yyyy}-{mm}-{dd}的字符长度数据,则设置第二完整日期类型为目录类型。
64.具体地,在各字段数据类型中存在第一数值类型和第二数值类型的情况下,获取第一数值类型的整数长度与第二数值类型的整数长度。比较第一数值类型的整数长度与第二数值类型的整数长度,在第一数值类型的整数长度与第二数值类型的整数长度中确定较大的目标整数长度。获取第一数值类型的小数长度与第二数值类型的小数长度,比较第一数值类型的小数长度与第二数值类型的小数长度,在第一数值类型的小数长度与第二数值类型的小数长度中确定较大的目标小数长度。从而基于目标整数长度和目标小数长度确定最大范围的字符长度数据。示例性地,第一数值类型可以是5.2;第二数值类型可以是4.6。5.2的整数长度为5,5.2的小数长度为2。4.6的整数长度为4,4.6的小数长度为6。由于5大于4,则目标类型的整数长度为5,由于6大于2,则目标类型的整数长度为6。因此,目标类型为5.6。
65.在一些实施方式中,目标变量在数据域表中对应有第一数据列和第二数据列,第一数据列用于存储目标临床试验数据。该临床试验数据处理方法还可以包括:以文本类型将源临床试验数据存储至第二数据列。
66.具体地,为了确保源临床试验数据的完整性和真实性,采用两种方式将录入的源临床试验数据均进行存储,在数据域表中生成与目标变量对应的第一数据列和第二数据列。因此,以目标类型将目标临床试验数据存储至数据域表的第一数据列,并以txt文本类型将源临床试验数据存储至数据域表的第二数据列。
67.在一些实施方式中,该临床试验数据处理方法还可以包括以下之一。
68.在接收到数据导出请求且数据导出请求携带文本类型的情况下,从数据域表中获取第一数据列下存储的数据。或者
69.在接收到数据导出请求且数据导出请求携带目标类型的情况下,从数据域表中获取第一数据列下存储的数据以及第二数据列下存储的数据。
70.其中,在数据域表中生成与目标变量对应的第一数据列和第二数据列,将目标临
床试验数据以目标类型存储至数据域表的第一数据列中,将源临床试验数据以txt文本类型存储至数据域表的第二数据列。具体地,针对对临床试验数据的导出需求,可以向用户提供导出不同临床试验数据的导出控件,比如第一导出控件和第二导出控件。在一些实施方式中,终端对第一导出控件进行监控,在监控到第一导出控件被触发的情况下,终端向服务器发送数据导出请求,数据导出请求携带有文本类型,则服务器从数据域表中获取第一数据列下存储的数据。在一些实施方式中,终端对第二导出控件进行监控,在监控到第二导出控件被触发的情况下,终端向服务器发送数据导出请求,数据导出请求携带有目标类型,则服务器从数据域表中从数据域表中获取第一数据列下存储的数据以及第二数据列下存储的数据。本实施方式中,实现从数据域表中灵活地导出两种不同格式的临床试验数据,满足用户的不同需求。
71.本说明书实施方式提供一种临床试验数据处理方法。该临床试验数据处理方法包括以下步骤。
72.s402、获取多个版本的源临床试验数据。
73.其中,源临床试验数据是分别通过不同版本的病例报告表采集而得到的,且源临床试验数据与病例报告表中的目标字段对应;其中,在病例报告表中目标字段设有对应的字段数据类型;
74.s404、根据目标字段在各版本病例报告表中的字段数据类型确定目标类型。
75.具体地,在一些实施方式中,对目标字段在各版本病例报告表中的字段数据类型进行解析,得到各字段数据类型的字符长度数据;基于各字段数据类型的字符长度数据,确定目标类型的字符长度范围。
76.在一些实施方式中,在各字段数据类型属于单一数据类型的情况下,将各字段数据类型的字符长度数据作为目标类型的字符长度范围。
77.在一些实施方式中,在各字段数据类型属于不同的数据类型的情况下,根据各字段数据类型的字符长度数据,确定出最大范围的字符长度数据;并将最大范围的字符长度数据作为目标类型的字符长度范围。
78.在一些实施方式中,在各字段数据类型中存在字符类型的情况下,设置目标类型为字符类型。
79.在一些实施方式中,在各字段数据类型中存在不完整的第一日期类型和完整的第二日期类型的情况下,设置目标类型为字符类型。
80.在一些实施方式中,在各字段数据类型中存在第一完整日期类型和第二完整日期类型的情况下,在第一完整日期类型的字符长度数据以及第二完整日期类型的字符长度数据中确定较大的字符长度数据,并作为最大范围的字符长度数据。
81.在一些实施方式中,在各字段数据类型中存在第一数值类型和第二数值类型的情况下,在第一数值类型的整数长度与第二数值类型的整数长度中确定较大的目标整数长度,在第一数值类型的小数长度与第二数值类型的小数长度中确定较大的目标小数长度;并基于目标整数长度和目标小数长度确定最大范围的字符长度数据。
82.s406、将各版本的源临床试验数据的数据类型由字段数据类型转换为目标类型,得到对应的目标临床试验数据。
83.其中,目标类型为能够适配目标字段在各版本病例报告表中的字段数据类型。
84.s408、以目标类型将目标临床试验数据与目标变量对应存储。其中,目标变量与目标字段具有映射关系。目标变量在数据域表中对应有第一数据列和第二数据列,第一数据列用于存储目标临床试验数据。
85.s410、以文本类型将源临床试验数据存储至第二数据列。
86.s412、在接收到数据导出请求且数据导出请求携带文本类型的情况下,从数据域表中获取第一数据列下存储的数据。
87.s414、在接收到数据导出请求且数据导出请求携带目标类型的情况下,从数据域表中获取第一数据列下存储的数据以及第二数据列下存储的数据。
88.应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
89.请参阅图4,本说明书实施方式提供了一种临床试验数据处理装置400。临床试验数据处理装置400包括源试验数据获取模块410、数据类型转换模块420以及目标数据存储模块430。
90.源试验数据获取模块410,用于获取多个版本的源临床试验数据;其中,源临床试验数据是分别通过不同版本的病例报告表采集而得到的,且源临床试验数据与病例报告表中的目标字段对应;其中,在病例报告表中目标字段设有对应的字段数据类型;
91.数据类型转换模块420,用于将各版本的源临床试验数据的数据类型由字段数据类型转换为目标类型,得到对应的目标临床试验数据;其中,目标类型为能够适配目标字段在各版本病例报告表中的字段数据类型;
92.目标数据存储模块430,用于以目标类型将目标临床试验数据与目标变量对应存储;其中,目标变量与目标字段具有映射关系。
93.关于临床试验数据处理装置的具体限定可以参见上文中对于临床试验数据处理方法的限定,在此不再赘述。上述临床试验数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
94.在一些实施方式中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过wifi、运营商网络、nfc(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种临床试验数据处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上
设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
95.本领域技术人员可以理解,图5中示出的结构,仅仅是与本说明书所公开方案相关的部分结构的框图,并不构成对本说明书所公开方案所应用于其上的计算机设备的限定,具体地,计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
96.在一些实施方式中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述实施方式中的方法步骤。
97.在一些实施方式中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施方式中的方法步骤。
98.在一些实施方式中,还提供一种计算机程序产品,所述计算机程序产品中包括指令,上述指令可由计算机设备的处理器执行时实现上述实施方式中的方法步骤。
99.本领域普通技术人员可以理解实现上述实施方式方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施方式的流程。其中,本说明所提供的各实施方式中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。
100.以上实施方式的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施方式中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
101.以上所述仅为本说明书的较佳实施方式而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所作的任何修改、等同替换等,均应包含在本说明书的保护范围之内。
技术特征:
1.一种临床试验数据处理方法,其特征在于,所述方法包括:获取多个版本的源临床试验数据;其中,所述源临床试验数据是分别通过不同版本的病例报告表采集而得到的,且所述源临床试验数据与所述病例报告表中的目标字段对应;其中,在所述病例报告表中所述目标字段设有对应的字段数据类型;将各版本的所述源临床试验数据的数据类型由所述字段数据类型转换为目标类型,得到对应的目标临床试验数据;其中,所述目标类型为能够适配所述目标字段在各版本所述病例报告表中的字段数据类型;以所述目标类型将所述目标临床试验数据与目标变量对应存储;其中,所述目标变量与所述目标字段具有映射关系。2.根据权利要求1所述的方法,其特征在于,在所述将各版本的所述源临床试验数据的数据类型由所述字段数据类型转换为目标类型之前,所述方法还包括:根据所述目标字段在各版本所述病例报告表中的字段数据类型确定所述目标类型。3.根据权利要求2所述的方法,其特征在于,所述根据所述目标字段在各版本所述病例报告表中的字段数据类型确定所述目标类型,包括:对所述目标字段在各版本所述病例报告表中的字段数据类型进行解析,得到各所述字段数据类型的字符长度数据;基于各所述字段数据类型的字符长度数据,确定所述目标类型的字符长度范围。4.根据权利要求3所述的方法,其特征在于,所述基于各所述字段数据类型的字符长度数据,确定所述目标类型的字符长度范围,至少包括以下之一:在各所述字段数据类型属于单一数据类型的情况下,将各所述字段数据类型的字符长度数据作为所述目标类型的字符长度范围;或者在各所述字段数据类型属于不同的数据类型的情况下,根据各所述字段数据类型的字符长度数据,确定出最大范围的字符长度数据;并将所述最大范围的字符长度数据作为所述目标类型的字符长度范围。5.根据权利要求4所述的方法,其特征在于,在各所述字段数据类型属于不同的数据类型的情况下,所述方法至少还包括以下之一:在各所述字段数据类型中存在字符类型的情况下,设置所述目标类型为字符类型;或者在各所述字段数据类型中存在不完整的第一日期类型和完整的第二日期类型的情况下,设置所述目标类型为字符类型。6.根据权利要求4所述的方法,其特征在于,所述在各所述字段数据类型属于不同的数据类型的情况下,根据各所述字段数据类型的字符长度数据,确定出最大范围的字符长度数据,至少包括以下之一:在各所述字段数据类型中存在第一完整日期类型和第二完整日期类型的情况下,在所述第一完整日期类型的字符长度数据以及所述第二完整日期类型的字符长度数据中确定较大的字符长度数据,并作为所述最大范围的字符长度数据;或者在各所述字段数据类型中存在第一数值类型和第二数值类型的情况下,在所述第一数值类型的整数长度与所述第二数值类型的整数长度中确定较大的目标整数长度,在所述第一数值类型的小数长度与所述第二数值类型的小数长度中确定较大的目标小数长度;并基
于所述目标整数长度和所述目标小数长度确定所述最大范围的字符长度数据。7.根据权利要求1所述的方法,其特征在于,所述目标变量在数据域表中对应有第一数据列和第二数据列,所述第一数据列用于存储所述目标临床试验数据;所述方法还包括:以文本类型将所述源临床试验数据存储至所述第二数据列。8.根据权利要求7所述的方法,其特征在于,所述方法还包括:在接收到数据导出请求且所述数据导出请求携带所述文本类型的情况下,从所述数据域表中获取所述第一数据列下存储的数据;或者在接收到数据导出请求且所述数据导出请求携带所述目标类型的情况下,从所述数据域表中获取所述第一数据列下存储的数据以及所述第二数据列下存储的数据。9.一种临床试验数据处理装置,其特征在于,所述装置包括:源试验数据获取模块,用于获取多个版本的源临床试验数据;其中,所述源临床试验数据是分别通过不同版本的病例报告表采集而得到的,且所述源临床试验数据与所述病例报告表中的目标字段对应;其中,在所述病例报告表中所述目标字段设有对应的字段数据类型;数据类型转换模块,用于将各版本的所述源临床试验数据的数据类型由所述字段数据类型转换为目标类型,得到对应的目标临床试验数据;其中,所述目标类型为能够适配所述目标字段在各版本所述病例报告表中的字段数据类型;目标数据存储模块,用于以所述目标类型将所述目标临床试验数据与目标变量对应存储;其中,所述目标变量与所述目标字段具有映射关系。10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。12.一种计算机程序产品,所述计算机程序产品中包括指令,其特征在于,所述指令被计算机设备的处理器执行时,使得所述计算机设备能够执行如权利要求1至8任一项所述的方法的步骤。
技术总结
本说明书实施方式提供一种临床试验数据处理方法、装置、计算机设备、存储介质及计算机程序产品。该方法通过获取多个版本的源临床试验数据,将各版本的源临床试验数据的数据类型由字段数据类型转换为目标类型,得到对应的目标临床试验数据,并以目标类型将目标临床试验数据与目标变量对应存储,从而目标临床试验数据能够适配于多个版本的源临床试验数据,实现各个版本源临床试验数据之间的数据兼容。各个版本源临床试验数据之间的数据兼容。各个版本源临床试验数据之间的数据兼容。
技术研发人员:邹兵 刘涛 李海为
受保护的技术使用者:浙江太美医疗科技股份有限公司
技术研发日:2021.12.14
技术公布日:2022/3/8