1.本说明书实施方式涉及临床试验数据处理技术领域,具体涉及一种临床试验数据存储方法、装置、计算机设备、存储介质及计算机程序产品。
背景技术:
2.电子数据采集(electronic data capture,edc)是一种基于计算机网络的用于临床试验数据采集的技术,通过软件、硬件、sop(standard operating procedure,标准操作规程)和人员配置的有机结合,以电子化的形式直接采集和传递临床数据。edc系统采用电子化病例报告表(electronic case report form)代替纸质病例报告表来对临床试验数据进行收集和管理。且临床试验的crf(case report form,病例报告表)是在临床试验中用以记录每一名受试者在试验过程中的症状、体征或试验室检查数据的文件。
3.在传统技术中,在电子数据采集系统中存在多个版本的电子化病例报告表。因此,在临床试验过程中会采用不同版本的电子化病例报告采集到格式多样化的临床试验数据。进一步地,为了评估临床试验方案,需要对采集到的临床试验数据进行分析,以完成对临床试验方案的评估。
4.然而,传统技术中格式多样化的临床试验数据会影响到临床试验数据的分析。
技术实现要素:
5.有鉴于此,本说明书实施方式致力于提供一种临床试验数据存储方法、装置、计算机设备、存储介质及计算机程序产品,以解决传统技术中格式多样化的临床试验数据影响临床试验数据分析准确性的技术问题。
6.本说明书实施方式提供了一种临床试验数据存储方法,所述方法包括:获取临床试验数据,其中,所述临床试验数据与目标表单的目标字段对应;其中,所述目标表单具有表单存储依赖关系,所述目标字段具有字段存储依赖关系;其中,所述表单存储依赖关系包括表单与数据域表之间的映射关系;所述字段存储依赖关系包括所述表单的字段与所述数据域表所包括的变量之间的映射关系;根据所述表单存储依赖关系,查询与所述目标表单对应的目标数据域表;基于所述字段存储依赖关系,确定与所述目标字段对应的目标变量;将所述临床试验数据存储至与所述目标数据域表的目标变量对应的数据列内。
7.本说明书实施方式提供一种临床试验数据存储装置,所述装置包括:临床数据获取模块,用于获取临床试验数据,其中,所述临床试验数据与目标表单的目标字段对应;其中,所述目标表单具有表单存储依赖关系,所述目标字段具有字段存储依赖关系;其中,所述表单存储依赖关系包括表单与数据域表之间的映射关系;所述字段存储依赖关系包括所述表单的字段与所述数据域表所包括的变量之间的映射关系;数据域表查询模块,用于根据所述表单存储依赖关系,查询与所述目标表单对应的目标数据域表;目标变量确定模块,用于基于所述字段存储依赖关系,确定与所述目标字段对应的目标变量;临床数据存储模块,用于将所述临床试验数据存储至与所述目标数据域表的目标变量对应的数据列内。
8.本说明书实施方式提供一种计算设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述实施方式中的方法步骤。
9.本说明书实施方式提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施方式中的方法步骤。
10.本说明书实施方式提供一种计算机程序产品,所述计算机程序产品中包括指令,所述指令被计算机设备的处理器执行时,使得所述计算机设备能够执行上述实施方式中的方法步骤。
11.本说明书实施方式,通过获取临床试验数据,并根据表单存储依赖关系和字段存储依赖关系确定与所述目标表单对应的目标数据域表以及与所述目标字段对应的目标变量,从而将获取的临床试验数据存储至所述目标变量对应的数据列内,实现将与同一表单对应的格式多样化的临床试验数据存储至同一数据域表中,避免传统技术中格式多样化的临床试验数据对临床试验数据分析的影响。
附图说明
12.图1所示为一实施方式提供的临床试验数据存储方法的应用环境图;
13.图2a所示为一实施方式提供的临床试验数据存储方法的流程示意图;
14.图2b所示为一实施方式提供的生命体征表单的录入页面的示意图;
15.图3所示为一实施方式提供的临床试验数据存储方法的流程示意图;
16.图4a所示为一实施方式提供的表单配置页面的示意图;
17.图4b所示为一实施方式提供的字段配置页面的示意图;
18.图4c为一实施方式提供的临床试验数据存储装置的结构框图;
19.图5为一实施方式提供的计算机设备的内部结构图。
具体实施方式
20.下面将结合本说明书实施方式中的附图,对本说明书实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅是本说明书一部分实施方式,而不是全部的实施方式。基于本说明书中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本说明书保护的范围。
21.以下对本说明书中涉及的部分名词进行解释,药物的临床试验指的是在人体进行的药物系统性研究,以确定药物的疗效和安全性。药物临床试验阶段分为i期、ii期、iii期临床试验、iv期临床试验。i期主要是涉及初步的临床药理学及人体安全性评价试验。ii期可以理解为治疗作用初步评价阶段,主要涉及初步评价药物对目标适应症患者的治疗作用和安全性,也包括为iii期临床试验研究设计和给药剂量方案的确定提供依据。iii期可以理解为治疗作用确证阶段,主要进一步验证药物对目标适应症患者的治疗作用和安全性,评价利益与风险关系,最终为药物注册申请的审查提供充分的依据。iv期主要是药物上市后的临床试验,在药物上市后,可以继续追踪在广泛使用条件下的药物的疗效和不良反应,以评价在普通或者特殊人群中使用的利益与风险关系以及改进给药剂量等。
22.在临床试验过程中,可以按照临床试验方案制定设定病例报告表(case report form,crf),用于记录每一名受试者在试验过程中的临床试验数据。病例报告表包括人口学
属性表单、不良事件表单、合并/既往用药表单、pk样本采集表单、既往病史数据表单、献血史表单、过敏史表单、给药记录表单、凝血功能表单、尿常规表单、血常规表单等。
23.请参阅图1,本说明书实施方式提供一种临床试验数据存储系统,且本说明书提供的临床试验数据存储方法应用于该临床试验数据存储系统。该临床试验数据存储系统可以包括由终端110和服务器120形成的硬件环境。终端110通过网络与服务器120进行通信。服务器120获取临床试验数据,其中,临床试验数据与目标表单的目标字段对应;其中,目标表单具有表单存储依赖关系,目标字段具有字段存储依赖关系;其中,表单存储依赖关系包括表单与数据域表之间的映射关系;字段存储依赖关系包括表单的字段与数据域表所包括的变量之间的映射关系。服务器120根据表单存储依赖关系,查询与目标表单对应的目标数据域表;并基于字段存储依赖关系,在目标数据域表所包括的变量中,确定与目标字段对应的目标变量;从而将临床试验数据存储至目标变量对应的数据列内。
24.其中,终端110可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。随着科学技术的发展,可能会出现一些新型计算设备,比如量子计算服务器,这些新型计算设备也可以应用于本说明书的实施方式中。
25.请参阅图2a,本说明书实施方式提供一种临床试验数据存储方法。该临床试验数据存储方法包括以下步骤。
26.s210、获取临床试验数据。
27.其中,临床试验数据与目标表单的目标字段对应。其中,目标表单具有表单存储依赖关系,目标字段具有字段存储依赖关系。其中,表单存储依赖关系包括表单与数据域表之间的映射关系。字段存储依赖关系包括表单的字段与数据域表所包括的变量之间的映射关系。
28.其中,目标表单可以是用于采集临床试验数据的页面。目标表单可以是病例报告表所采用的表单,比如生命体征表单、人口资料表单等。字段可以是数据库中目标表单的数据列。目标字段可以是目标表单中所包括的数据项,比如检查项、测量结果、身高、体重等。一般情况下,通过edc系统采集临床试验数据。其中,edc(electronic data capture system,电子数据捕获系统)是适用于临床试验数据采集和传输的平台软件。edc系统的基本功能主要包含ecrf构建、数据保存和稽查轨迹、自动核查、数据质疑管理、源数据核查确认、电子签名、数据库的锁定、数据存储和导出等功能。通过edc系统采集的临床试验数据可以存储至源数据库中。一方面,源数据库中存储的临床试验数据并不能直接用于临床试验数据分析,另一方面,源数据库中存储的临床试验数据并不能满足药政监管部门所要求的数据格式。进一步地,临床试验数据的规范化和标准化可推动和提高实际工作的效率和可靠性。因此,若干生物技术和药物开发公司组建了cdisc(the clinical data interchange standards consortium,临床数据交换标准协会)。cdisc提出了临床试验数据的递交标准sdtm(study data tabulation mode,研究数据表格格式)。药政监管部门要求按照sdtm格式提交临床试验数据,以帮助其对安全性数据和功效数据实施审查和批准。因此需要对源数据库中的临床试验数据进行清洗,以新的数据格式存储临床试验数据。数据域表即为用于存储映射处理后的临床试验数据的表单。
29.因此,在一些实施方式中,可以间接地将edc系统采集的临床试验数据写入数据域
表中。具体地,首先,将edc系统采集的临床试验数据存储至源数据库中,为了满足sdtm格式要求或者临床试验数据分析的需求,需要对采集的临床试验数据进行重新存储,接着,从源数据库中读取临床试验数据。
30.在一些实施方式中,临床试验数据是基于终端发生的数据录入操作所产生的。其中,数据录入操作发生在病例报告表的录入页面中。可以直接地将edc系统采集的临床试验数据写入数据域表中。具体地,终端展示病例报告表的录入页面,通过病例报告表的录入页面响应于对临床试验数据的录入操作,终端向服务器发送数据录入请求,数据录入请求中携带有临床试验数据,即服务器接收到临床试验数据。示例性地,请参阅图2b,目标表单可以是生命体征表单,终端展示生命体征表单,以采集与生命体征相关的临床试验数据。生命体征表单可以包括目标字段,目标字段可以是检查日期、时间点、检查项、测量结果和单位中的至少一个。用户通过展示的生命体征表单输入检查日期、时间点、检查项、测量结果和单位等临床试验数据。终端传送临床试验数据至服务器,服务器接收到临床试验数据。
31.s220、根据表单存储依赖关系,查询与目标表单对应的目标数据域表。
32.其中,在设计病例报告表时,需要配置多个版本的表单。根据各个版本的表单的数据结构生成可以兼容多个版本表单的数据域表。在利用不同版本表单采集临床试验数据时,由于数据域表中包括与各版本表单的字段对应的变量,因此,数据域表可以存储多个不同版本表单采集的临床试验数据。
33.其中,在设计病例报告表时,需要配置多个表单。如前文,表单用于采集临床试验数据,为表单配置一个数据域表,用于存储通过该表单采集的临床试验数据。可见,表单存储依赖关系可以理解为在设计病例报告表时预先配置的数据域表与表单之间的对应关系,以将表单采集的临床试验数据存储至数据域表。具体地,在获取到临床试验数据后,可以确定获取到的临床试验数据所对应的目标表单。根据目标表单在表单存储依赖关系中进行查询,得到与目标表单对应的目标数据域表。
34.s230、基于所述字段存储依赖关系,确定与所述目标字段对应的目标变量。
35.s240、将所述临床试验数据存储至与所述目标数据域表的目标变量对应的数据列内。
36.其中,在设计病例报告表所使用的表单时,需要配置表单使用的数据项(即字段),为字段配置一个对应的变量。字段属于当前表单,则与字段对应的变量属于与当前表单对应的数据域表。数据域表中的变量可以是数据域表中与表单中字段对应的数据列。具体地,在获取到临床试验数据后,可以确定获取到的临床试验数据所对应的目标字段。在查询到目标数据表后,目标数据域表包括若干个变量,则在目标数据域表所包括的变量中,根据目标字段在字段存储依赖关系中进行查询,确定与目标字段对应的目标变量。进一步地,目标变量可以是数据域表的一数据列,将获取到的临床试验数据对应地存储至目标变量对应的数据列内。
37.上述临床试验数据存储方法,通过获取临床试验数据,并根据表单存储依赖关系和字段存储依赖关系确定与目标表单对应的目标数据域表以及与目标字段对应的目标变量,从而将获取的临床试验数据存储至目标变量对应的数据列内,实现将与同一表单对应的格式多样化的临床试验数据存储至同一数据域表中,避免传统技术中格式多样化的临床试验数据对临床试验数据分析的影响。进一步地,在传统技术中,通过edc系统设计不同版
本的病例报告表,利用不同版本的病例报告表采集临床试验数据,各版本的病例报告表对应有不同的表单和不同的字段,通过本实施方式中的存储方法,这些不同的表单可以映射至不同数据域表,表单所包括的字段可以映射至与表单对应的数据域表中,在数据域表中包括与各字段对应的变量,实现将各版本表单的不同字段映射为数据域表中的变量,将通过各版本表单采集的临床试验数据均可以以数据记录(或者行)形式存储在数据域表中。
38.在一些实施方式中,请参阅图3,获取临床试验数据,包括以下步骤。
39.s310、获取临床试验项目的项目标识和运行环境标识。
40.s320、根据项目标识和运行环境标识从对应的临床试验数据集合中获取临床试验数据。
41.其中,运行环境标识为用于在临床试验项目的研究过程中采集临床试验数据的运行环境的标识。针对临床试验项目,可以为其部署多个运行环境,比如正式运行环境和测试运行环境。各运行环境具有相互独立的数据库,数据库中存储有临床试验数据集合。各运行环境具有各自的运行环境标识,临床试验项目具有项目标识。
42.具体地,在已经通过edc系统采集了至少部分临床试验数据的情况下,需要对采集的至少部分临床试验数据进行清洗并存储。根据临床试验项目的项目标识和运行环境标识在对应的数据库中进行查询,得到各草案、各版本病例报告表、各访视、各表单下的临床试验数据。进一步地,在一些实施方式中,由于各表单预先配置有表单存储依赖关系,表单存储依赖关系包括表单与数据域表之间的映射关系,因此,获取各表单对应的数据域表,按照数据域表对获取的临床试验数据进行划分。
43.本实施方式中,根据项目标识和运行环境标识查找临床试验项目在运行环境中产生的临床试验数据,并可以将查询得到的临床试验数据对应地存储至各数据域表中,为临床试验数据的分析提供便利,提升临床试验数据分析的效率和准确性。
44.在一些实施方式中,将临床试验数据存储至目标变量对应的数据列内,至少包括以下之一:在目标字段的记录类型为单记录类型的情况下,将单记录的临床试验数据存储至目标变量对应的数据列下的一行内。或者,在目标字段的记录类型是多记录类型的情况下,将多记录的临床试验数据存储至目标变量对应的数据列下的多行内。
45.其中,记录类型可以是目标字段在数据采集界面呈现方式。单记录类型可以采用字段平铺在录入界面的形式,每个字段在页面中占用一行,如人口资料学,不良事件询问问题等。多记录类型可以采用纵向结构形式的形式,每个字段一列,可以设置固定显示若干行,或者允许用户手动添加,如固定行的生命体征、体格检查表格、不良事件详细信息等。
46.具体地,在一些实施方式中,终端的录入界面中展示单记录类型的目标字段,接收输入的单记录的临床试验数据,服务器获取到单记录的临床试验数据,将单记录的临床试验数据存储至目标变量对应的数据列下的一行内。
47.在一些实施方式中,终端的录入界面中展示多记录类型的目标字段,接收输入的多记录的临床试验数据,服务器获取到多记录的临床试验数据,将多记录的临床试验数据存储至目标变量对应的数据列下的多行内。其中,临床试验数据的行数与目标字段所包括的字典项的数量相等。需要说明的是,目标字段所包括的各字典项对应一个目标变量,各字典项对应的输入数据对应另一个目标变量。以多行记录的形式将多记录的临床试验数据对应地存储至数据域表的变量下。
48.本实施方式中,通过单记录或者多记录将采集到的临床试验数据存储至临床试验数据。在传统技术中,单记录类型的目标字段的字段名称作为源数据库的数据列,单记录类型的目标字段的内容数据作为对应数据列下存储的数据。同样地,多记录类型的目标字段所涉及的各字典项作为源数据库的数据列,各字典项的内容数据作为对应数据列下存储的数据。可见,在传统技术中,单记录或者多记录的临床试验数据在源数据库中以行的形式存在,通过本实施方式中的存储方法,实现以列的形式存储单记录或者多记录的临床试验数据。
49.在一些实施方式中,在获取临床试验数据之前,该方法还包括:获取病例报告表的配置数据;根据表单存储依赖关系进行查询,得到数据域表的域名称;基于域名称,生成若干张数据域表;根据字段存储依赖关系进行查询,得到数据域表所包括的变量的变量名称;基于变量名称生成数据域表的数据列。
50.其中,配置数据可以是在设计病例报告表的过程中所产生的。配置数据可以涉及到病例报告表所用到的表单、字段、单位、字典项等。配置数据也可以涉及到病例报告表所用到的表单所对应的数据域表(sas dataset name)、表单中字段所对应的变量名(sas field name)。配置数据中包括表单存储依赖关系和字段存储依赖关系。表单存储依赖关系包括表单与数据域表之间的映射关系。字段存储依赖关系包括表单的字段与数据域表所包括的变量之间的映射关系。在一些实施方式中,表单存储依赖关系定义了表单a与数据域表d之间的映射关系,字段存储依赖关系定义了表单a中的字段x与变量y之间的映射关系,字段x从属于表单a,在与字段x具有映射关系的变量y可以从属于与表单a具有映射关系的数据域表d。
51.在一些实施方式中,终端提供病例报告表的配置页面。在病例报告表的配置页面中提供有表单配置控件和字段配置控件。响应于对表单配置控件的触发操作,展示表单配置页面(请参阅图4a)。在表单配置页面中接收配置的表单存储依赖关系,向服务器发送表单配置请求,表单配置请求中包括表单的唯一标识(oid)、表单的名称(form name)、数据域表的名称(sas dataset name)。服务器在表单和数据域表之间建立表单存储依赖关系。响应于对字段配置控件的触发操作,展示字段配置页面(请参阅图4b)。在字段配置页面中接收配置的字段存储依赖关系,向服务器发送字段配置请求,字段配置请求中包括字段的唯一标识(oid)、字段的名称(item name)、变量的名称(sas field name)。服务器在表单的字段与数据域表所包括的变量之间建立字段存储依赖关系。可见,服务器中存储有病例报告表的配置数据,比如表单存储依赖关系和字段存储依赖关系。
52.在一些实施方式中,为了将各个版本病例报告表所采集的临床试验数据分别对应地存储至数据域表,需要构建与病例报告表中表单对应的数据域表。首先,根据项目标识和运行环境标识获取对应的配置数据,配置数据包括单存储依赖关系。根据表单存储依赖关系进行查询,得到数据域表的域名称(sas dataset name),生成与域名称对应的数据域表。在生成数据域表之后,需要定义数据域表中的数据列。根据字段存储依赖关系进行查询,得到与表单的名称对应的变量名称(sas field name),变量名称为数据域表所包括的变量的名称。因此,在数据域表中生成数据域表的数据列,且数据列对应的字段名称采用变量名称。
53.本实施方式中,通过根据病例报告表的配置数据生成数据域表,为实现将各版本
表单的不同字段映射为数据域表中的变量提供基础,从而可以将各版本表单采集的临床试验数据以数据记录(或者行)形式存储在数据域表中。
54.在一些实施方式中,该方法还包括:在监测到病例报告表的发版操作的情况下,基于新发版的病例报告表的配置数据,执行更新数据域表的表结构、增加新的数据域表中的任一个操作。
55.具体地,在edc系统内,每一个临床试验项目具有一个正式环境和多个测试环境。正式环境用于录入正式试验产生的受试者数据,测试环境可以用于在临床试验项目上线前录入临床试验项目的测试数据。正式环境与多个测试环境之间的数据都是互相独立的。edc系统中临床试验方案的病例报告表具有两个版本:ecrf版本和crf版本。ecrf版本为建库时草案发布的版本,crf版本为在临床试验方案中新建的版本。当一个草案配置完成,发布对应的病例报告表,服务器接收到病例报告表的发版请求,即可监控到病例报告表的发版操作。数据域表可以对应有一个结构数据表(data structure)。结构数据表存储有各数据域表的名称和数据域表的字段。在一些实施方式中,在监控到病例报告表的发版操作时,结构数据表中的数据发生变化。从结构数据表中获取发生变化的部分数据域表,基于发生变化的部分数据域表,更新数据域表的表结构。在一些实施方式中,在监控到病例报告表的发版操作时,发现新增有数据域表,基于新的数据域表的配置数据,生成新的数据域表。
56.在一些实施方式中,在监测到病例报告表的发版操作的情况下,数据域表发生更新的情形至少包括以下之一:删除原有数据域表;或,增加新的数据域表;或,在数据域表中增加列数据;或,在数据域表中增加行数据。
57.本实施方式中,通过对病例报告表的发版操作进行监控,可以及时更新数据域表,实现对数据域表的动态更新,确保可以及时地提供存储临床试验数据的数据库表,从而保证临床试验数据分析的需求。
58.在一些实施方式中,数据域表包括固定数据列和动态数据列。在基于变量名称生成数据域表的数据列之前,该方法还包括:基于预先配置的固定数据列的变量名称,生成数据域表的固定数据列。相应地,基于变量名称生成数据域表的数据列,包括:基于变量名称生成数据域表的动态数据列。
59.其中,固定数据列可以包括保持不变的主键、冗余列和公共列。冗余列可以包括租户id、项目id、运行环境id、crf版本id、受试者id、方式id、表单id中的至少一项。公共列可以包括研究中心、中心编号、项目名称、方案编号、受试者状态、数据库版本、访视名称、访视oid、表单oid、页面名称、页面签名、页面冻结、页面锁定、页面最近的修改者、页面第一次保存时间、页面最近修改时间、记录号中的至少一项。
60.具体地,在一些实施方式中,临床试验项目的研究可以在不同的运行环境中执行,根据临床试验项目的项目标识和运行环境标识在源数据库中查询数据域表名称,数据域表名称的数量决定了生成数据域表的数量。基于查询到的数据域表名称生成对应的数据域表,且生成的数据域表采用数据域表名称进行命名。
61.可以预先配置有固定数据列的变量名称,基于固定数据列的变量名称生成数据域表的固定数据列。针对不同的临床试验项目,可以具有多个数据域表,各数据域表分别具有固定数据列。每个临床试验项目会设计病例报告表,病例报告表包括若干个表单,各表单包括若干字段。各表单对应有数据域表名称,各字段对应有变量名称。
62.针对不同的临床试验项目,可以配置不同的病例报告表,不同的病例报告表涉及到不同的表单、不同的字段。在同一临床试验项目的不同版本的病例报告表中,也会涉及到不同的表单、不同的字段。可见,病例报告表涉及的字段会随着不同的临床试验项目动态变化,也会随着病例报告表的不同版本动态变化。因此,将与病例报告表涉及的字段对应的变量称之为动态变量。在生成数据域表之后,查询与数据源表对应的字段。进一步地,基于字段存储依赖关系确定数据域表所包括的变量的变量名称,从在数据域表中生成动态数据列,动态数据列的列明采用字段存储依赖关系中定义的变量名称。
63.本实施方式中,基于预先配置的固定数据列的变量名称和与字段对应的变量名称确定数据域表的结构,数据域表包括固定数据列和动态数据列,基于预先配置的表单存储依赖关系和字段存储依赖关系将采集的临床试验数据映射至数据域表中,以确保存储至数据域表中的临床试验数据的灵活性和准确性。
64.在一些实施方式中,该方法还包括:在检测到目标字段对应有属性数据的情况下,基于目标字段对应的属性数据生成数据域表的扩展数据列。
65.其中,属性数据包括目标字段的单位数据、字典数据中的至少一个。扩展数据列可以是用于存储字段的属性数据的数据列。部分字段具有属性数据,部分字段不具有属性数据。具体地,对目标字段是否具有属性数据进行检测,若检测到目标字段具有属性数据,需要将属性数据对应地存储至数据域表中。因此,在数据域表中生成与目标字段的属性数据对应的扩展数据列。
66.本实施方式中,除固定数据列和动态数据列之外,数据域表还包括扩展数据列,用于存储字段的属性数据,以确保存储至数据域表中的临床试验数据的完整性和准确性。
67.本说明书实施方式提供一种临床试验数据存储方法,该临床试验数据存储方法包括以下步骤。
68.s402、获取病例报告表的配置数据。
69.其中,配置数据中包括表单存储依赖关系和字段存储依赖关系;其中,表单存储依赖关系包括表单与数据域表之间的映射关系;字段存储依赖关系包括表单的字段与数据域表所包括的变量之间的映射关系。
70.s404、根据表单存储依赖关系进行查询,得到数据域表的域名称。
71.s406、基于域名称,生成若干张数据域表。
72.s406、基于预先配置的固定数据列的变量名称,生成数据域表的固定数据列。
73.s408、根据字段存储依赖关系进行查询,得到数据域表所包括的变量的变量名称。
74.s410、基于变量名称生成数据域表的动态数据列。
75.s412、获取临床试验项目的项目标识和运行环境标识。
76.其中,运行环境标识为用于在临床试验项目的研究过程中采集临床试验数据的运行环境的标识。
77.s414、根据项目标识和运行环境标识从对应的临床试验数据集合中获取临床试验数据。
78.s416、根据表单存储依赖关系,查询与目标表单对应的目标数据域表。
79.s418、基于字段存储依赖关系,在目标数据域表所包括的变量中,确定与目标字段对应的目标变量。
80.s420、将临床试验数据存储至目标变量对应的数据列内。
81.具体地,在目标字段的记录类型为单记录类型的情况下,将单记录的临床试验数据存储至目标变量对应的数据列下的一行内。或者
82.在目标字段的记录类型是多记录类型的情况下,将多记录的临床试验数据存储至目标变量对应的数据列下的多行内;其中,临床试验数据的行数与目标字段所包括的字典项的数量相等。
83.s422、在监测到病例报告表的发版操作的情况下,基于新发版的病例报告表的配置数据,执行更新数据域表的表结构、增加新的数据域表中的任一个操作。
84.应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
85.请参阅图4c,本说明书实施方式提供了一种临床试验数据存储装置400。临床试验数据存储装置400包括临床数据获取模块410、数据域表查询模块420、目标变量确定模块430以及临床数据存储模块440。
86.临床数据获取模块410,用于获取临床试验数据,其中,临床试验数据与目标表单的目标字段对应;其中,目标表单具有表单存储依赖关系,目标字段具有字段存储依赖关系;其中,表单存储依赖关系包括表单与数据域表之间的映射关系;字段存储依赖关系包括表单的字段与数据域表所包括的变量之间的映射关系;
87.数据域表查询模块420,用于根据表单存储依赖关系,查询与目标表单对应的目标数据域表;
88.目标变量确定模块430,用于基于所述字段存储依赖关系,确定与所述目标字段对应的目标变量;
89.临床数据存储模块440,用于将所述临床试验数据存储至与所述目标数据域表的目标变量对应的数据列内。
90.关于临床试验数据存储装置的具体限定可以参见上文中对于临床试验数据存储方法的限定,在此不再赘述。上述临床试验数据存储装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
91.在一些实施方式中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过wifi、运营商网络、nfc(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现
一种临床试验数据存储方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
92.本领域技术人员可以理解,图5中示出的结构,仅仅是与本说明书所公开方案相关的部分结构的框图,并不构成对本说明书所公开方案所应用于其上的计算机设备的限定,具体地,计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
93.在一些实施方式中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述实施方式中的方法步骤。
94.在一些实施方式中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施方式中的方法步骤。
95.在一些实施方式中,还提供一种计算机程序产品,所述计算机程序产品中包括指令,上述指令可由计算机设备的处理器执行时实现上述实施方式中的方法步骤。
96.本领域普通技术人员可以理解实现上述实施方式方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施方式的流程。其中,本说明所提供的各实施方式中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。
97.以上实施方式的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施方式中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
98.以上所述仅为本说明书的较佳实施方式而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所作的任何修改、等同替换等,均应包含在本说明书的保护范围之内。
技术特征:
1.一种临床试验数据存储方法,其特征在于,所述方法包括:获取临床试验数据;其中,所述临床试验数据与目标表单的目标字段对应;其中,所述目标表单具有表单存储依赖关系,所述目标字段具有字段存储依赖关系;其中,所述表单存储依赖关系包括表单与数据域表之间的映射关系;所述字段存储依赖关系包括所述表单的字段与所述数据域表所包括的变量之间的映射关系;根据所述表单存储依赖关系,查询与所述目标表单对应的目标数据域表;基于所述字段存储依赖关系,确定与所述目标字段对应的目标变量;将所述临床试验数据存储至与所述目标数据域表的目标变量对应的数据列内。2.根据权利要求1所述的方法,其特征在于,所述获取临床试验数据,包括:获取临床试验项目的项目标识和运行环境标识;其中,所述运行环境标识为用于在所述临床试验项目的研究过程中采集所述临床试验数据的运行环境的标识;根据所述项目标识和所述运行环境标识从对应的临床试验数据集合中获取所述临床试验数据。3.根据权利要求1所述的方法,其特征在于,所述临床试验数据是基于终端发生的数据录入操作所产生的;其中,所述数据录入操作发生在病例报告表的录入页面中。4.根据权利要求1至3任一项所述的方法,其特征在于,所述将所述临床试验数据存储至所述目标变量对应的数据列内,至少包括以下之一:在所述目标字段的记录类型为单记录类型的情况下,将单记录的临床试验数据存储至所述目标变量对应的数据列下的一行内;或者在所述目标字段的记录类型属于多记录类型的情况下,将多记录的临床试验数据存储至所述目标变量对应的数据列下的多行内;其中,所述临床试验数据的行数与所述目标字段所包括的字典项的数量相等。5.根据权利要求1至3任一项所述的方法,其特征在于,在所述获取临床试验数据之前,所述方法还包括:获取病例报告表的配置数据,其中,所述配置数据中包括所述表单存储依赖关系和所述字段存储依赖关系;根据所述表单存储依赖关系进行查询,得到所述数据域表的域名称;基于所述域名称,生成若干张所述数据域表;根据所述字段存储依赖关系进行查询,得到所述数据域表所包括的变量的变量名称;基于所述变量名称生成所述数据域表的数据列。6.根据权利要求5任一项所述的方法,其特征在于,所述方法还包括:在监测到病例报告表的发版操作的情况下,基于新发版的病例报告表的配置数据,执行更新所述数据域表的表结构、增加新的数据域表中的任一个操作。7.根据权利要求5所述的方法,其特征在于,所述数据域表包括固定数据列和动态数据列;在所述基于所述变量名称生成所述数据域表的数据列之前,所述方法还包括:基于预先配置的固定数据列的变量名称,生成所述数据域表的固定数据列;相应地,所述基于所述变量名称生成所述数据域表的数据列,包括:基于所述变量名称生成所述数据域表的动态数据列。8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
在检测到所述目标字段对应有属性数据的情况下,基于所述目标字段对应的属性数据生成所述数据域表的扩展数据列;其中,所述属性数据包括所述目标字段的单位数据、字典数据中的至少一个。9.一种临床试验数据存储装置,其特征在于,所述装置包括:临床数据获取模块,用于获取临床试验数据,其中,所述临床试验数据与目标表单的目标字段对应;其中,所述目标表单具有表单存储依赖关系,所述目标字段具有字段存储依赖关系;其中,所述表单存储依赖关系包括表单与数据域表之间的映射关系;所述字段存储依赖关系包括所述表单的字段与所述数据域表所包括的变量之间的映射关系;数据域表查询模块,用于根据所述表单存储依赖关系,查询与所述目标表单对应的目标数据域表;目标变量确定模块,用于基于所述字段存储依赖关系,确定与所述目标字段对应的目标变量;临床数据存储模块,用于将所述临床试验数据存储至与所述目标数据域表的目标变量对应的数据列内。10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。12.一种计算机程序产品,所述计算机程序产品中包括指令,其特征在于,所述指令被计算机设备的处理器执行时,使得所述计算机设备能够执行如权利要求1至8任一项所述的方法的步骤。
技术总结
本说明书实施方式提供一种临床试验数据存储方法、装置、计算机设备、存储介质及计算机程序产品。该方法通过获取临床试验数据,并根据表单存储依赖关系和字段存储依赖关系确定与所述目标表单对应的目标数据域表以及与所述目标字段对应的目标变量,从而将获取的临床试验数据存储至所述目标变量对应的数据列内,实现将与同一表单对应的格式多样化的临床试验数据存储至同一数据域表中,避免传统技术中格式多样化的临床试验数据对临床试验数据分析的影响。析的影响。析的影响。
技术研发人员:邹兵 刘涛 李海为
受保护的技术使用者:浙江太美医疗科技股份有限公司
技术研发日:2021.12.14
技术公布日:2022/3/8