1.本发明涉及本发明涉及医学知识图谱技术领域,尤其涉及一种高血压药物治疗知识图谱构建方法以及装置。
背景技术:
2.长期以来,高血压已成为我国人群中最常见的慢病之一,位列“三高”之首。在高血压慢病问诊过程中,患者需要提供各项病历资料和检查资料来辅助医生作诊断决策,在临床上会花费医生大量的问诊时间,因此需要借用问诊系统来解决患者病历资料的采集问题。同时在临床决策时,高血压专家还需要了解患者日常的血压情况,而多数患者都是独立记录血压情况,存在规范不统一和反馈不及时的问题,因此需要借用血压监测系统来解决患者日常血压情况的监测问题。
3.目前市面上多数问诊服务系统的关注点主要在于非特定疾病的问诊上,仅收集面向粗粒度的病历资料,对数据的归一和对齐性差,不能形成统一的结构化数据,从而无法构建出合理的知识图谱,更缺乏专注于高血压领域个性化的问诊与管理。
技术实现要素:
4.本发明的目的是提供一种面向高血压领域的慢病管理智能服务系统,用以解决现有技术中的一个或多个技术问题,通过人机对话系统进行个性化问诊信息收集并划分患者的心血管风险水平,同时监测并周期性采集患者的血压情况,从而优化高血压问诊流程,有效辅助高血压临床决策,既减轻了医生的工作负担,又改善了患者的看病体验,并且保障了病患信息收集的质量。
5.一种基于人机交互的高血压慢病管理智能服务系统,主要包括信息输入层、数据处理层、数据存储层和信息反馈层,当数据流进入后,依次经过上述四个模块层处理,其特征在于:
6.信息输入层,用于对语音和文字数据处理,形成系统可以识别使用的粗数据;
7.数据处理层,对粗数据进行加工处理,并能将加工处理的结果反馈给信息输入层和数据存储层;
8.数据存储层,上述两层形成的数据进行保存;
9.信息反馈层,用于将数据反馈给用户验证下载或提供给相关机构验证交流。
10.进一步,所述信息输入层包括语言识别层、文字转化层和信息录入层,所述信息输入层的数据采集客户端为人机对答、微信小程序录入或app输入,当采用语音录入时,主要通过语言识别层,对所录入的语言进行识别,再次通过文字转化层,将语音转成文字,加工形成数据包,最后再经过信息录入层,将所获得的粗数据包录入到系统中。
11.进一步,所述数据处理层,将所述粗数据的结果一部分反馈给信息输入层,用于提高语音识别效率和准确度,另一部分将结果提供给下一层存储,供重复使用,所述数据处理层的处理流程,主要包括:
12.a)建立索引:建立uuid,以保证在空间和时间上的唯一性,对所述粗数据建立唯一对应的uuid;
13.b)将粗数据内的信息进行数据归一化处理,对其中的不规范、不准确的用词进行归一化处理,以确保粗数据的内词语对齐,以备后期逻辑判断提供数据清洗和准备工作;
14.c)对步骤b的清洗、对齐的粗数据对应到现有数据判断模型,获得录入数据的判断结果,形成精细数据;
15.d)对步骤c所形成的精细数据进行整理,将所述精细数据中的实体、属性和关系抽象出来,构建和完善知识图谱。
16.进一步,所述现有数据判断模型为之前系统已有判断的数据结果,所述数据结果的获得是通过机器学习算法形成,所述的机器学习算法为决策树或贝叶斯分类算法。
17.进一步,如果所述步骤c的形成的数据在数据判断模型中未找到完全匹配的数据判断结果,则将该数据置为待处理状态,通过人工对数据进行核实标引,给出正确的判断结果,并将判断所依据的数据包和结果补充到现有数据判断模型中。
18.进一步,所述粗数据经数据处理层处理后,还将形成的现有归一化信息处理的词语结果、数据判断模型以及知识图谱反馈到qa模型中,并将辅助诊断结果对应到相应的任务中,还可以将词语结果、数据判断模型以及知识图谱应用到人机智能对话中,为用户提供更人性化的服务和诊断参考报告。
19.进一步,所述数据存储层,对之前各步骤形成的数据进行保存,在数据存储时,对结构数据可以直接存入到数据库中对非结构数据则经过数据归一、对齐,整理成结构化数据,然后再存入到数据库中。
20.进一步,所述数据存储层,通过对结构化数据和非结构化数据进行归纳,还形成系统内部的标准化词库和关键词映射表,用于进一步规范化数据处理层的归一化信息。
21.进一步,所述标准化词库,是指将系统所用术语进行规范,其包含规范的中文词名和英文词名,以及相关释义,避免引起歧义;所述关键词映射表,是将多个日常书写和用语中的词语与标准化词库中词语进行多对一映射,从而实现系统关键词的快速定位,通过不断有监督机器学习,实现高准确的关键词映射表。
22.进一步,所述数据存储层中存入的数据库中的数据都经过对称加密处理,从而确保即使入侵者获取数据库信息,也无法得到直接明码的数据,以及防止用户信息泄漏。
23.进一步,所述数据存储层中每一次数据录入和加工生成过程中均对其进行非对称加密,提取特征值,以防止数据在处理和使用过程中,发生非法篡改。
24.进一步,所述的非对称加密方法为md5、sha1或sha256,所述md5生成的是32位特征值,对所录入或加工的数据、加工时间、所用设备、人员信息进行加密计算,上述过程为对数据签名,从而保证数据的完整性、一致性,以及不可篡改性。
25.进一步,所述信息反馈层设有数据验证下载或交流机制,相关机构需采用密钥向系统的信息反馈层提供数据交流验证请求,用户通过身份验证下载相关数据。
26.为了解决现有技术中一个或多个问题,还包括一种基于人机交互的高血压慢病管理智能服务系统的装置,其特征在于:
27.信息输入模块,用于对语音和文字数据处理,形成系统可以识别使用的粗数据;
28.数据处理模块,对粗数据进行加工处理,并能将加工处理的结果反馈给信息输入
模块和数据存储模块;
29.数据存储模块,对上述两模块形成的数据进行保存;
30.信息反馈模块,用于将数据反馈给用户验证下载或提供给相关医疗机构验证交流。
31.本发明的有益效果是:本发明提供一种面向高血压领域的慢病管理智能服务系统,通过人机对话系统引导患者录入病历信息并评估其心血管风险水平,不仅提高了用户看病的效率,还保障了信息收集的质量,有效辅助医生进行精准决策,还有以下几个方面的效果:
32.1)对粗数据建立唯一索引,提高数据检索使用准确度;
33.2)建立了标准化词库,统一高血压领域的术语使用和释义;
34.3)形成关键词映射表,提高结构化和非结构化数据数据归一对齐的准确率和效率;
35.4)对数据进行加密,防止数据泄漏造成的不良影响;
36.5)对数据进行非对称加密,提取特征值,防止过程数据篡改,并给打破各机构、医院之间的检查结果不互认的壁垒,实现医院之间数据互联互认。
附图说明
37.图1本发明的模块结构图
38.图2是信息输入层结构图
39.图3是数据处理层结构图
40.图4是数据存储层结构图
41.图5是信息反馈层结构图
具体实施方式
42.在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
43.一种基于人机交互的高血压慢病管理智能服务系统,如图1所示,主要包括信息输入层、数据处理层、数据存储层和信息反馈层,当数据流进入后,依次经过上述四个模块层处理,形成一个完整的生命周期。
44.如图2所示,信息输入层主要用于外界数据的录入,其来源可分为语音、文字,采用的客户端可以有多种形式,例如,填写问卷、人机对答、微信小程序录入、app输入,当采用语音录入时,主要通过信息输入层的语言识别层,对所录入的语言进行识别,再次通过文字转化层,将语音转成文字,方便后期数据处理和加工形成数据包,最后再经过信息录入层,将所获得的数据包录入到系统中。
45.数据处理层,如图3所示,语音和文字经信息输入层处理后,变成系统可以识别使用的粗数据,数据处理层是本系统的关键层,通过本层处理后,将形成阶段性成果,供后期使用:一部分可以反馈给信息输入层,用于提高语音识别效率和准确度,另一部分将结果提供给下一层存储,供重复使用。数据处理层的处理流程,主要包括:
46.a)建立索引:建立uuid,即通用唯一标识符(universally unique identifier),对于所有的uuid它可以保证在空间和时间上的唯一性.它是通过mac地址,时间戳,命名空间,随机数,伪随机数来保证生成id的唯一性,有着固定的大小(128bit).它的唯一性和一致性特点使得可以无需注册过程就能够产生一个新的uuid.uuid可以被用作多种用途,既可以用来短时间内标记一个对象,也可以可靠的辨别网络中的持久性对象,通过为前一段形成的数据包建立唯一的对应的uuid;
47.b)将数据包内的信息进行数据归一化处理,对其中的不规范、不准确的用词进行归一化处理,从而达到将数据包的内词语对齐,以备后期逻辑判断提供数据清洗和准备工作;
48.c)将步骤b的清洗、对齐的数据包对应到现有数据判断模型,获得录入数据的判断结果。其中,现有数据判断模型为之前系统已有判断数据的结果,该结果的获得可通过机器学习算法形成,所说的机器学习算法为决策树或贝叶斯分类算法,如果步骤b的形成的数据包在数据判断模型中未找到完全匹配的数据判断结果,则将该数据包置为待处理状态,通过人工对数据进行核实标引,给出正确的判断结果,同时,并将判断所依据的数据包和结果补充到现有的数据判断模型中;
49.d)对步骤c所形成的结果进行整理,将数据包中的实体、属性和关系抽象出来,构建和完善知识图谱;
50.通过上述数据处理,将形成的现有归一化信息处理的词语结果、数据判断模型以及知识图谱反馈到qa模型中(即问答模型,可以根据问题自动检索出答案),并将辅助诊断结果对应到相应的任务中,例如对用户给出定期复查、定期血压监测的任务,还可以将数据处理的结果应用到人机智能对话中,为用户提供更人性化的服务,最后还可以为用户给诊断参考报告。
51.数据存储层,对之前各步骤形成的数据进行保存,在数据存储时,对结构数据(一般指的是在系统内部通过信息输入层、数据处理层形成的数据)可以直接存入到数据库中,如果是非结构数据(为了丰富系统的数据用例,会不定期的从相关专业网站抓取的信息)则需要经过数据归一、对齐,整理成结构化数据,然后再存入到数据库中。并对上述两种数据进行归纳,形成系统内部的标准化词库和关键词映射表,用于进一步规范化数据处理层的归一化信息,以及数据存储层中的非结构数据。上述标准化词库,是指将系统所用术语进行规范,其包含规范的中文词名和英文词名,以及相关释义,避免引起歧义;而关键词映射表,是将多个日常书写和用语中的词语与标准化词库中词语进行多对一映射,从而实现系统关键词的快速定位,通过不断有监督机器学习,实现高准确的关键词映射表。为了提高数据存储中的准确性,以及防止用户信息泄漏,存入数据库中的数据经过对称加密处理,从而确保即使入侵者获取数据库信息,也无法得到直接明码的数据。为了防止数据在处理和使用过程中,发生非法篡改,在每一次数据录入和加工生成过程中均对其进行非对称加密,提取特征值,所述的非对称加密方法为md5、sha1或sha256,其中md5生成的是32位特征值,对所录入或加工的数据、加工时间、所用设备、人员信息进行加密计算,上述过程为对数据签名,从而保证数据的完整性、一致性,以及不可篡改性。
52.信息反馈层,用于对用户和相关机构提供数据交互,多年以来,各医院之间的检查项目和指标互不相认,造成大量的重复检测,浪费用户的时间和金钱,通过本系统的使用,
由于构建了标准化词库,对所用术语进行了规范,可以实现医院之间用语互通,另一方面,所提供的数据提供了检测设备、人员信息、检查时间等信息,并实现的数据的不可篡改性,从而可以将数据在各医院之间进行交流互认,打破各医院之间的用户检测壁垒。各医院采用本院的密钥,可以向系统的信息反馈层提供数据交流验证请求,下载相关数据。
53.通过信息反馈层,用户可以通过验证个人信息后,在系统中下载到诊断参考数据。
54.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
技术特征:
1.一种基于人机交互的高血压慢病管理智能服务系统,主要包括信息输入层、数据处理层、数据存储层和信息反馈层,当数据流进入后,依次经过上述四个模块层处理,其特征在于:信息输入层,用于对语音和文字数据处理,形成系统可以识别使用的粗数据;数据处理层,对粗数据进行加工处理,并能将加工处理的结果反馈给信息输入层和数据存储层;数据存储层,上述两层形成的数据进行保存;信息反馈层,用于将数据反馈给用户验证下载或提供给相关机构验证交流。2.根据权利要求1所述的一种基于人机交互的高血压慢病管理智能服务系统,其特征在于:所述信息输入层包括语言识别层、文字转化层和信息录入层,所述信息输入层的数据采集客户端为人机对答、微信小程序录入或app输入,当采用语音录入时,主要通过语言识别层,对所录入的语言进行识别,再次通过文字转化层,将语音转成文字,加工形成数据包,最后再经过信息录入层,将所获得的粗数据包录入到系统中。3.根据权利要求1所述的一种基于人机交互的高血压慢病管理智能服务系统,其特征在于:所述数据处理层,将所述粗数据的结果一部分反馈给信息输入层,用于提高语音识别效率和准确度,另一部分将结果提供给下一层存储,供重复使用,所述数据处理层的处理流程,主要包括:a)建立索引:建立uuid,以保证在空间和时间上的唯一性,对所述粗数据建立唯一对应的uuid;b)将粗数据内的信息进行数据归一化处理,对其中的不规范、不准确的用词进行归一化处理,以确保粗数据的内词语对齐,以备后期逻辑判断提供数据清洗和准备工作;c)对步骤b的清洗、对齐的粗数据对应到现有数据判断模型,获得录入数据的判断结果,形成精细数据;d)对步骤c所形成的精细数据进行整理,将所述精细数据中的实体、属性和关系抽象出来,构建和完善知识图谱;所述现有数据判断模型为之前系统已有判断的数据结果,所述数据结果的获得是通过机器学习算法形成,所述的机器学习算法为决策树或贝叶斯分类算法;如果所述步骤c的形成的数据在数据判断模型中未找到完全匹配的数据判断结果,则将该数据置为待处理状态,通过人工对数据进行核实标引,给出正确的判断结果,并将判断所依据的数据包和结果补充到现有数据判断模型中;所述粗数据经数据处理层处理后,还将形成的现有归一化信息处理的词语结果、数据判断模型以及知识图谱反馈到qa模型中,并将辅助诊断结果对应到相应的任务中,还可以将词语结果、数据判断模型以及知识图谱应用到人机智能对话中,为用户提供更人性化的服务和诊断参考报告。4.根据权利要求1所述的一种基于人机交互的高血压慢病管理智能服务系统,其特征在于:所述数据存储层,对之前各步骤形成的数据进行保存,在数据存储时,对结构数据可以直接存入到数据库中对非结构数据则经过数据归一、对齐,整理成结构化数据,然后再存入到数据库中。5.根据权利要求4所述的一种基于人机交互的高血压慢病管理智能服务系统,其特征
在于:所述数据存储层,通过对结构化数据和非结构化数据进行归纳,还形成系统内部的标准化词库和关键词映射表,用于进一步规范化数据处理层的归一化信息。6.根据权利要求5所述的一种基于人机交互的高血压慢病管理智能服务系统,其特征在于:所述标准化词库,是指将系统所用术语进行规范,其包含规范的中文词名和英文词名,以及相关释义,避免引起歧义;所述关键词映射表,是将多个日常书写和用语中的词语与标准化词库中词语进行多对一映射,从而实现系统关键词的快速定位,通过不断有监督机器学习,实现高准确的关键词映射表。7.根据权利要求6所述的一种基于人机交互的高血压慢病管理智能服务系统,其特征在于:所述数据存储层中存入的数据库中的数据都经过对称加密处理,从而确保即使入侵者获取数据库信息,也无法得到直接明码的数据,以及防止用户信息泄漏。8.根据权利要求7所述的一种基于人机交互的高血压慢病管理智能服务系统,其特征在于:所述数据存储层中每一次数据录入和加工生成过程中均对其进行非对称加密,提取特征值,以防止数据在处理和使用过程中,发生非法篡改。9.根据权利要求8所述的一种基于人机交互的高血压慢病管理智能服务系统,其特征在于:所述的非对称加密方法为md5、sha1或sha256,所述md5生成的是32位特征值,对所录入或加工的数据、加工时间、所用设备、人员信息进行加密计算,上述过程为对数据签名,从而保证数据的完整性、一致性,以及不可篡改性。10.根据权利要求1-9任一项所述的一种基于人机交互的高血压慢病管理智能服务系统,其特征在于:所述信息反馈层设有数据验证下载或交流机制,相关机构需采用密钥向系统的信息反馈层提供数据交流验证请求,用户通过身份验证下载相关数据。
技术总结
一种基于人机交互的高血压慢病管理智能服务系统,主要包括信息输入层、数据处理层、数据存储层和信息反馈层,当数据流进入后,依次经过上述四个模块层处理,其特征在于:信息输入层,用于对语音和文字数据处理,形成系统可以识别使用的粗数据;数据处理层,对粗数据进行加工处理,并能将加工处理的结果反馈给信息输入层和数据存储层;数据存储层,上述两层形成的数据进行保存;信息反馈层,用于将数据反馈给用户验证下载或提供给相关机构验证交流。有益效果是:通过人机对话系统引导患者录入病历信息并评估其心血管风险水平,不仅提高了用户看病的效率,还保障了信息收集的质量,有效辅助医生进行精准决策。辅助医生进行精准决策。辅助医生进行精准决策。
技术研发人员:匡泽民 鄂海红 宋美娜 李峻迪 王浩田 谭玲
受保护的技术使用者:北京邮电大学
技术研发日:2021.12.13
技术公布日:2022/3/8