(12)发明专利申请
(10)申请公布号 CN 111105854 A(43)申请公布日 2020.05.05
(21)申请号 201911277461.2(22)申请日 2019.12.12
(71)申请人 和宇健康科技股份有限公司
地址 510000 广东省广州市天河区海安路
13号之一2003、1801、1804房(72)发明人 周赞和
(74)专利代理机构 广州三环专利商标代理有限
公司 44202
代理人 郭浩辉 麦小婵(51)Int.Cl.
G16H 10/60(2018.01)G16H 50/20(2018.01)G06F 16/9532(2019.01)G06F 16/9538(2019.01)G06F 16/954(2019.01)
权利要求书1页 说明书4页 附图1页
(54)发明名称
健康信息系统知识库的搜索引擎系统(57)摘要
本发明公开了健康信息系统知识库的搜索引擎系统,包括:终端设备、搜索引擎接口、查询模块、知识库子系统;所述终端设备,与搜索引擎接口连接,用于将关键词或检索式录入所述搜索引擎接口;所述查询模块,与所述知识库子系统连接,用于将关键词或检索式输入所述知识库子系统;所述知识库子系统,用于根据所述关键词或所述检索式,从知识库中所述区域人口信息资源库、所述电子健康档案库、所述电子病历资源库或所述计生综合管理资源库的一种或多种组合中获取对应的搜索结果,并通过所述搜索引擎接口输出至所述终端设备。完善的知识库和搜索引擎系统的设计,能够有效提高搜索结果的效率和准确率。
CN 111105854 ACN 111105854 A
权 利 要 求 书
1/1页
1.一种健康信息系统知识库的搜索引擎系统,其特征在于,所述知识库至少关联区域人口信息资源库、电子健康档案库、电子病历资源库和计生综合管理资源库中的一种或多种;
所述搜索引擎系统包括:终端设备、搜索引擎接口、查询模块、知识库子系统;所述终端设备,与搜索引擎接口连接,用于将关键词或检索式录入所述搜索引擎接口;所述查询模块,与所述知识库子系统连接,用于将关键词或检索式输入所述知识库子系统;
所述知识库子系统,用于根据所述关键词或所述检索式,从所述区域人口信息资源库、所述电子健康档案库、所述电子病历资源库或所述计生综合管理资源库中的一种或多种组合中获取对应的搜索结果,并通过所述搜索引擎接口输出至所述终端设备。
2.根据所述权利要求1所述的健康信息系统知识库的搜索引擎系统,其特征在于,所述知识库子系统,包括:
排序模块,用于将搜索结果按照预设的排序规则进行排序,其中,所述预设的排序规则包括根据搜索频率降序排列,或根据匹配度降序排列,或根据关联度降序排列;
索引模块,用于接收所述查询模块输入的关键词或检索式,并根据关键词或检索式获取相关信息和相关索引信息,所述索引信息为索引器生成的与关键词或检索式相关的索引信息。
3.根据所述权利要求2所述的健康信息系统知识库的搜索引擎系统,其特征在于,所述知识库还包括医疗信息库、医疗评论信息库和医疗网页库;
所述知识库子系统还包括爬虫,所述爬虫分别与外网和所述医疗网页库连接,用于接收需要抓取的网页URL网址信息。
4.根据所述权利要求3所述的健康信息系统知识库的搜索引擎系统,其特征在于,所述医疗网页库主要是针对中文医疗健康论坛网站进行目录式抓取,构建医疗网库。
5.根据所述权利要求3所述的健康信息系统知识库的搜索引擎系统,其特征在于,所述医疗评论信息库,基于RoadRunner算法对医疗网页库的网页进行相关信息抽取,构建医疗评论信息库。
6.根据所述权利要求3所述的健康信息系统知识库的搜索引擎系统,其特征在于,所述医疗信息库,采用AHP的评价方式,以医疗评论属性字段为评价标准,构建医疗信息库。
7.根据所述权利要求1所述的健康信息系统知识库的搜索引擎系统,其特征在于,所述知识库子系统,还包括预防保健处理模块、临床诊疗信息处理模块、管理信息处理模块。
8.根据所述权利要求7所述的健康信息系统知识库的搜索引擎系统,其特征在于,所述预防保健处理模块,包括儿童保健子模块、计划免疫子模块、家庭病床子模块、妇女保健子模块、生命统计子模块、职业病防治子模块、健康教育子模块、慢性病管理子模块、疾病检测预警子模块、精神病管理子模块、传染病管理子模块、学校卫生子模块、残疾人管理子模块和流动人口管理子模块。
9.根据所述权利要求7所述的健康信息系统知识库的搜索引擎系统,其特征在于,所述临床诊疗信息处理模块,包括临床检验信息子模块、医学影像信息子模块、全科医生工作站子模块和远程全科工作站子模块。
2
CN 111105854 A
说 明 书
健康信息系统知识库的搜索引擎系统
1/4页
技术领域
[0001]本发明属于健康管理领域,尤其涉及健康信息系统知识库的搜索引擎系统。背景技术
[0002]搜索引擎服务能够成为最受欢迎的服务是因为它解决了用户在浩瀚的互联网海量信息中快速定位信息的瓶颈问题。
[0003]目前的专业搜索引擎有旅游搜索、数码产品搜索、酒店搜索、房屋租赁搜索,尚未有较为系统的医疗信息搜索引擎。
发明内容
[0004]本发明实施例提供一种健康信息系统知识库的搜索引擎系统,完善的知识库和搜索引擎系统的设计,能够有效提高搜索结果的效率和准确率。
[0005]本发明实施例提供一种健康信息系统知识库的搜索引擎系统,所述知识库至少关联区域人口信息资源库、电子健康档案库、电子病历资源库和计生综合管理资源库中的一种或多种;
[0006]所述搜索引擎系统包括:终端设备、搜索引擎接口、查询模块、知识库子系统;[0007]所述终端设备,与搜索引擎接口连接,用于将关键词或检索式录入所述搜索引擎接口;
[0008]所述查询模块,与所述知识库子系统连接,用于将关键词或检索式输入所述知识库子系统;
[0009]所述知识库子系统,用于根据所述关键词或所述检索式,从所述区域人口信息资源库、所述电子健康档案库、所述电子病历资源库或所述计生综合管理资源库中的一种或多种组合中获取对应的搜索结果,并通过所述搜索引擎接口输出至所述终端设备。[0010]优选地,所述知识库子系统,包括:[0011]排序模块,用于将搜索结果按照预设的排序规则进行排序,其中,所述预设的排序规则包括根据搜索频率降序排列,或根据匹配度降序排列,或根据关联度降序排列;[0012]索引模块,用于接收所述查询模块输入的关键词或检索式,并根据关键词或检索式获取相关信息和相关索引信息,所述索引信息为索引器生成的与关键词或检索式相关的索引信息。
[0013]优选地,所述知识库还包括医疗信息库、医疗评论信息库和医疗网页库;[0014]所述知识库子系统还包括爬虫,所述爬虫分别与外网和所述医疗网页库连接,用于接收需要抓取的网页URL网址信息。[0015]优选地,所述医疗网页库主要是针对中文医疗健康论坛网站进行目录式抓取,构建医疗网库。
[0016]优选地,所述医疗评论信息库,基于RoadRunner算法对医疗网页库的网页进行相关信息抽取,构建医疗评论信息库。
3
CN 111105854 A[0017]
说 明 书
2/4页
优选地,所述医疗信息库,采用AHP的评价方式,以医疗评论属性字段为评价标准,
构建医疗信息库。[0018]优选地,所述知识库子系统,还包括预防保健处理模块、临床诊疗信息处理模块、管理信息处理模块。[0019]优选地,所述预防保健处理模块,包括儿童保健子模块、计划免疫子模块、家庭病床子模块、妇女保健子模块、生命统计子模块、职业病防治子模块、健康教育子模块、慢性病管理子模块、疾病检测预警子模块、精神病管理子模块、传染病管理子模块、学校卫生子模块、残疾人管理子模块和流动人口管理子模块。[0020]优选地,所述临床诊疗信息处理模块,包括临床检验信息子模块、医学影像信息子模块、全科医生工作站子模块和远程全科工作站子模块。[0021]相对于现有技术,本发明实施例具有如下有益效果:
[0022]本发明实施例公开的健康信息系统知识库的搜索引擎系统,包括:终端设备、搜索引擎接口、查询模块、知识库子系统;所述终端设备,与搜索引擎接口连接,用于将关键词或检索式录入所述搜索引擎接口;所述查询模块,与所述知识库子系统连接,用于将关键词或检索式输入所述知识库子系统;所述知识库子系统,用于根据所述关键词或所述检索式,从知识库中所述区域人口信息资源库、所述电子健康档案库、所述电子病历资源库或所述计生综合管理资源库的一种或多种组合中获取对应的搜索结果,并通过所述搜索引擎接口输出至所述终端设备。完善的知识库和搜索引擎系统的设计,能够有效提高搜索结果的效率和准确率。
附图说明
[0023]图1是本发明实施例的健康信息系统知识库的搜索引擎系统的结构框图。具体实施方式
[0024]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。[0025]参阅图1,本发明实施例提供为了解决上述技术问题,本发明实施例提供一种健康信息系统知识库的搜索引擎系统,所述知识库至少关联区域人口信息资源库、电子健康档案库、电子病历资源库和计生综合管理资源库中的一种或多种。
[0026]健康信息系统知识库的搜索引擎系统是指根据一定的策略、运用特定的计算机程序从健康信息系统知识库上采集信息,再对信息进行组织和处理后,为用户提供检索服务,将检索的相关信息展示给用户的系统。
[0027]健康信息系统知识库搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为健康信息系统知识库信息检索用户提供快速、高相关性的信息服务。[0028]所述搜索引擎系统包括:终端设备、搜索引擎接口、查询模块、知识库子系统。[0029]所述终端设备,与搜索引擎接口连接,用于将关键词或检索式录入所述搜索引擎
4
CN 111105854 A
说 明 书
3/4页
接口。
所述查询模块,与所述知识库子系统连接,用于将关键词或检索式输入所述知识
库子系统。
[0031]所述知识库子系统,用于根据所述关键词或所述检索式,从所述区域人口信息资源库、所述电子健康档案库、所述电子病历资源库或所述计生综合管理资源库中的一种或多种组合中获取对应的搜索结果,并通过所述搜索引擎接口输出至所述终端设备。[0032]在具体的实施例当中,健康信息系统知识库的搜索引擎的工作流程如下:[0033]数据采集
[0034]蜘蛛在健康信息系统知识库内爬行和抓取知识库文档信息,并存入知识库原始文档数据库。
[0035]搜索引擎的引擎蜘蛛通过每个子知识库系统的接口检索是否有新的文档,每遇到一个新文档,引擎蜘蛛都会调用相应子知识库系统的接口来获取文档的文本内容,并把获取的文档文本内容存入知识库原始文档数据库。[0036]搜索引擎有多台服务器,每一台服务器都会派出多只蜘蛛同时去抓取文档。[0037]建立索引库
[0038]对原始文档数据库中的信息进行提取和组织,并建立索引库。[0039]爬虫技术收集的数据是数亿级别以上的原始文档数据,为了能够快速的为用户检索出搜索的结果,搜索引擎必须将收集的原始文档数据做预处理,主要过程是为文档建立全文索引,然后分析文档内容,建立反向索引。经过搜索引擎分析处理后,文档内容已经不再是原始的文档,而是浓缩成能反映文档主题内容的、以词为单位的文档,并以此建立索引库。
[0040]检索和排序
[0041]根据用户输入的关键词,快速找到相关文档,并对找到的结果进行排序,将查询结果返回给用户。
[0042]在搜索引擎界面输入关键词,点击“搜索”按钮之后,搜索引擎程序首先对搜索词进行以下处理:分词处理、根据情况对整合搜索是否需要启动进行判断、找出错别字和拼写中出现的错误、把停止词去掉。接着搜索引擎程序便把包含搜索词的相关文档从索引数据库中找出,然后将找出的文档按照不同维度的得分进行综合排序,最后按照一定格式返回到“搜索”页面。
[0043]需要说明的是,最核心的部分是搜索结果排序,其决定了搜索引擎的好坏。影响搜索结果排序的“不同维度”有很多,主要包括:[0044]1.相关性:文档内容与用户检索需求的匹配程度,比如文档包含的用户检查关键词的个数,以及这些关键词出现的位置等;[0045]2.权威性:用户喜欢有一定权威性文档提供的内容。[0046]3.时效性:时效性结果指的是搜索结果应满足按时间先后顺序排列呈现给用户;[0047]4.重要性:文档内容与用户检查需求匹配的重要程度或受欢迎程度;[0048]5.丰富度:丰富度看似简单却是一个覆盖范围非常广的命题。可以理解为文档内容丰富,可以完全满足用户需求;不仅可以满足用户单一需求,还可以满足用户的延展需求;
5
[0030]
CN 111105854 A[0049]
说 明 书
4/4页
6.受欢迎程度:可以从该文档的访问次数上体现出文档的受欢迎程度。
[0050]优选地,所述知识库子系统,包括:[0051]排序模块,用于将搜索结果按照预设的排序规则进行排序,其中,所述预设的排序规则包括根据搜索频率降序排列,或根据匹配度降序排列,或根据关联度降序排列;[0052]索引模块,用于接收所述查询模块输入的关键词或检索式,并根据关键词或检索式获取相关信息和相关索引信息,所述索引信息为索引器生成的与关键词或检索式相关的索引信息。
[0053]优选地,所述知识库还包括医疗信息库、医疗评论信息库和医疗网页库;[0054]所述知识库子系统还包括爬虫,所述爬虫分别与外网和所述医疗网页库连接,用于接收需要抓取的网页URL网址信息。[0055]优选地,所述医疗网页库主要是针对中文医疗健康论坛网站进行目录式抓取,构建医疗网库。
[0056]优选地,所述医疗评论信息库,基于RoadRunner算法对医疗网页库的网页进行相关信息抽取,构建医疗评论信息库。[0057]优选地,所述医疗信息库,采用AHP的评价方式,以医疗评论属性字段为评价标准,构建医疗信息库。[0058]优选地,所述知识库子系统,还包括预防保健处理模块、临床诊疗信息处理模块、管理信息处理模块。[0059]优选地,所述预防保健处理模块,包括儿童保健子模块、计划免疫子模块、家庭病床子模块、妇女保健子模块、生命统计子模块、职业病防治子模块、健康教育子模块、慢性病管理子模块、疾病检测预警子模块、精神病管理子模块、传染病管理子模块、学校卫生子模块、残疾人管理子模块和流动人口管理子模块。[0060]优选地,所述临床诊疗信息处理模块,包括临床检验信息子模块、医学影像信息子模块、全科医生工作站子模块和远程全科工作站子模块。[0061]相对于现有技术,本发明实施例具有如下有益效果:
[0062]本发明实施例公开的健康信息系统知识库的搜索引擎系统,包括:终端设备、搜索引擎接口、查询模块、知识库子系统;所述终端设备,与搜索引擎接口连接,用于将关键词或检索式录入所述搜索引擎接口;所述查询模块,与所述知识库子系统连接,用于将关键词或检索式输入所述知识库子系统;所述知识库子系统,用于根据所述关键词或所述检索式,从知识库中所述区域人口信息资源库、所述电子健康档案库、所述电子病历资源库或所述计生综合管理资源库的一种或多种组合中获取对应的搜索结果,并通过所述搜索引擎接口输出至所述终端设备。完善的知识库和搜索引擎系统的设计,能够有效提高搜索结果的效率和准确率。
[0063]以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
6
CN 111105854 A
说 明 书 附 图
1/1页
图1
7
因篇幅问题不能全部显示,请点此查看更多更全内容