本文是一篇软件工程论文,本课题提出的融合知识和融合情感的医疗对话生成模型,解决了智慧医生在回复中产生的回复不具有正确医学背景、响应不够多样化、回复过于生硬等问题,推动了智慧医疗的发展。
1绪论
1.1研究背景及意义
2021年12月28日,工信部发布《“十四五”医疗装备产业发展规划》报告,报告中提到我们要加快推动在线医疗发展,国家鼓励将5G技术、AI技术、“互联网+”技术、云计算等新型技术应用于医疗行业[1]。此外,国家鼓励行业专注于建设智慧医院,加快研发医疗导诊系统,努力推动智慧医疗行业的发展。如今随着深度学习和人工智能的高速发展,促进了智慧医疗领域的快速发展,使得使用信息技术实现智慧诊疗成为学者们炙热的研究课题。
智慧医疗凭借先进的技术手段在医疗健康领域掀起了一场革命性的变革,不仅显著解决了患者寻医问药的难题,也极大地提高了医疗服务行业的智能化科技化,从而实现了对医疗行业和患者的双重益处。随着2019年新冠肺炎(COVID-19)疫情的肆虐爆发,越来越多的公司就推出了“居家办公”的工作模式,由此一来,线上问诊也成为各国医疗行业的新趋向[2]。为了解决用户咨询需求激增以及提供在线诊疗咨询服务医疗人员短缺的难题,开发一个能够为用户提供准确的医学诊疗方案的智能医疗对话系统迫在眉睫。通过这样的在线医疗服务系统,就可以让患者在家就享受到高水平、高质量的上级医疗专家服务,这些在线医疗系统打破了时间、空间、地域上的限制,大大减轻了人类医生的负担,尤其是在疫情管控期间,大大降低了患者与患者之间的交叉感染,提升了医疗资源的利用效率,为打赢疫情攻坚战做好强有力的保障[3]。
.......................
1.2国内外研究现状
在人工智能日益快速发展的今天,国内外学者们早已聚焦于对话系统的构建,目前构建的对话系统类别主要包括:开放域和任务型对话系统[4]。开放域对话系统的主要侧重于自由对话和广泛话题的讨论,没有明确的任务目标或特定的领域限制。用户可以与开放域对话系统进行自由的闲聊和交流,而不受特定领域的限制。另一类旨在辅助用户高效完成指定任务,并提供相关的信息和服务。在医疗领域中,医疗对话系统旨在提供与患者健康相关的咨询、诊断、治疗建议等服务,具有明确的任务目标和领域知识[6]。
近年来,学术界的广泛研究促进了在线医疗对话系统在医疗领域的广泛应用。哈尔滨工业大学SCIR实验室与国内多家知名企业合作开发,在进行学术研究的同时积极将其研究成果落地,应用于我们生活中。与此同时,一些高校、研究机构也在为对话系统的研究贡献力量,各种组织和国际会议也提供了非常好的研究成果展示平台。目前对于建立面向任务型的对话系统来说,主要包括对话理解、对话管理、对话生成等几个部分,当然对话系统要与人能够交互,首先需要理解用户所表达语句的意思,理解之后再对用户进行回复,而如何产生与上下文相关的回复是对话系统中不可或缺的组成部分,很多国内外研究学者都致力于钻研对话生成的各种方法,现将各种方法的研究现状阐述如下。
......................
2对话生成相关理论及关键技术研究
2.1文本向量化表示
文本向量化是将文本信息转化为向量信息,用数值向量来表示文本的语义,以便计算机能够处理和理解文本数据[32]。在本课题医疗对话生成的研究中,最初的医患对话历史数据是非结构化的文本,但这种非结构化文本数据难以直接被机器学习模型处理和理解,因为机器学习模型通常需要固定长度的输入和输出,也不能直接理解输入的文本含义。因此,要让计算机可以理解用户的咨询问题,首要任务是将计算机无法直接处理的原始医患对话历史文本信息,表示为计算机可以理解的向量的形式,这样就可以让计算机理解并进行相关向量化操作,因此文本向量化的方法被广泛应用于NLP领域的各个研究方向中,主要就是将文本信息转换为计算机可处理的向量化表示形式,以让计算机理解[33]。下面将详细介绍对文本进行向量化表示的方法。
2.1.1词袋模型
1)One-hot
One-hot编码是一种最早且直观的特征词向量生成方法,它将数据集中的所有单词汇总得到N个不同的单词,并为每个单词初始化一个N维全零向量,捕捉到该句话中的有效信息后就将该位置的向量置为1,其他的状态依然都使用0表示[34]。因此One-hot编码中每个向量维度只有一位状态是有效地表示该词的语义表示,使用该方法可以简单地捕捉了词频信息,但对于词语需要多维向量时容易导致稀疏矩阵,从而浪费空间[35]。
.....................
2.2神经网络结构
2.2.1循环神经网络
RNN就是我们经常说的循环神经网络模型,其本质级联关系,但实际是对时序信息进行反复迭代,从而关注到了序列模型中每个神经单元信息,根据问题需要,隐藏层的状态可以互相连接,更新权重W从而获得不同的模型效果[46]。在下图中RNN模型的简化表示一般用图2.2左边部分进行形象化地表示,右边部分也是RNN模型的简化表示,具体如图2.2所示。
软件工程论文怎么写
.........................
3融合知识的医疗对话生成模型研究..............................17
3.1引言.......................................17
3.2任务定义................................17
3.3模型框架.......................................17
4融合情感的医疗对话生成研究........................................32
4.1引言.............................................32
4.2任务定义........................................32
4.3模型框架.....................................33
5医疗对话生成系统实现.........................45
5.1需求分析.....................................45
5.2系统设计..........................................45
5.3系统实现.....................................46
5医疗对话生成系统实现
5.1需求分析
在完成对系统的设计之前需要先对系统进行需求分析:本课题设计的医疗对话生成系统,旨在满足用户的日常医疗咨询需求,而要在对话过程中产生让用户满意的回复,则首先需要系统具有强大的自然语言理解能力,即让系统能够理解用户的问题,并与之进行流畅自然的对话。
其次,对于医疗对话生成系统而言,融入具有正确背景的医学知识至关重要。由于医疗领域涉及大量专业术语和复杂知识,系统需要具备丰富的医学知识库,以便在对话过程中为用户提供准确、专业的回复。为此,本课题使用加入医疗知识图谱,将医学领域的概念、实体以及它们之间的关系进行结构化表示,以便系统能够方便地查询和利用这些知识,使其能够和医患对话历史信息进行融合,并给出用户可参考的回复。
综上所述,医疗对话生成系统需要在理解用户的实际需求的情况下,融入具有正确背景的医学知识以及结合医患对话历史信息进行回复生成更加连贯、自然的回复。这些需求将指导我们进行系统设计和开发,以确保系统能够满足用户的日常医疗咨询需求,并为其提供满意、准确且富有医学背景的回复。
软件工程论文参考
..................................
6结论与展望
6.1总结
2019年的新冠疫情推动了在线医疗领域的发展,线上医疗服务需求与日俱增,在基于Seq2Seq模型构建的对话生成系统经常会出现“好的”、“是的”、“嗯嗯”类似的安全性回复,因此本课题在基于Seq2Seq模型的基础上,将医疗知识图谱以及医生情感信息融入到医疗对话生成过程当中,使得系统产生与上下文一致且有医学背景正确以及更加人性化的回复。本课题具体的研究工作如下:
(1)针对在医疗对话生成中如何融入医学知识图谱展开详细研究。通过将患者状态追踪和医生行为检测的方式,首先追踪到对话文本中所蕴含的实体信息,接着将与医疗KG中的实体信息进行对应,得到对应的医疗KG信息之后,模型可以通过实体识别技术自动识别出关键的医学实体,如疾病名称、药物名称等。因此接着将医疗知识图谱中的实体信息以及属性信息通过知识表示的方式嵌入模型的编码层,并从知识图谱中使用图注意力机制和波束搜索算法,将惩罚因子加入模型的训练机制中,从而减小最终所生成的各项响应之间的差异,获取与患者相关的病况诊疗信息。此外,本课题将Seq2Seq模型中的RNN模块改为Bi-GRU,使其不仅可以记忆双向的对话信息,而且可以大大减少其计算量。实验数据表明,本课题提出模型相比于基线模型,其准确度上升了11.2%,产生的回复更符合医学专业要求,并能够根据患者的具体情况建议和解决方案。
(2)针对融合医生情感的医疗对话生成进行进一步的研究。本课题在医疗对话生成过程中,考虑到患者的情感因素,使得对话更加贴近患者的实际需要。引入Self-Attention机制,使用Softmax函数获得医患对话上下文的主情感变量,即使用医患对话历史得到一个情感分类器,然后将对话历史语境信息CO输入到FC中,提取识别对话文本中的情感变量,帮助模型更好地理解患者的情感状态,并根据患者的情感状态生成响应。实验数据显示,相较于基线模型Seq2Seq,该模型在KaM ed数据集上其D@1值增加了0.17%,D@2值增加了0.548%,说明对话语句在融入了情感后其回复拟人化程度有较高提升,使得系统产生的回复更加拟人化。
参考文献(略)