诊疗活动向量化表示研究

【摘要】 诊疗活动是诊疗过程的基本元素,诊疗活动向量可以应用于诊疗活动聚类、患者聚类等任务。以把握和利用诊疗活动“局部无序,全局有序”的数据特点为出发点,结合医学先验知识,提出了诊疗活动向量化表示方法CA2Vec。提出了诊疗活动向量化学习的数据处理过程框架;加入了下一个诊疗日的诊疗活动和诊断结果信息,使得所提诊疗活动向量化学习模型相比于经典模型,获得了更丰富的上下文信息;提出了基于诊断结果约束的诊疗活动负采样方法。以SNOMED-CT本体和ICD-10编码医学知识为依据设计了评估实验,并在基于特定诊疗活动的聚类、基于本体的相似性度量、基于诊疗活动类型的相关度度量、基于特定病种的分类准确度度量、基于患者向量的聚类准确度度量这几个任务上进行了对比实验。实验证明,相比其他已有的先进的词向量化学习模型,CA2Vec方法有效把握了诊疗活动的相关关系,总体上有更高的准确度。