登录 | 注册
计算机
在中文专利主题挖掘研究中,针对基于单词的传统主题模型结果可解释性较差问题,提出一种融合词向量和GeneralizedPolyaurn(GPU)的改进模型GW_PhraseLDA。根据专利文本特点,使用BLSTM-CRF模型进行专利短语抽取,利用训练好的词向量生成先验知识。在Gibbs采样的迭代过程中,利用GPU策略提升语义相关短语在同一主题下的概率%在中文专利文本上的实验结果表明,所提模型能够有效提高专利主题生成质量,相比传统的主题模型更具可解释性和判别性。
针对现阶段异常信息属性特征提取方法无法及时对数据库更新的数据进行处理的缺陷,研究并提出一种基于关联分析的异常信息属性特征提取方法。组建无向的频繁模式网络模型,分析模型特点,获得项目关联矩阵;通过自适应盲源分离方法,对信息的相关特征进行融合以及挖掘,得到不同特征值之间的关系,通过特征的分布情况,使用关联规则信息融合方法对项目关联矩阵进行聚类处理,在整个数据的聚类中心,通过计算得到判决阈值,将其与自适应回归方法对异常信息属性特征进行特征挖掘,通过信息融合方法实现异常信息属性特征提取。仿真结果表明,与传统提取方法相比所提方法能够快速、准确提取异常信息属性特征。
无摘要