语言学领域多语种本体知识库构建与新术语发现

【摘要】 针对语言学术语使用缺少规范、领域知识有待梳理的问题,本文首先通过整合语言学领域英俄汉术语资源,构建了多语种术语表;其次,基于维基百科采集与术语相关的多语种可比语料并建库,使用知识本体方法构建了包含14个大类、75个子类、25,385个实例以及16个属性关系的语言学领域知识库;最后,统计术语构成模式,抽取新多词术语以实现对知识库的迭代更新。本文不仅对于术语翻译、词典编撰、语言学知识挖掘、多语种语料库研究有重要意义,知识库也可作为重要语言教学与研究基础数据资源应用于其他语言学研究中。