信息技术专利汉英语块库构建及应用研究

【摘要】 汉英专利平行语料库和语块库是专利机器翻译和专利语块词典编纂的重要资源。本研究为构建信息技术专利汉英语块库提供资源、技术和方法,同时探讨其在机器翻译和词典编纂方面的应用。研究发现,N值3~6的双语语块在信息技术专利汉英语块库的数量比例较大,尤其是四字词(N=4)汉英专利语块数量达到全库的三分之一。这将为机器翻译、词典编纂以及语块教学等的相关研究带来启示,有助于语块实证研究的拓展。