[00279048]一种最小生成树统计融合的汉语依存句法分析方法
交易价格:
面议
所属行业:
其他机械
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201710631948.0
交易方式:
技术转让
技术转让
技术入股
联系人:
昆明理工大学
进入空间
所在地:云南昆明市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明涉及一种最小生成树统计融合的汉语依存句法分析方法,属于自然语言处理技术领域。本发明首先对输入的待测句子进行预处理分析,具体包括首先建立依存关系频率表;其次,分词、词性标注、依存关系概率统计;然后,把分词后分得的各个词作为节点,并加入一个虚节点,两节点间依存关系概率的负对数作为连接两节点的代价;接着,再利用最小生成树生成方法来生成依存关系树;最后分析出该句子的依存关系树。本发明对句子的分析提供一种精确、高效、便捷的分析方案,不仅节约了分析的时间,且有效提高了句法分析的正确率。本发明的可行性高并适用于一般自然语言的句法分析中。
本发明涉及一种最小生成树统计融合的汉语依存句法分析方法,属于自然语言处理技术领域。本发明首先对输入的待测句子进行预处理分析,具体包括首先建立依存关系频率表;其次,分词、词性标注、依存关系概率统计;然后,把分词后分得的各个词作为节点,并加入一个虚节点,两节点间依存关系概率的负对数作为连接两节点的代价;接着,再利用最小生成树生成方法来生成依存关系树;最后分析出该句子的依存关系树。本发明对句子的分析提供一种精确、高效、便捷的分析方案,不仅节约了分析的时间,且有效提高了句法分析的正确率。本发明的可行性高并适用于一般自然语言的句法分析中。