排序方式: 共有2条查询结果,搜索用时 0 毫秒
1
1.
为了从海量的网络信息中迅速准确地获取评价信息,观点句识别已经成了自然语言处理的一个研究热点。现在观点句识别系统大都是基于机器学习的方法,一般使用机器学习的方法来进行分类会受到领域差异性影响。针对这个问题,该文对微博观点句识别系统是否会受到微博话题影响做了经验性研究,同时为了弥补训练数据的不足,该文通过规则方法自动标注网络数据进行了训练集的扩充。实验结果表明,微博话题间存在差异,进行分话题模型训练可以提升微博观点句识别系统的性能。 相似文献
2.
当前对于汉语语义层次的语言网络研究方法仅限于静态词典生成以及人工手动生成两种方法,具有很大的局限性。对此,该文从大规模语料库生成的语义空间出发,结合语义空间丰富的语义信息和义类词典资源,提出一种新颖的基于分布语义的语义网络构建策略,并在此基础上探究了由不同性质的语义空间所构建的语义网络的统计特性。相比前人的方法,该文提出的方法优势在于无需依赖人工标注,支持大规模动态语料的网络自动构建。实验结果表明,语义网络具有复杂网络两个典型的特性:小世界效应和无标度特性。此外,由于语义网络描述的是词之间最为本质的语义关系,与不同文体中的措辞、使用习惯、风格等不存在直接的关系,因此当语义网络节点到达一定规模时,语义网络的某些统计特性可能会趋于一致。 相似文献
1