排序方式: 共有23条查询结果,搜索用时 3 毫秒
21.
词位标注汉语分词中特征模板定量研究 总被引:1,自引:0,他引:1
基于字的词位标注的方法能极大地提高汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,词位标注汉语分词中特征模板的设定至关重要,为了更加准确地设定特征模板,从多个角度进行了定量分析,并在国际汉语分词评测Bakeoff2005的PKU和MSRA两种语料上进行了封闭测试,得到如下结论:同等条件下,训练出的模型大小与扩展出的特征数成正比;不同的单字特征模板在同一语料中扩展出的特征数基本相同,单字特征模板对分词性能的贡献要比双字特征模板小得多;增加B特征模板之后,训练时间大大增加,模型大小基本不变,对分词性能都是正增长. 相似文献
22.
本体论在Web信息检索中的应用 总被引:4,自引:3,他引:4
文章提出了一种基于本体论的Web信息检索模型,它利用领域本体知识库对用户的查询要求进行语义扩展,并且将检索到的文档在语义层次上进一步过滤,从而克服了目前的检索工具仅提供基于关键字的检索.而忽视关键字本身语义信息所造成的错检和漏检。 相似文献
23.