排序方式: 共有3条查询结果,搜索用时 15 毫秒
1
1.
基于聚团词的大规模文本转载识别算法 总被引:1,自引:1,他引:0
文本转载识别是指从大规模文本库中检测出内容相同或相近的文档集合,在热门话题检测、搜索引擎结果凝练、学术文章抄袭识别等诸多应用上,存在普遍的需求。为适应网络文本转载形式的日趋多样化,并进一步提升实用系统效率,对各种文本特征及比较算法进行了研究分析,提出了基于聚团词的大规模文本转载识别算法,即:依据词语的分布属性,识别并提取高得分聚团词用于表征文本,之后通过对文本集进行扩展线性比较与多维比较两次操作,最终筛选出转载识别结果。对比实验表明:该算法在准确率、召回率与效率上有较高的综合性能。 相似文献
2.
当了个当,当了个当,咱狗狗心中有那么间房。是新房、是产房,婴儿房、贵宾房,不管什么房,寄养要好房。要是不好咱不来呀,真好来了就不想走。问我现在干嘛去?我要找房去。 相似文献
3.
1