排序方式: 共有4条查询结果,搜索用时 15 毫秒
1
1.
2.
将信息熵融入TextRank算法中分词器部分以改善关键词抽取的准确度.在分词前,先用信息熵的方式提取文章的关键新词,加入到分词字典中,使分词器能够自主识别新词,以增强文章关键词提取的准确性.当语料中存在新词的时候,关键词抽取准确度效果提升明显,对不存在新词的语料关键词抽取准确度无明显提升.改善分词效果可以提升关键词抽取... 相似文献
3.
为进一步挖掘大数据的重要价值,优化Dapp流量分析的步骤,提高分析的效率,提出了一种自动分析Dapp流量的研究方法。通过分析源码,在对每一笔流量所调用的函数进行统计分析的基础上,提取规则,进而分析是否存在违法行为,针对非法行为产生报警机制。并介绍了该方法的关键技术,该方法实现了大数据访问、预处理、存储和分析,而且提供了分布式计算引擎。 相似文献
4.
1