排序方式: 共有3条查询结果,搜索用时 0 毫秒
1
1.
为了提高客服终端数据可利用性,降低冗余数据干扰程度,挖掘潜在客户,制定销售策略,研究一种基于决策树算法的客服终端冗余数据迭代消除方法。采用数据仓库法抽取并集成客服终端数据,对字符类数据进行去停用词和中文分词预处理,对数值类数据进行缺失值填补和离散值删除预处理。构建ID3决策树,分类客服终端数据,计算同一类数据的类间相似度,构建冗余数据判断规则,检测客服终端冗余数据,联合消除器消除冗余数据。实验结果表明:所研究方法应用后,可以消除客服终端冗余数据,空间缩减比更接近冗余率。 相似文献
2.
为避免舆情焦点损伤电力企业形象,设计了电力企业互联网舆情数据规格化存储系统,实时采集、处理并存储公共舆情数据。利用基于TF-IDF改进算法的聚焦网络爬虫爬取原始数据层的舆情数据,构建正则表达式描述语义模型;应用基于负载权重的负载均衡算法的存储负载均衡机制,根据负载差值计算存储节点执行任务的概率,更新存储节点的负载,实现各存储节点负载均衡。实验结果表明:读取时间均值为72.9ms,写入时间均值为425.3ms,数据读写效率高,各存储节点负载均衡,对大规模数据的处理及存储性能更佳。 相似文献
3.
1