排序方式: 共有34条查询结果,搜索用时 31 毫秒
1.
讨论了文本分类系统中的特征提取方法.探讨了文档频率(DF)、信息增益(IG)、互信息算法(MI)三种不同的特征提取方法对中文文本分类的影响,并提出了一种结合信息增益和互信息的特征提取方法.实验表明本文提出的特征提取方法一定程度上提高了中文文本分类准确性. 相似文献
2.
基于遗传算法的主题信息搜索研究 总被引:1,自引:0,他引:1
主题信息搜索的关键是对于主题相关信息的检索。本文提出了基于遗传算法的主题信息搜索策略,即利用通用搜索引擎获取网页URL,再根据网页间的链接关系得到初始种子集合;通过交叉操作,对父代个体进行变换,产生出大量新的个体,再从中选取主题相关度高的个体;通过变异操作,引入新种子集合,扩大URL集;通过选择操作,选出适应度高的个体作为新一代的种子进入新一轮的遗传。 相似文献
3.
本文介绍了用PB实现生产管理系统的几项技术,相似数据的自动生成、两个数据窗口的同步滚动、下拉列表框内容的动态更新、一种过滤技术等。 相似文献
4.
动态调整移动数据库中失效报告时间窗口的大小 总被引:2,自引:0,他引:2
在移动计算环境中,如何维护移动客户机中数据缓存的一致性,是研究的一个热点.广播失效报告是一种有效的方法,但由于不同的环境,不同的时期各种参数的变化,失效报告时间窗口ω的大小如何确定是一个难点.时间窗口ω应随各种参数的变化而不断地进行调整,才能保证网络系统的传输工作在最有效的状态.从理论上推导了失效报告时间窗口ω的计算公式,分析了ω的合理取值,并给出了具体实现的算法. 相似文献
5.
6.
对ORCAD软件的器件库文件进行了详细的分析,并具体讨论了器件库文件的五大组成部分:文件头;定位指针表;器件名称表;器件索引数据区和器件位图数据区 通过分析,笔者能够调用ORCAD器件库文件,完成电路图的设计和仿真 相似文献
7.
针对文本分类中传统特征选择方法卡方统计量和信息增益的不足进行了分析,得出文本分类中的特征选择关键在于选择出集中分布于某类文档并在该类文档中均匀分布且频繁出现的特征词。因此,综合考虑特征词的文档频、词频以及特征词的类间集中度、类内分散度,提出一种基于类内类间文档频和词频统计的特征选择评估函数,并利用该特征选择评估函数在训练集每个类别中选取一定比例的特征词组成该类别的特征词库,而训练集的特征词库则为各类别特征词库的并集。通过基于SVM的中文文本分类实验表明,该方法与传统的卡方统计量和信息增益相比,在一定程度上提高了文本分类的效果。 相似文献
8.
9.
针对基于时空Transformer模型的交通流量预测模型性能不高的问题,提出了一种基于编解码器的改进的时空Transformer模型(improved spatio-temporal Transformer model,ISTTM)。编码器对历史流量特征进行编码,解码器预测未来序列。编码器将空间稀疏自注意力和时间层次扩散卷积相结合,捕捉交通流量的动态空间相关性和局部空间特征,再利用时间自注意力建模非线性时间相关性;解码器与编码器类似地挖掘出输入序列的时空特征。基于编解码器提取的时空特征,采用双重交叉注意力模拟历史交通观测对未来预测的影响,建模每个历史时间步和每个未来时间步的直接关系以及对整个未来时间段的影响,并输出未来交通流量的最终表示。为了证实ISTTM的有效性,在METR-LA和NE-BJ两个真实世界的大规模数据集上进行实验,ISTTM结果优于6个先进的基线。 相似文献
10.
通过对几种重要的消息交换模式(MEP)的研究,为了解决消息服务中的可靠性和幂等性,提出采用karn自适应算法的重传机制和消息的持久化保证了服务的可靠性和采用关联ID的设计保证了服务的幂等性。通过实验仿真,具有重传、幂等机制的消息模式虽然性能上有一定的开销但是能够完全保证服务的可靠性。 相似文献