首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 0 毫秒
1.
本文提出一种基于极大连通子图的相关度属性选择算法,该算法利用极大连通子图求解方法得到最优属性子集,该属性子集满足相关度要求并且尽可能多地保留数据集中包含的信息。论文结合选定的分类算法验证该属性选择算法的应用效果,实验表明,该属性选择算法在分类算法的数据预处理过程中可明显提高分类准确率,与利用贪婪搜索策略的基于相关度的属性选择算法相比,应用该算法的分类算法准确率更高。  相似文献   

2.
针对Pairwise工程方法测试用例数量巨大的不足,提出了一种基于因子相关度的最优测试用例集生成工程方法(Factor Relationship-Based Test,FRBT)。它通过因子相关度计算模型分析UML设计模型和程序源码,计算出被测系统各模块的因子相关度矩阵,并通过相关因子覆盖算法实现按因子相关度的两两正交覆盖。最关键的改进点是FRBT方法采用了数学模型来挑选相交因子,从而解决了其他工程方法中完全依赖STE(Software Test Engineer)经验挑选因子所带来的风险与不稳定性,使测试用例设计更加快速、客观。实验表明,FRBT工程方法不仅生成的测试用例数量最少,而且将Pairwise工程方法的缺陷命中率从26.518%提升到了52.568%。  相似文献   

3.
讨论了如何精确计算结构化文档相关度的理论模型和算法.首先分析了基于语义内容的文档相关度和基于文档特征的文档相似度之间的区别,提出利用树同构思想测量文档语义相关性.在计算过程中,通过为结点赋予不同权重反映匹配结点的位置重要性,对于未匹配结点则首次提出利用影响因子针对不同情况做适当区分,最后给出文档相关度计算公式.实验证明,此方法能够很好地区分信息检索中的模糊或者相近的请求及文档.  相似文献   

4.
基于属性相关度的Web数据库大小估算方法   总被引:12,自引:0,他引:12       下载免费PDF全文
凌妍妍  孟小峰  刘伟 《软件学报》2008,19(2):224-236
提出了一种基于词频统计的方法以估算Web数据库的规模.通过分析Web数据库查询接口中属性之间的相关度来获取某个属性上的一组随机样本;并对该属性分别提交由前k位高频词形成的试探查询以估算Web数据库中记录的总数.通过在几个真实的Web数据库上进行实验验证,说明该方法可以准确地估算出Web数据库的大小.  相似文献   

5.
文本的特征选择作为文本分类的关键步骤,它的好坏将直接影响文本分类的准确率。本文在介绍文本分类的背景之下,针对传统特征提取方法的不足,提出一种新的特征选择方法。在《同义词词林》基础上,计算特征词之间的语义相关度,进行特征选择。实验结果表明该方法有效的降低了特征空间的高维稀疏性和减少噪声,提高了分类精度,体现出更好的分类效果。  相似文献   

6.
根据给定查询实体与知识图谱(Knowledge Graph,KG)中其他实体的相关程度对实体进行排序,是相关实体搜索的重要支撑技术.实体间的相关性不仅体现在KG中,还体现在快速产生的Web文档中.现有的方法主要根据KG来计算实体间的相关度,但KG无法及时地反映真实世界中快速演化的知识,导致计算结果不够客观.因此,本文首先基于TransH模型提出一种候选实体搜索算法,通过分析实体在不同关系超平面中的语义表示来针对不同关系选择候选实体.为了提高候选实体排序的准确性,提出实体无向带权图模型(Entity Undirected Weighted Graph,EUWG),通过量化查询实体与候选实体在Web文档和KG中反映出的相关性,从而准确地对候选实体进行排序.实验结果表明,本文的方法能够在大规模KG中准确地搜索候选实体并对其正确排序.  相似文献   

7.
目前的搜索引擎仍然存在\"重形式,轻语义\"的问题,无法做到对搜索关键词和文本的深层次语义理解,因此语义检索成为当前搜索引擎中亟需解决的问题.为了提高搜索引擎的语义理解能力,该文提出一种语义相关度的计算方法.首先,标注了金融类新闻标题实体与新闻正文语义相关度语料1万条,然后建立新闻实体与正文语义相关度计算的BERTCA(B...  相似文献   

8.
一种基于扫描相关度的LSB算法   总被引:1,自引:0,他引:1  
自然图像相邻像素序列具有一定的相关性。基于图像的这种统计特性,提出了扫描相关度的概念。隐藏信息的非均匀嵌入使得载体图像的相邻像素序列相关度降低,而且图像局部有相关度突变的现象,增大了隐藏信息被检测到的风险。进一步提出了一种LSB改进算法,该算法将隐藏信息均匀嵌入到载体图像中,并在嵌入过程中,根据相邻像素期望值对扫描相关度有突变的区域进行平滑。实验结果表明,该算法明显降低了图像相关度突变的现象。  相似文献   

9.
语义相关度计算是自然语言处理领域的研究热点。现有的以文本相似度计算代替文本相关度计算的方法存在不足之处。提出从语形相似性和组元相关性两个方面来综合度量短文本之间的语义相关性,并提出2个以Wikipedia作为外部知识库的短文本相关度计算算法:最大词语关联法和动态组块法。在一个网络短文本测试集上对算法进行测评。实验结果表明,该算法与典型相似度计算算法比较,在正确率方面提高了20%以上。  相似文献   

10.
由于信息系统中用户行为类型的多样性,采用单一的检测方法对内部合法用户的恶意行为进行检测评估效果不好。提出一种基于多实体贝叶斯网络的用户行为可信评估方法,利用多实体贝叶斯网络的对行为的多种要素进行建模、融合,共同推理出用户行为的可信程度。最后的仿真实验表明所提出的模型在信息系统中的用户行为可信评估具有较好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号