首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
针对各检索词在整个查询中的权重不同和由检索词组合顺序不同而导致的暗含语义差异的问题,利用正排索引和倒排索引的结构特点,在基于倒排索引和向量空间检索模型的基础上加入相应的预处理算法,提出了查询步进和文档步进的概念,并分析了由此对检索带来的影响,给出了与检索词排列顺序相关的全文检索方法.  相似文献   

2.
当前由于电子政务发展迅速而引起的电子政务文档数量剧增,如何使用户能够提高检索文档信息查准率的同时提高检索的查全率已经成为一个热门问题。文章提出电子政务文档元数据的语义组织方法,包括文档集的资源描述框架模型的建立、合并以及检索词在文档中相似度的计算。对电子政务文档的智能搜索提出一种基于语义网检索的实现方法,结合语义网便于机器理解的优点,提高了检索集的查全率和查准率。  相似文献   

3.
基于潜在语义索引技术提出一种大容量文本的快速检索算法.首先,利用奇异值分解方法对向量空间模型进行改进,充分考虑词项之间的相关性,在低维空间中表示待检索文本的各个段落与查询文本;其次,利用随机分块查询算法,以查询文本和待检索文本各段落之间的余弦相似度作为适应度函数进行检索,输出相似度超过阈值的候选段落;最后,通过仿真实验验证了该方法的有效性.实验结果表明,该算法可以根据段落的语义进行文档的搜索,可以为查询大容量文档提供有效的手段.  相似文献   

4.
为了获取高质量的隐式主题结果,提高服务聚类精度,解决服务描述文档文本短带来的语义稀疏性与噪声问题,提出词向量与噪声过滤优化的词对主题模型(BTM-VN). 该模型以词对为基础,拓展服务描述文档,获取额外的语义信息,设计利用主题分布信息进行代表词对概率计算的策略,通过在采样过程中计算代表词对矩阵,提高代表词对在当前主题的权重,降低噪声词对服务描述文档主题获取的干扰. 利用词向量筛选待训练的词对集合,减少共现意义低的词对组合,解决词对主题模型耗时较长的问题. 使用优化的密度峰值聚类算法对经BTM-VN训练后的服务主题分布矩阵进行聚类. 实验结果表明,基于BTM-VN的服务聚类方法在3种聚类评价指标上的表现均优于传统的服务聚类算法.  相似文献   

5.
基于知识语义权重特征的朴素贝叶斯情感分类算法   总被引:1,自引:0,他引:1  
针对文档级情感分类的准确率低于普通文本分类的问题,提出一种基于知识语义权重特征的朴素贝叶斯情感分类算法.首先,通过特征选择的方法,对情感词典中的词进行重要度评分并赋予不同权重.然后,基于词典极性的分布信息与文档情感分类的相关性,将情感词的语义权重特征融合到朴素贝叶斯分类中,实现了新算法.在标准中文数据集上的实验结果表明,提出的算法在准确率、召回率和F1测度值上都优于已有的一些算法.  相似文献   

6.
在信息检索中,文档表示模型的优劣是影响检索性能的重要因素之一.根据全信息理论,认识论信息是语法信息、语义信息和语用信息的三位一体.当前主流的文档表示模型主要利用语法和语义信息,造成语用信息的缺失,成为改善检索性能的瓶颈.该文提出了一种整合用户查询行为与文档内容的文档表示模型,将用户隐性反馈的语用信息和文档自身的语义、语法信息相结合,动态调整索引库关键词权重,从而提高信息检索的查全率和查准率.  相似文献   

7.
深入讨论了基于向量空间模型以及基于潜在语义分析的微博搜索排序算法,以新浪微博为例,通过建立实验系统,利用新浪微博公共开放平台提供的API获取实验数据,通过一个实验样例阐述向量空间模型和潜在语义分析的处理过程。新浪微博现有排序方法通常不能提供按照相关性排序的满意结果。利用向量空间模型以及潜在语义分析方法,构建"索引词-博文"矩阵,对博文进行分词和向量化。衡量博文和查询的相关度转化成计算博文向量和查询向量之间的相似度。把对博文和查询的处理简化为向量空间中向量的运算。由实验得知基于潜在语义分析的微博搜索排序算法有效地提高了博文的检索效率。  相似文献   

8.
词语权重计算是自然语言处理中的重要问题,是文档语义表示的重要实现手段.词语的权重主要由两部分决定,一部分是词语在文档中的重要性度量,另一部分是基于统计方法所得的词语在区分不同文档能力上的度量即词语全局权重.本文就针对有相对稳定性的词语全局权重计算方法分析比较了现有的几种词语全局权重计算方法,并在此基础上提出了一种新的组合词语全局权重计算方法,实验证明本文提出的新方法能够有效地提高了系统的性能.  相似文献   

9.
针对现有工程信息检索中文档语义理解和关联不足的问题,根据工程环境下信息检索的特点,提出一个异质工程文档的检索方法,包括内容分析、语义建模、多维关联、语义推理与扩展以及查询处理等过程.采用基于本体的理解标注多源异质工程文档,获取工程语义信息,建立语义标注库,实现异质文档内容的统一表达.采用以文档为中心的多维关联机制,在文档内容语义理解的基础上,将基于本体的内在关联扩展为融合文档及内容的多重关联.结果表明,多维关联机制能够启发式地关联产品生命周期中的文档,增强查询的导航能力,为语义推理和检索扩展提供服务.  相似文献   

10.
对不同语言的句对齐文献资料进行分析,提出了基于多语主题模型的跨语言文献相似度的计算方法.首先,对收集整理的不同语言(中文、英文、韩文)文献构建数据模型,通过分词、分词结果修正及选择、词权重计算等预处理工作构造词项-文档矩阵.其次,建立多语主题语义空间,将译成3种不同语言的文献映射到语义空间,在语义空间中每一主题都由3种语言构成.最后,通过其语义空间中对应的主题计算比较不同语言间的文献相似度.实验结果显示,不同语言之间的文献相似度可以直接在语义空间中计算,且相似度计算的准确性在90%以上,验证了本文方法在跨语言文献相似度计算时的有效性.  相似文献   

11.
探讨了 Banach 代数中的行列式理论.给出了具有单位元的迹 Banach 代数具有行列式的充要条件.  相似文献   

12.
对引起加工质量故障的原因进行了研究,建立了用于加工中心加工质量故障分析的与/或故障树,提出了隐加工质量故障(FMQF)的概念和由·FMQF 找出制造系统故障的决策树方法.本文在模糊理论基础上,提出了隐加工质量故障识别的新方法,用这种方法可以根据控制图的变化进行设备状态估计.基于以上研究,建立了可用于柔性制造系统隐加工质量故障预测和预报的专家系统.  相似文献   

13.
发展了立方准晶材料的断裂理论 .通过应用Fourier分析和对偶积分方程理论 ,得到了立方准晶材料Ⅲ型裂纹问题的精确解析解 ,并由此确定了位移与应力场 ,应力强度因子和应变能释放率 .结果表明 ,应力强度因子与材料常数无关 ,而应变能释放率依赖于所有的材料常数 .这些为研究此新固体材料的变形和断裂提供了重要的信息 .  相似文献   

14.
对近年来非织造布滤料的研究进展做了简要综述,介绍了内部结构的研究及表征、过滤性能及其影响因素、过滤过程的计算机模拟,指出进一步发展所需要解决的问题。  相似文献   

15.
分析了当前高师物理专业人才培养与基础教育人才需求存在的问题,结合调查情况,提出了高师物理专业在培养目标、课程设置、教学内容、教学方法及实践教学环节方面的改革措施。  相似文献   

16.
17.
鞋面织物染整是纺织工业中一个特殊分支,公司通过采用先进染色技术和工艺,可以从源头上达到节能和减少废水产生量的效果,废水产生后经过处理达标排放,部分经深度处理后回用。公司经长期实践后已经达到吨织物染整用水125m~3/t_(产品),吨织物排放废水79.2 m~3/t_(产品),水回用率达37.8%,吨产品蒸汽耗量从9t/t_(产品)下降到7 t/t_(产品),均达到国内国际先进水平。  相似文献   

18.
介绍了一种面向对象的 NBO(node-block-object)超媒体数据模型.该模型利用面向对象的方法,将多媒体信息和链接功能封装于一体,成功地实现了交叉链接和双向链接,大大增强了系统的灵活性,并实现了超媒体系统中的前、后向双向查找功能.在链接关系上,还实现了条件约束,从而大大方便了时间相关媒体信息的处理和多种媒体对象相互协作的操作.  相似文献   

19.
研究一类高度非线性摩擦特性影响下的控制系统的定位控制问题 .针对负载扭矩变化而造成摩擦特性的变化 ,采用PID控制和摩擦补偿控制对阀控液压马达控制系统的定位控制进行实验对比分析 .实验结果表明 ,常规比例控制由于受摩擦的影响产生较大的稳态误差 ,而积分控制的引入可减小稳态误差 ,但却引起系统产生极限环振荡和较长的调节时间 ;简单的定摩擦补偿在恒定的负载扭矩下可以有效地减小稳态误差 ,但是当负载扭矩大范围变化时 ,稳态定位精度将大大降低 ;基于误差和误差变化的动态摩擦补偿 ,在负载扭矩大范围变化的条件下均获得了高精度的定位控制 .  相似文献   

20.
<正>May 26,2014,BeijingScience is a human enterprise in the pursuit of knowledge.The scientific revolution that occurred in the 17th Century initiated the advances of modern science.The scientific knowledge system created by human beings,the tremendous productivity brought about by science,and the spirit,methodologies and norms formulated in scientific practice since the 17~(th)Century have long become essential elements of  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号