首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 34 毫秒
1.
以中国传媒大学平行语料检索软件(CUC_ParaConc)为例论述平行语料检索技术,主要以纯文本形式的对齐语料为例进行阐述,包括平行语料的存储、读取技术以及双语、多语关键词检索技术。平行语料检索可分为“一对一”与“一对多”两种形式。在一对一平行语料检索中,以汉英平行语料为例分别论述了以汉语为对象的非拼音文字语料的检索技术,以英语为对象的拼音文字语料检索技术,对两者的异同进行了对比;在一对多平行语料检索中,重点论述了多语关键词检索技术。  相似文献   

2.
随着云存储服务的发展,越来越多的数据拥有者选择将数据外包给云服务商存储。为了保证数据的安全性,云服务器上的数据应该以密文形式存储。现有的多关键词密文检索技术不能兼顾准确性和安全性的问题,提出一种利用改进的向量空间模型和同态加密技术进行多关键词检索的方案。性能分析表明该方案能够有效地解决密文的多关键词检索问题。  相似文献   

3.
戴厚乐  杨庚  闵兆娥 《计算机应用》2019,39(10):2948-2954
对于可搜索加密需要均衡数据的安全性和检索效率。针对SSE-1密文检索方案中检索性能低、单关键词检索模式不足和传统单服务器架构中的单机资源局限性等问题,设计并实现了一种多关键词并行密文检索系统。该系统采用不同的索引加密方式提高密文检索性能;通过对密文倒排索引的切分实现倒排索引的分块检索,克服了单机资源的局限性并提高了检索效率;通过结合分布式特点扩展了传统单机检索架构并实现了多关键词的并行检索。实验结果表明,与SSE-1方案相比,在保证密文数据安全性的前提下所提方案能够提高检索、更新等操作的效率,实现多关键词的检索,同时动态扩展系统分布式架构以提高系统负载能力。  相似文献   

4.
针对基于关键词WEB图像检索中的语义缺失问题,利用本体的方法描述WEB图像的语义特征,构建了基于智能体和语义特征的WEB图像检索模型,该模型以领域Ontology描述WEB图像的语义特征,通过多个Agent模块分工协作,完成满足用户请求的WEB图像检索.并在Corel提供的图像上进行了仿真实验,验证了该模型解决了基于关键词WEB图像检索模型中的语义缺失问题,提高了WEB图像检索速度和准确率.  相似文献   

5.
何亨  夏薇  张继  金瑜  李鹏 《计算机科学》2017,44(5):146-152
越来越多的企业和个人用户将大量的数据存储在云服务器。为了保障数据隐私,重要数据以密文形式存储在云端,但却给数据检索操作带来严峻挑战。传统的基于明文的检索方案不再适用,已有的基于密文的检索方案存在不支持模糊检索或多关键词检索、效率较低、空间开销较大、不支持检索结果排序等问题。因此,研究安全高效的密文检索方法具有重要意义。提出了一种新的云环境中密文数据的模糊多关键词检索方案,该方案能够从云服务器上检索出包含有指定多个关键词的密文,支持模糊关键词检索,并且不会向云服务器和其他攻击者泄露与数据和检索相关的任何明文信息;使用计数型布隆过滤器和MinHash算法构建索引向量和查询向量,使得索引构建和查询过程更加高效,且排序结果更加准确。安全性分析和性能评估表明该方案具有高安全性、可靠性、检索效率和准确率。  相似文献   

6.
P2P模式的文件共享系统在Internet上得到广泛应用,但在无中央服务器的纯P2P文件共享系统中,多关键词检索问题还没有得到很好解决。针对此问题,文章提出基于分布化元数据管理DMM(DistributedMetadataManagement)的P2P文件共享模型,基于模型对多关键词检索进行分析,并以资源描述框架RDF[1]和结构化纯P2P结构P-Grid[9]为基础,介绍了支持多关键词检索的P2P文件共享模型的实现。  相似文献   

7.
基于关键词与语义概念结合的信息检索研究   总被引:1,自引:0,他引:1  
张映海  何中市 《计算机应用》2006,26(12):2964-2966
对关键词和概念检索的原理进行分析后,提出了一种基于语义概念检索的向量空间模型以及该模型与关键词检索结合的检索方法。在不同的检索领域,可以通过调整该检索方法中的结合参数达到最好的检索效果。实验结果表明,语义概念检索的向量空间模型的性能优于关键词检索的向量空间模型;结合检索方法既能保留关键词检索和概念检索的优点,也能弥补各自的不足。  相似文献   

8.
基于数据挖掘和文献计量学方法,探讨中药治疗失眠和睡眠障碍的中药研究情况。使用VOSviewer软件,以CNKI中国知网为检索平台,收集近10年中药治疗失眠的相关文献,进行可视化分析。对作者、中药关键词等内容使用文献计量学方法,构建知识图谱,分析酸枣仁治疗失眠的用药规律及研究情况。通过检索共得到相关中文文献2851篇,10年文献发表的作者群中文献贡献量最多的是福建中医药研究院和和三明市中西医结合医院,中文文献的高频关键词多为失眠、不寐、酸枣仁和临床观察等。通过发文量和所属机构分析,在该研究领域的团队合作研究成果明显,科研机构之间的沟通合作可以提升科研成果。在以酸枣仁为主要成分的治疗失眠方剂配伍研究中,通过关键词共现分析发现其潜在的药用机理和配伍规律。  相似文献   

9.
针对文本密文存储与检索需求,提出一个检索与共享功能分离的云存储模型,在此基础上设计了一种同态加密算法,并给出一种新型同态密文检索方案CRSHE。可有效解决检索关键词隐私泄漏、不支持同态加密等问题,通过排序反映文档与关键词之间的相关程度,在多关键词检索时极大地提升检索性能。测试实验表明,该方案比线性密文检索方案效率高,具有较高的准确性。  相似文献   

10.
李勇  相中启 《计算机应用》2019,39(1):245-250
针对云计算环境下已有的密文检索方案不支持检索关键词语义扩展、精确度不够、检索结果不支持排序的问题,提出一种支持检索关键词语义扩展的可排序密文检索方案。首先,使用词频逆文档频率(TF-IDF)方法计算文档中关键词与文档之间的相关度评分,并对文档不同域中的关键词设置不同的位置权重,使用域加权评分方法计算位置权重评分,将相关度评分与位置权重评分的乘积设置为关键词在文档索引向量上相应位置的取值;其次,根据WordNet语义网对授权用户输入的检索关键词进行语义扩展,得到语义扩展检索关键词集合,使用编辑距离公式计算语义扩展检索关键词集合中关键词之间的相似度,并将相似度值设置为检索关键词在文档检索向量上相应位置的取值;最后,加密产生安全索引和文档检索陷门,在向量空间模型(VSM)下进行内积运算,以内积运算的结果为密文检索文档的排序依据。理论分析和实验仿真表明,所提方案在已知密文模型和已知背景知识模型下是安全的,且具备对检索结果的排序能力;与多关键字密文检索结果排序(MRSE)方案相比,所提方案支持关键词语义扩展,查询准确率比MRSE方案更加准确可靠,而检索时间则与MRSE方案相差不大。  相似文献   

11.
针对云存储环境下已有的动态多关键词密文排序检索方案不支持关键词语义扩展、不具备前向安全和后向安全的问题,提出一种支持语义检索且具备前向安全和后向安全的动态多关键词密文排序检索方案。该方案通过构建语义关系图实现查询关键词的语义扩展;使用树索引结构实现数据的检索和动态更新;利用向量空间模型实现多关键词排序搜索;基于安全K近邻算法对维度扩展后的索引和查询向量进行加密。安全性分析表明,该方案在已知密文模型下是安全的且具有动态更新时的前向安全和后向安全。效率分析及仿真实验结果表明,该方案在服务器检索效率方面优于目前同类型具有相同安全性或相同功能的方案。  相似文献   

12.
政务信息资源检索是政务信息资源共享系统的重要功能。以《政务信息资源目录体系》国家标准中的XML元数据规范为依据,提出了一种支持关键词搜索的政务信息资源检索算法。该算法使用政务信息资源XML元数据的TF*IDF和关键词依赖度对检索结果集进行语义相关度排序,通过改进关键词倒排索引来提高检索效率。实验表明该算法在检索结果排序精确度和时间效率上均有较大的改善,可有效提高政务信息资源利用的数据共享服务能力。  相似文献   

13.
利用领域本体概念关系实现语义检索,当没有可用的本体知识时,按传统关键词匹配完成检索.这种基于领域本体的混合信息检索模型融合关键词检索和语义检索的优势,弥补各自的不足,以改善检索性能.将其应用于计算机网络领域,将基于领域本体的混合信息检索模型与传统的关键词检索模型进行对比实验,结果表明混合模型的平均查准率得到了提高,验证...  相似文献   

14.
多文档关键词抽取是进行在多篇文献中找出最能反映整体主题的关键词。对几种关键词抽取算法进行了介绍,分析了各自的优缺点,在TF/PDF算法的基础上,采用文献内和文献间综合权重的方法,提出了一种基于综合权重的多  相似文献   

15.
为了实现基于语义的密文检索,提高密文检索的准确率和效率,本文提出了一种基于biterm主题模型(biterm topic model, BTM)的多关键词可排序对称可搜索加密方案(BTM-MRSE).通过主题模型对关键词和文档之间的潜在语义进行建模,用户利用查询关键词的概率分布作为检索陷门,根据查询关键词与文档之间的语义相关性得分来获得最相关的文档.本方案将密文检索中的特定关键词替换为基于语义的主题,实现了关键词和文档标识符的分离,从而增强了文档关键词与查询关键词的隐私保护.为了减小索引规模,我们提出两层索引结构,利用平衡二叉树构造关键词-主题安全索引,结合倒排索引构造主题-文档安全索引.一方面,主题模型减小了索引节点中向量的维数,从而提高了检索效率,同时基于平衡二叉树的二级索引机制也进一步改善了密文检索效率.安全性分析证明了所提方案是安全有效的,同时利用真实数据集进行实验对比,表明本方案的密文检索准确率和效率都有极大提升.  相似文献   

16.
徐敬淇  马英瑞 《电脑学习》2011,(2):143-144,F0003
为解决传统的基于关键词的信息检索只能从语法上分析关键词、进行关键词的机械匹配,导致检索缺乏语义的问题,提出了一个基于本体的语义网检索模型,并以此为基础构建一个系统原型。实践结果表明,该检索模型能够在一定程度上改善检索效果。  相似文献   

17.
越来越多的企业和个人用户选择将大量的图像文件存储在云服务器中,并提供图像的检索和共享功能。为了保障所存储的重要图像信息不被窃取,图像文件以加密的形式存储在云服务器中,这给图像的检索操作带来了挑战。传统的明文检索方案已经无法适用,并且如何保证大量密文图像数据的检索效率和精确度也是一个重要问题。针对上述问题,提出了一种云环境中基于目标检测的密文图像检索方案,利用基于深度学习的目标检测模型Faster R-CNN对图像精确提取关键词集合和特征向量,使用关键词集合对图像集合粗分类,使用多重线性映射对关键词加密并构建安全索引,以高效检索出匹配的图像集合,再对图像特征向量精确匹配,实现图像的细分类,以检索出最终的图像。安全性分析和性能评估表明该方案具有高安全性、检索效率和精确度。  相似文献   

18.
随着云计算的广泛应用,面向数据或计算的外包服务模式越来越被业界所接受。为了保护数据拥有者外包数据的私密性,具备隐私保护能力的高效密文排序检索技术逐渐成为目前备受关注的一个研究热点。文中以面向云环境的多关键词密文排序检索技术为关注重点,介绍了现有研究工作的系统模型和威胁模型,并描述了模型中关于隐私保护、检索效率与准确率、检索结果完整性等的问题;全面分析了现有工作中典型的多关键词密文排序检索方法及相关扩展研究,讨论并梳理了这些方法的核心思想;最后,对现有研究工作进行了总结,并给出了该研究领域中待解决的关键性问题和未来的研究方向。  相似文献   

19.
针对云环境下个人医疗信息检索时出现的隐私问题,设计一种带有身份认证的公钥密文检索方法。采用RSA加密算法与SHA哈希算法对检索的关键词进行加密,先利用SHA对不同的关键词生成hash值,以防止检索时将关键词暴露给云服务器,接着用RSA公钥对关键词的hash值进行加密,并保存关键词密文。用户检索时,先用自己的私钥对采用相同SHA哈希算法生成的关键词hash值加密,同时加入用私钥对身份加密的数字签名信息,并一起上传云服务器。服务器检索时,利用用户的公钥进行解密,得到身份验证和关键词hash值。服务器先对身份进行认证,认证通过后再用公钥对关键词hash值加密,然后与保存的关键词密文进行匹配,相同则返回密文数据,不同则提示查询出错。此外对个人医疗数据的其他字段采用DES与RSA的混合加密方式。该方法不仅保障了系统的性能,而且有效地保护了用户数据的机密性与隐私性。  相似文献   

20.
应用于用户兴趣建模的多文本关键词抽取研究   总被引:1,自引:0,他引:1  
寇苏玲  蔡庆生 《计算机仿真》2007,24(2):103-105,109
现有的关键词抽取算法大部分是基于单篇文档的,虽然能成功抽取出单个文章的关键词,却无法满足针对多文档的关联检索.以单文档关键词抽取为基础,引入多文本文摘中的质心概念和MMR公式并加以变形,提出并分析比较了两种多文档关键词抽取算法:对内容相近的多篇文章进行关键词抽取,并按照权重生成关键词向最,建立基于关键词向量空间的用户兴趣模型.通过对5个主题100篇文章的测试表明,使用这两种算法提取出的关键词的准确率和召回率均达到了85%左右,能够较为准确地表示用户的兴趣模型.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号