首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
为了提高信息挖掘方法的效率和动态性,支持在线定义知识提取模式,提出一种快速文本匹配框架.该框架包括上下文索引、上下文挖掘语言、上下文匹配算法等模块.框架从索引中直接获得提取内容的上下文信息,无需依赖文本过滤,从而提高信息提取性能.理论分析和实验表明:本框架提取方法同文本提取方法、倒排提取方法等相比,其运行时间在不同大小和结构的数据集上更为稳定高效,提取模式的长度对本框架的影响较小,因此,适合海量数据的在线提取.  相似文献   

2.
针对频繁项集挖掘算法中多次扫描数据库、生成大量无效频繁项集的问题,提出一种基于倒排索引和二维数组的挖掘算法。通过一次扫描数据库建立包含事务的倒排索引,解决多次扫描数据库的问题。在二维数组存储候选频繁项集时,引入标志位约束,避免产生大量无效的频繁项集。与其他算法在不同规模的数据集上进行性能比较,发现算法在数据集超过25万时执行效率优于其他算法。通过实验验证了所提出算法的高效性和可行性。  相似文献   

3.
针对现有的近似查询模型对查询精度的可控性较差,后续处理效率较低的问题,提出基于两级过滤的查询模型.通过采用不同粒度的SAX表示方法提取时间序列的字符型特征向量,可以将高维的时间序列映射到低维的特征空间;将不同粒度的特征向量以向量近似文件(VA-File)的结构进行存储,有效引入了倒排索引.在查询过程中,设计了启发式的查询过滤算法,根据粗粒度特征向量查询细粒度特征向量,实现第一级过滤;针对VA-File设计了高效的边界剪枝算法,实现第二级过滤.模型基于多粒度的SAX特征向量进行构建,可以对查询精度进行有效控制;在第二级过滤中采用的边界剪枝算法可以有效地提高后续处理的执行效率.实验结果表明,提出的查询模型具有较高的性能,对时间序列长度、kNN查询规模及数据集规模具有稳定的扩展性.  相似文献   

4.
研究在移动云计算环境下的最大双色反最近邻查询优化问题,设计新的高效的双色反最近邻查询算法——SILM算法.SILM算法是基于MapReduce框架下的倒排网格索引结构,在Map函数中对分片数据区域使用PCT轮圈算法.对包含在圆区域内或与圆相交的网格的权值记为1,在Reduce函数中使用网格处理算法对分片数据区域进行扫描及合并,对重叠的网格的权值进行累加,输出网格空间中权值最大的网格区域.SILM算法可以在多计算节点上进行分布式计算,更适合于在移动云计算环境下处理大规模并行查询请求.通过实验对SILM算法的效率进行验证.实验结果表明,当数据量较大(数据点个数大于2.0×10~6)时,SILM算法的查询效率是目前解决最优选址问题最佳算法的2倍.  相似文献   

5.
基于加权信息熵相似性的协同过滤算法   总被引:1,自引:0,他引:1  
协同过滤算法是推荐系统中最为成功的技术之一,相似性计算是协同过滤算法的核心.针对传统的相似度计算方法在数据稀疏的情况下推荐不准确问题,提出了基于项目间差异信息熵的相似度计算方法,先通过差异值和共同评价数目对信息熵进行加权,再归一化处理来计算项目间的相似度.用基于项目(Item-based)相似性的协同过滤算法进行了实验验证,实验结果表明,该算法提高了个性化推荐精度.  相似文献   

6.
首先,通过索引连接例子,分析了影响效率的因素。在扩展倒排索引基础上,构建了B-树索引,以支持大规模数据的高效查找。然后,构建了二级索引,以减少索引连接中的大量重复判断。最后,提出了路径查询算法。实验结果表明:该索引方法能够有效地解决索引连接问题和显著地改善数据空间路径查询效率。  相似文献   

7.
空间连接是空间数据库中最重要最耗时的操作,国内外学者的研究多是基于索引结构空间连接的一次过滤方法,其中基于R-tree的空间连接算法被认为是一种高效的处理机制。本文提出了基于R-tree空间连接的二次过滤方法,缩小了过滤阶段的候选集大小,可有效提高查询效率。  相似文献   

8.
传统基于项目的协同过滤算法离线计算项目间的相似度,提高了向用户推荐的速度,但极大的数据稀疏度影响了推荐质量,且该算法也忽略了用户兴趣随时间变化这一现象. 针对上述问题,提出了一种融合项目聚类和时间权重的动态协同过滤算法,根据用户偏好对项目进行聚类,找出类别偏好相似的候选邻居,再在候选邻居中搜寻最近邻,排除与目标项目共同评分较少的项目干扰,提高了搜寻相似项目的准确性. 同时,引入时间权重来反映用户兴趣随时间的变化,从整体上提高推荐质量. 在MovieLens数据集上进行实验,实验结果表明,本文所提出算法的推荐质量较传统的协同过滤算法有显著提高.  相似文献   

9.
针对中文环境下的模式冲突问题,提出了一种利用元数据的模式匹配方法.该方法从数据字典中为模式提取特征向量,并采用聚类技术对其进行聚类,将语义相近的模式划分到相同聚簇中;对于同一聚簇中的不同模式,借助辅助词典计算属性间的语义相似度,并采用多种选择策略相结合的方法对结果进行过滤,为每个属性生成候选匹配集合.实验结果表明,该方法不仅可以提高模式匹配效率,而且具有较高的准确度.  相似文献   

10.
针对子图同构中索引构建方法效率低、内存占用大而影响查询效率的问题,本文提出基于2次排序查找等价顶点的数据图索引构建算法。该算法采用不同邻接链表表示类别不同的语法等价顶点的邻居集合,并依此设计2次排序的方法快速查找数据图中两两互连和两两互不相连的等价顶点,然后依据语法等价和语法包含关系为数据图构建索引来提高子图同构查询的效率。最后,基于不同规模的数据集,通过实验验证了本文提出索引构建算法的高效性和可扩展性。  相似文献   

11.
为解决现有语义模糊可搜索加密方案无法取得排序可验证的问题,提出一种支持语义模糊搜索并能对搜索结果的排序进行验证的方案。首先引入相关度分数和域加权得分,构造精确度更高的倒排索引结构。通过非线性保序加密,云服务器可以对搜索结果进行高效排序,减少了用户的计算开销和网络资源浪费。接着基于WordNet词典集对查询关键词进行语义拓展。在构造出语义拓展树后,只选取最相关的语义拓展词进行查询。通过引入语义相似度,设计双因子排序算法对搜索结果进行精确排序。然后为创建验证信息,将关键词集合插入布隆过滤器中,并计算布隆过滤器、安全索引、密文文档的消息认证码。在搜索阶段,通过布隆过滤器可以验证索引中是否存在查询关键词,并使用消息认证码对索引、文档的完整性和正确性进行验证。通过引入索引树结构进一步提高方案的搜索效率。最后,将本方案与相关方案在功能、存储开销、搜索开销等方面进行比较,并对创建索引、创建验证信息、语义拓展、加密查询、查询、验证等方面的开销进行仿真实验。方案对比分析显示本方案在语义搜索、排序、验证等功能上具有优势。实验结果表明,本方案不仅实现了语义模糊搜索与结果排序,而且实现了排序结果可验证功能。  相似文献   

12.
在基于可再生能量收集技术的移动边缘计算(Mobile Edge Computing, MEC)系统中,可再生能量到达和计算卸载无线信道呈现较强的时空变化特性,因此该系统的无线及计算资源管理与用户任务计算之间存在着动态适配的挑战。针对此类问题,本文研究多时隙多用户的能量采集边缘计算系统,建立可再生能量随机到达和无线信道模型以及预测误差模型,以系统总计算吞吐量最大化为准则,通过逐时隙联合优化用户本地计算和计算卸载模块,提出了一种在线滑动窗设计方案, 需要通过调整滑动窗长度M来实现。该方案逐时隙求解凸优化问题,基于离线资源动态管控的最优结构,实时制定资源管理策略,具有较低的计算复杂度。仿真实验结果表明,提出的在线滑动窗设计方案在系统计算吞吐量性能方面优于已有的基准方案,并在对抗信道/能量状态信息预测误差方面有较好的鲁棒性能。  相似文献   

13.
针对评分数据的稀疏性制约协同过滤推荐性能的情况,提出一种新的相似性度量方法。首先,定义了用户的模糊信息熵以反映用户评分偏好的不确定程度;其次,利用两两用户的模糊互信息衡量用户之间的相似程度;最后,同时考虑用户之间的模糊互信息和用户的模糊信息熵,并设计一种基于模糊信息熵的相似性度量方法以计算用户之间的相似性。在两个公开数据集上的试验结果表明:基于模糊信息熵的相似性度量方法能够降低数据稀疏性的影响,并能显著提高推荐系统的推荐性能。  相似文献   

14.
针对多传感器系统的观测噪声为非高斯噪声的问题,通过Student’s t滤波框架和四元数特性相结合,以无迹变换计算Student’s t加权积分函数,设计基于Student’s t分布的无迹四元数滤波算法,作为局部滤波算法. 利用拉格朗日乘子法计算最优融合权重系数,通过线性加权融合的方式,对各局部滤波结果进行融合. 采用基于四元数的目标姿态运动模型进行仿真,利用3个星敏感器同时对同一目标进行观测,通过与已有的鲁棒无迹Student’s t滤波(RSTUF)算法对比,验证所提算法的有效性. 仿真结果表明:所提算法在对目标姿态的估计精度、滤波收敛速度及收敛后的数值稳定性方面均高于RSTUF算法;通过多个观测信息互补,提高了估计精度及容错性.  相似文献   

15.
针对目标遮挡、形变等复杂环境中多目标跟踪准确性低的问题,提出了一种多特征融合匹配的霍夫森林多目标跟踪算法.首先,该算法根据目标检测响应进行初步关联,在线选取正负样本,通过融合颜色直方图、方向梯度直方图特征以及光流信息构建目标的特征模型;然后利用霍夫森林学习,形成可靠的长轨迹;最后采用多特征融合的轨迹匹配算法,引入颜色直方图的相似性度量和基于Gabor滤波器的特征点匹配两种方式,形成加权融合的概率矩阵,将长轨迹逐级关联为目标的完整轨迹.实验表明,该算法在多个复杂环境的视频序列中,可以有效解决目标形变、相互遮挡等问题,能实现多目标的鲁棒性跟踪.  相似文献   

16.
为解决图集近似包含查询,提出一种基于图解构的GCSS算法.该算法通过对图集中的目标图进行解构,得到图集中子图分布情况,并利用该子图分布建立索引.在此索引基础上的查询算法对图集进行近似包含查询,不但可以避免确定候选集的过程中产生过多子图同构测试,而且形成较小候选集,提高验证阶段效率.实验结果表明,GCSS算法能高效完成近似包含查询任务,得到图集中被查询图近似包含的正确结果.  相似文献   

17.
一种高效的基于身份的强指定验证者签名方案   总被引:4,自引:1,他引:3  
目前人们提出了一些基于身份的强指定验证者签名方案,不过这些方案都存在不足之处。针对这些问题,本文利用双线性映射提出了一个新颖的基于身份的强指定验证者签名方案,并在随机预言模型下基于双线性Diffie-Hellman假设严格证明了方案的安全性。通过与现有方案的比较,可以看出本文提出的方案不但效率是最高的,而且签名长度也是最短的。  相似文献   

18.
在迅速发展的网络信息时代,我国网上证券交易已经成为各券商竞争的焦点,卷商只有提高网上证券交易竞争能力,才能在激烈的竞争中占据优势.针对网上证券交易竞争能力的问题,依据网络证劵交易的前提假设,设计出影响网上证券交易竞争力的指标体系;依据综合权重的方法,设定不同的影响权重,构建综合竞争力数据模型;并从间接数据和直接数据两方面着手,对于网上证劵交易竞争能力进行分析.通过对网上证券交易竞争力量化分析,可以得出各券商所从事的网上证券交易的竞争力的强弱,同时有助于券商比较客观地找出自身不足.  相似文献   

19.
大多数用户相似性算法在计算用户相似性时只考虑了用户间的共同评分项,而忽略了用户其他评分中可能隐藏的有价值信息.为了准确评估用户间的相似性,提出了一种基于KL散度的用户相似性协同过滤算法.该算法不仅利用了共同评分项,还考虑了其他非共同评分信息的影响.该算法充分利用了用户的所有评分信息,提高了用户相似性度量的可靠性和准确性.实验结果表明,该算法优于当前主流的用户相似性算法,且在没有共同评分信息的条件下,仍能有效地完成用户相似性度量,解决了对共同评分项的完全依赖问题,具有更好的适应性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号