首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
对中文文档标签生成的算法进行了研究,提出了一种中文文档标签生成的混合算法(Hybrid Tags Generation Algorithm)。鉴于短语在表达文档主题方面的优势,先进行短语模式匹配,然后利用短语的统计特性,综合考虑TF-IDF、词跨度和位置3个特征进行权重计算,从而抽取出权重较高的词语或短语作为标签。通过对实验数据的分析表明,该算法在查准率方面表现较好。通过人工比对可知,标签表达文档内容主题的效果相当或优于测试集标准答案的比率超过六成,取得了比较好的结果。  相似文献   

2.
3.
本文针对词粒度注意力的缺点,通过借鉴HAN层次化注意力机制的思想,提出将层次化注意力机制运用于编码器层中,进而得到句子粒度的隐藏层状态信息;在此基础上,解码器层基于句子粒度的隐藏层状态信息进行注意力操作;采用辅助向量的方法避免了序列生成过程存在的重复标签生成问题。最后通过引入开源数据集进行了有效性验证。  相似文献   

4.
已有的多标签懒惰学习算法(IMLLA)在利用近邻标签时因仅考虑了近邻标签相关性信息,而忽略相似度的影响,这可能会使算法的鲁棒性有所降低。针对这个问题,引入萤火虫方法,将相似度信息与标签信息相结合,提出一种融合萤火虫方法的多标签懒惰学习算法(FF-MLLA)。首先,利用Minkowski距离来度量样本间相似度,从而找到近邻点;然后,结合标签近邻点和萤火虫方法对标签计数向量进行改进;最后,使用奇异值分解(SVD)与核极限学习机(ELM)进行线性分类。该算法同时考虑了标签信息与相似度信息从而提高了鲁棒性。实验结果表明,所提算法较其他的多标签学习算法有一定优势,并使用统计假设检验与稳定性分析进一步说明所提出算法的合理性与有效性。  相似文献   

5.
郑宇  贾如  沈军  李茹 《计算机与数字工程》2021,49(12):2496-2500,2508
如今网络购物用户规模不断上升,评论数据成为消费者进行购买决策的主要依据.同时,商家需要利用评论明确用户.消费者没有充足时间、合适语言进行商品评论成为一个亟待解决的问题.然而,仅有少数网购平台在评论页面提供标签,只能说明商品局部特点,没有体现用户个性化需求.论文通过分析用户评论中彰显用户个性化的语言描述特点,不同种类商品的描述方面差异,设计能够自动生成个性化评论标签的算法,用标签充分体现商品特点与用户需求.将单个用户作为研究对象,其全部评论作数据集,在TextRank模型中加入词性-句法特征分析,捕获用户评论语言描述风格的内在联系.对比单独使用TextRank模型等三个成熟模型生成标签,算法效果更好.  相似文献   

6.
针对推荐算法中数据的稀疏性难题,把用户标签融合至实值条件受限玻尔兹曼机(real-valued conditional restricted Boltzmann machine,R_CRBM)模型,利用R_CRBM强大的拟合任意离散分布的能力,预测出用户对未交互商品的评分缺失值。具体来说,首先提出显层单元为实值的R_CRBM模型,接着运用文本分类中的TF-IDF算法预测出用户对所应用过的标签的喜爱度,与标签基因数据相乘得到用户对商品的预测评分,融合至用户历史评分数据中。R_CRBM条件层在原有评分/未评分{0,1}向量中,融入用户标签/未标签{0,1}向量。通过真实数据集进行对比分析,实验结果表明提出的方法在一定程度上提升了推荐的准确性。  相似文献   

7.
曾安  徐小强 《计算机科学》2017,44(8):246-251
针对传统推荐算法存在数据稀疏影响推荐效果的问题,考虑到社交网络中的链路预测能够综合考虑用户节点之间的拓扑结构,以及好友关系能反映用户的兴趣爱好,提出了一种融合好友关系和标签信息的推荐算法。首先,借助网络资源分配算法对社交网络的结构信息进行特征提取;然后,利用TF-IDF构建合理的社会化标签模型;最后,利用线性模型融合两方面的信息,从而实现推荐。在Last.fm和Delicious数据集上的实验表明,与传统算法相比,所提算法在推荐的召回率和准确率指标上有显著提高。  相似文献   

8.
针对现有生成模型难以直接从复杂语义标签生成高分辨率图像的问题,提出了融合语义标签和噪声先验的生成对抗网络(SLNP-GAN)。首先,直接输入语义标签(包含形状、位置和类别等信息),使用全局生成器对其进行编码,并结合噪声先验来学习粗粒度的全局属性,初步合成低分辨率图像;然后,基于注意力机制,使用局部细化生成器来查询低分辨率图像子区域对应的高分辨率子标签,获取细粒度信息,从而生成纹理清晰的复杂图像;最后,采用改进的引入动量的Adam算法(AMM)算法来优化对抗训练。实验结果表明,与现有方法text2img相比,所提方法的像素精确度(PA)在COCO_Stuff和ADE20K数据集上分别提高了23.73%和11.09%;相较于Adam算法,AMM算法收敛速度提升了约一倍,且损失值波幅较小。可见,SLNP-GAN能高效地获取全局特征和局部纹理,生成细粒度、高质量的图像。  相似文献   

9.
黄山市地区具有景点众多、游客基数庞大等特点,游客在出行时的需求各不相同.千篇一律的传统服务不能满足每一位游客的要求,也无法让游客深入了解黄山市人文风景,同时限制了互联网与旅游结合的发展方向和地区经济发展高度.为了解决这一问题,向黄山市游客推荐当地特色景点、商家、规划出行计划和提供定制化旅游体验服务.本文通过基于标签推荐...  相似文献   

10.
针对标签特有特征和标签相关性的有效利用,提出了一种新的多标签算法LSFLC,它可以有效地集成标签特有特征和标签相关性。首先,对于每个标签,通过重采样技术生成新的正类实例以扩充其正类实例的数目;其次,通过特征映射函数将原始特征空间转换为特定的特征空间,得到每个标签的标签特征集;然后,对于每个标签,找到与其最相关标签,通过复制该标签的正类实例来扩大标签特征集,这不仅丰富了标签的信息,而且在一定程度上改善了类不平衡的问题;最后,对于不同的数据集进行实验分析,实验结果表明该算法的分类效果更好。  相似文献   

11.
12.
文章提出了一种基于聚类的微博关键词提取方法。实验过程分三个步骤进行。第一步,对微博文本进行预处理和分词处理,再运用TF-IDF算法与TextRank算法计算词语权重,针对微博短文本的特性在计算词语权重时运用加权计算的方法,在得到词语权重后使用聚类算法提取候选关键词;第二步,根据n-gram语言模型的理论,取n的值为2定义最大左邻概率和最大右邻概率,据此对候选关键词进行扩展;第三步,根据语义扩展模型中邻接变化数和语义单元数的概念,对扩展后的关键词进行筛选,得到最终的提取结果。实验结果表明在处理短文本时Text Ramk算法比TF-IDF算法表现更佳,同时该方法能够有效地提取出微博中的关键词。  相似文献   

13.
关键词提取在自然语言处理领域有着广泛的应用,如何准确、快速地从文本中获取关键词信息已经成为文本处理的关键性问题。现有的关键词提取方法很多,但是这些关键词提取方法的准确率和通用性有待提高。因此,提出了一种改进的TextRank关键词提取方法,该方法使用TF-IDF方法与平均信息熵方法计算文本中词语的重要性,然后根据计算结果得到词语的综合权重。利用词语的综合权重改进TextRank算法的节点初始值以及节点概率转移矩阵,通过迭代的方式计算各个节点的权重,直至收敛,从而得到词语的权重信息,选择top N个词语作为关键词输出,实现关键词的提取功能。实验结果表明,相较于传统的TF-IDF方法和TextRank方法,提出的改进后的TextRank关键词提取方法有更好的通用性,提取的关键词的准确率更高。  相似文献   

14.
吴玮  郑娟毅  杜乐 《计算机科学》2018,45(7):252-258
传统的Camshift算法以颜色直方图为特征对目标进行跟踪,对刚性目标的跟踪具有较强的鲁棒性。当目标受到颜色相近的干扰物干扰或者部分遮挡时,其跟踪效果和准确度不太理想。为此,提出一种多特征融合的Camshift目标跟踪算法。首先,对目标的颜色特征、边缘特征和空间信息进行提取和处理,得到颜色空间直方图和空间边缘方向直方图;然后,分别在Camshift算法框架下得到目标匹配中心位置,采用每一帧图像的相似度向量得到权值系数,通过自适应加权融合的方法得到最优中心位置。实验结果表明,相较于传统的Camshift目标跟踪算法和改进的复杂特征融合的Meanshift算法,所提方法能够更有效地克服颜色干扰、目标重叠遮挡对跟踪效果的影响,避免了 目标 在跟踪过程中丢失的问题,突破了传统方法的局限性。  相似文献   

15.
张晓伟  刘弘  孙玉灵 《计算机工程》2012,38(17):214-217,225
基于模型的跟踪方法难以处理足球视频中球员形态发生较大变化的情况。为此,提出一种改进的多特征自适应融合的球员跟踪算法。利用自适应高斯混合模型检测球场和球员区域,使用球员HUE颜色特征的Bhattacharyya距离度量法代替传统的模板匹配方法,辨别球队归属,自适应地融合目标模型的颜色、形状和时空特征信息,实现对球员的跟踪,采用三点估算预测方法解决球员完全遮挡现象。实验结果表明,该算法能较好地解决球员之间的遮挡问题,在球员形态变化较大时能实现稳定的跟踪。  相似文献   

16.
针对AdaBoost人脸检测方法在高分辨率彩色图像上定位速度慢和误检率高的问题,提出一种多特征融合的人脸检测方法。该方法使用级联策略将多种特征分类器有效地组合起来,高效地利用各种特征之间的互补性,形成一种新型的高性能分类器。实验结果显示,该方法提高了检测速度、降低了误检率。  相似文献   

17.
潘伟毅  李岩 《计算机工程》2010,36(14):70-73
缓冲区分析是GIS中重要的空间分析方法之一。针对现有方法处理大数据量矢量地图时的低效率问题,提出一种易于并行处理和编程实现的缓冲区生成的随机算法,并设计适用于多种形式的应用模式,以适应缓冲区分析普适性应用。采用舍伍德随机算法优化计算效率,利用可伸缩矢量图形遮罩对象解决可视化问题。测试结果证明,该算法可以提高大数据集的处理效率。  相似文献   

18.
在采用遗传算法进行智能组卷的过程中,常出现选择策略缺乏多样性保护机制的现象,易出现早熟收敛。为解决智能组卷的早熟收敛问题,提出一种自适应小生境遗传算法。采用小生境技术可提高个体的选择概率,增加个体的多样性选择机率;在保证算法收敛速度的情况下,给出一种一致变异算子,同时调节个体的变异概率和变异范围,提高种群多样性。最后,通过具体实例验证了该算法在较短的组卷时间内,可以实现全局寻优的结果,从而证明该算法的有效性。自适应小生境遗传算法在智能组卷中的应用具有实际意义。  相似文献   

19.
从软件体系结构配置生成测试用例是软件测试领域中的一个重要分支。本文首先提出了一组基于软件体系结构配置的测试标准及其计算规则。基于此,实现了基于软件体系结构配置的测试用例生成算法并分析了其时间复杂性。对人机结口(Marr-Machine Interface,MMI)实验表明,所提出的算法能够根据测试标准生成测试用例。  相似文献   

20.
描述了任意形状三维区域的非结构四面体网格生成算法,该算法对不含裂纹的区域、含单裂纹或多裂纹的区域都适用。算法首先使用八叉树来确定网格单元大小,然后采用前沿推进技术来生成网格。在前沿推进过程中,采用基于几何形状和基于拓扑结构的两个步骤来保证前沿向前移动过程中发生问题时仍能进行正确执行,并且使用了一种局部网格优化方法来提高网格划分的质量。最后,将算法运用到带有裂纹的复杂实体模型,实验结果表明该算法具有较强的适用性和较高的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号