排序方式: 共有347条查询结果,搜索用时 156 毫秒
1.
文本阅读能力差和视觉推理能力不足是现有视觉问答(visual question answering, VQA)模型效果不好的主要原因,针对以上问题,设计了一个基于图神经网络的多模态推理(multi-modal reasoning graph neural network, MRGNN)模型。利用图像中多种形式的信息帮助理解场景文本内容,将场景文本图片分别预处理成视觉对象图和文本图的形式,并且在问题自注意力模块下过滤多余的信息;使用加入注意力的聚合器完善子图之间相互的节点特征,从而融合不同模态之间的信息,更新后的节点利用不同模态的上下文信息为答疑模块提供了更好的功能。在ST-VQA和TextVQA数据集上验证了有效性,实验结果表明,相比较此任务的一些其他模型,MRGNN模型在此任务上有明显的提升。 相似文献
2.
针对网络工程专业实践性较强的特点,提出了网络工程专业实践教学体系的建设思路、具体内容及实施与保障等。给出由课程内实验、课程设计、实习、毕业设计等逐级强化的实践教学体系,结合实际介绍实验室和实习、实训基地等的建设,最后总结该实践教学体系具有的特点及未来需进一步完成的工作。 相似文献
3.
针对遥感影像数据量大,多用户并发请求造成服务器负载加重,使遥感影像传输效率逐渐降低的问题,提出一种在多线服务器环境下分块调度遥感影像资源的策略。该策略采用改进的蚁群优化(IACO)算法,通过引入一个线路等待因子γ动态选择当前最优的线路进行传输,从而提高传输效率。对IACO、ACO、Max-min、Min-min和Random算法进行了对比实验,IACO算法在客户端的任务完成时间和服务器端的执行时间与其他算法相比均是最少的,且随着任务数目的增加,效果更明显;同时IACO算法的线路资源的利用率也更高。仿真结果表明:多线服务器分块调度策略与改进蚁群算法相结合,使遥感影像传输速度和线路资源利用率均有一定提高。 相似文献
4.
传统K-means算法对初始聚类中心选择较敏感, 结果有可能收敛于一般次优解, 为些提出一种结合双粒子群和K-means的混合文本聚类算法。设计了自调整惯性权值策略, 根据最优适应度值的变化率动态调整惯性权值。两子群分别采用基于不同惯性权值策略的粒子群算法进化, 子代间及子代与父代信息交流, 共享最优粒子, 替换最劣粒子, 完成进化, 该算法命名为双粒子群算法。将能平衡全局与局部搜索能力的双粒子群算法与高效的K-means算法结合, 每个粒子是一组聚类中心, 类内离散度之和的倒数是适应度函数, 用K-means算法优化新生粒子, 即为结合双粒子群和K-means的混合文本聚类算法。实验结果表明, 该算法相对于K-means、PSO等文本聚类算法具有更强鲁棒性, 聚类效果也有明显的改善。 相似文献
5.
针对边缘检测中阈值很难确定导致不能准确提取背景边缘信息的问题,提出一种改进的基于边缘信息车流量检测方法。该方法预先对路况边缘图像作削顶处理获取一个恰当的阈值,从而可以准确地提取背景边缘信息;且在车辆计数过程中,结合固定窗法和浮动窗法二者的优点,设计一种新的浮动窗法进行车辆计数。实验结果表明,该方法在实时性、检测速度、正确率等方面得到很大的改进,能够在不同环境下进行正确有效地车流量检测。 相似文献
6.
针对模糊C均值算法需要不断迭代来计算样本数据的隶属度值以及聚类中心的特点,利用MapReduce模型解决海量数据下的模糊C均值问题,进而提出高效的模糊C均值算法。在Map阶段和Reduce阶段分别完成隶属度和聚类中心的计算,每次迭代都需要启动一次完整的MapReduce执行过程。通过多次迭代计算出隶属度值以及聚类中心,并更新聚类中心文件,供下一轮作业使用,重复执行这一过程直至得到最终聚类结果。实验结果表明,该算法能够有效减少MapReduce计算过程中的迭代次数,从而提高整体执行效率。 相似文献
7.
8.
基于图像纹理复杂度的小波域数字水印算法 总被引:1,自引:0,他引:1
针对水印信息嵌入量小、鲁棒性弱、遮蔽性差的问题,提出一种基于图像纹理复杂度的小波域人类视觉系统的水印算法。该算法将载体图像进行分块,计算每块的图像熵,并根据图像熵对载体图像的纹理特征区域进行分类,不同纹理特征水印的嵌入量不同。利用Logistic映射对水印信号进行置乱变换,将水印信号嵌入到二层离散小波变换的低频系数中,并利用小波域人类视觉模型控制水印的嵌入强度。在提取水印时,通过水印误码率和峰值信噪比评价水印质量。实验结果表明,该算法能抵抗噪声干扰、裁剪和密钥攻击,水印图像具有较强的鲁棒性和良好的遮蔽性。 相似文献
9.
目的 为了有效解决传统行人检测算法在分辨率低、行人尺寸较小等情境下检测精度低的问题,将基于区域全卷积网络(region-based fully convolutional networks,R-FCN)的目标检测算法引入到行人检测中,提出一种改进R-FCN模型的小尺度行人检测算法。方法 为了使特征提取更加准确,在ResNet-101的conv5阶段中嵌入可变形卷积层,扩大特征图的感受野;为提高小尺寸行人检测精度,在ResNet-101中增加另一条检测路径,对不同尺寸大小的特征图进行感兴趣区域池化;为解决小尺寸行人检测中的误检问题,利用自举策略的非极大值抑制算法代替传统的非极大值抑制算法。结果 在基准数据集Caltech上进行评估,实验表明,改进的R-FCN算法与具有代表性的单阶段检测器(single shot multiBox detector,SSD)算法和两阶段检测器中的Faster R-CNN(region convolutional neural network)算法相比,检测精度分别提高了3.29%和2.78%;在相同ResNet-101基础网络下,检测精度比原始R-FCN算法提高了12.10%。结论 本文提出的改进R-FCN模型,使小尺寸行人检测精度更加准确。相比原始模型,改进的R-FCN模型对行人检测的精确率和召回率有更好的平衡能力,在保证精确率的同时,具有更大的召回率。 相似文献
10.
相较于协同过滤,矩阵分解有着更好的拓展性和灵活性,但同样受到数据稀疏和冷启动的困扰。针对上述问题,提出一种融合GNN和PMF的推荐算法GNN_MF。该算法通过神经网络对社交网络图以及用户项目图进行建模,将两个图内在的联系起来,学习目标用户在社会空间以及项目空间上的特征向量。通过MLP将两个特征向量串联提取用户的潜在特征向量,集成在概率矩阵分解模型上,产生预测评分。在真实数据集Epinions、Ciao上的大量实验表明,GNN_MF算法的均方根误差和平均绝对误差较传统PMF分别降低了2.91%、3.10%和4.83%、3.84%。验证了GNN_MF算法在推荐系统中的有效性以及可行性。 相似文献