排序方式: 共有18条查询结果,搜索用时 241 毫秒
1.
语音驱动唇形动画的同步是人脸动画的难点之一。首先以音节为识别单位,通过严格的声韵母建模方法,利用HTK工具包,识别得到语音文件中的音节序列与时间信息;然后利用基本唇形库和音节到唇形映射表,获得与音节序列对应的唇形序列;利用唇形序列的时间信息插值播放唇形序列,实现语音驱动的唇形动画。实验表明,该方法不仅大大减少了模型数目,而且能准确识别音节序列以及时间信息,可有效地实现语音与唇动的同步。 相似文献
2.
诊断直肠癌时,如果能够从CT图像中自动准确分割出直肠肿瘤区域,将有助于医生进行更准确和快速的诊断。针对直肠肿瘤分割问题,提出基于U-Net改进模型的直肠肿瘤自动分割方法。首先在U-Net模型的每级编码器中嵌入子编码模块提升模型特征提取能力;其次通过对比不同优化器的优化性能,获得最适合的优化器用于训练模型;最后对训练集进行数据扩充使模型得到更充分的训练,从而提高分割性能。与U-Net、Y-Net和FocusNetAlpha三种网络模型进行的对比实验表明:所提改进模型得到的分割区域与真实肿瘤区域更接近,对小目标的分割性能更突出,该模型的查准率、查全率和Dice系数三个评价指标都优于对比的模型,能有效分割直肠肿瘤区域。 相似文献
3.
针对基于共享最近邻的密度峰聚类算法中的近邻参数需要人为设定的问题,提出了一种基于自适应近邻参数的密度峰聚类算法。首先,利用所提出的近邻参数搜索算法自动获得近邻参数;然后,通过决策图选取聚类中心;最后,根据所提出的代表点分配策略,先分配代表点,后分配非代表点,从而实现所有样本点的聚类。将所提出的算法与基于共享最近邻的快速密度峰搜索聚类(SNN?DPC)、基于密度峰值的聚类(DPC)、近邻传播聚类(AP)、对点排序来确定聚类结构(OPTICS)、基于密度的噪声应用空间聚类(DBSCAN)和K-means这6种算法在合成数据集以及UCI数据集上进行聚类结果对比。实验结果表明,所提出的算法在调整互信息(AMI)、调整兰德系数(ARI)和FM指数(FMI)等评价指标上整体优于其他6种算法。所提算法能自动获得有效的近邻参数,且能较好地分配簇边缘区域的样本点。 相似文献
4.
为了提高铁路轨道线检测的准确率和速度,提出了一种基于深度卷积神经网络(CNN)和聚类的左右轨道线检测方法。首先,处理数据集的标注图像,将原标注图均匀分割成许多网格,每个网格局部区域的轨道线信息用一个像素点代替,从而构成缩小的轨道线标注图;然后,基于缩小后的轨道线标注图,提出了一种新的深度CNN用于轨道线检测;最后,提出一种聚类方法来区分左右轨道线。对于长宽都为1 000像素大小的图片,所提左右轨道线检测方法的检测速度达到155 frame/s,准确率达到96%。实验结果表明,所提方法不仅检测准确率高,而且检测速度快。 相似文献
5.
旅行商问题是一个组合优化问题。首先,构造一个能量函数来表示旅行商问题,该能量函数的能量最小点对应一条有效的近似最优访问路径;然后,构造一种LV神经网络模型来求解该能量函数的能量最小点。实验结果表明,本文提出的LV神经网络模型能够收敛到能量最小点,并且与Hopfield网络相比,该LV神经网络模型具有更好的求解性能。 相似文献
6.
语音驱动口型动画是人脸表情动画中非常关键的部分。在研究语音与口型动画同步问题的基础上.提出一种真实、自然的语音口型动画实现方法。该方法首先对输入语音进行大段分割;再通过SAPI识别出具体的汉语序列信息;然后将汉语序列转换为音节序列;最后通过音节序列到口型序列的转换得到舍有口型时间信息的口型序列。在动画模块中利用该口型序列驱动3D人脸模型口型动画。取得了真实、自然的语音动画同步效果。 相似文献
7.
错误的目标检测可能导致严重事故,因此高精度的目标检测在汽车自动驾驶中至关重要。提出了一种嵌入注意力和特征交织模块的Gaussian-YOLO v3目标检测方法。该方法主要对Gaussian-YOLO v3的几个特定特征图进行了改进:首先在特征图中添加注意力模块以自主学习每个通道的权重,增强关键特征、抑制冗余特征,从而加强网络对前景目标和背景的区分能力;其次,同时将特征图的不同通道进行特征交织得到更具表征性的特征;最后,把注意力和特征交织模块分别得到的特征融合构成新的特征图。实验结果表明,所提方法在BDD100K数据集上达到了20.81%的平均精确率均值(mAP)和18.17%的F1分数,使误报率减少了3.5%,意味着误报率得到了有效降低。由此可见,所提方法的检测性能优于YOLO v3和Gaussian-YOLO v3。 相似文献
8.
9.
对汽配件颜色喷涂顺序进行优化有助于企业进一步降低生产成本,而目前尚无研究对该类问题提出针对性的数学模型和解法。考虑到每一个汽配件必须喷涂且只喷涂一次,具有旅行商问题(TSP)的基本特征,为此提出了TSP转化的建模方法并选用并行性和鲁棒性强的遗传算法(GA)进行求解。首先,将汽配件定义为TSP顶点,根据汽配件的颜色和类别要求定义顶点之间的距离和生产约束条件,以此构建了使喷涂序列颜色切换次数最少的0-1规划模型。其次,将汽配件的颜色和类别约束转化为惩罚因子,从而构成遗传算法的适应度函数,并基于锦标赛选择策略综合设计了复制、交换、翻转、滑动的变异策略。最后,构造汽配件数为64、93、293个,颜色数为5、7、10种的三组数据进行仿真实验,所提算法对这三组数据均能求得精确最优解5,7,10,而重复运行算法,可以获得近似最优解的均值分别为5.63,7.30,11.49。实验结果表明所建立的数学模型对汽配件颜色喷涂顺序问题的刻画准确,设计的遗传算法高效实用,此二者可推广应用于其他类似的生产加工问题。 相似文献
10.
基于红外相机图像的野生动物目标检测有利于研究和保护野生动物。由于不同种类的野生动物数量差别大,红外相机采集到的野生动物数据集存在种类数量分布不均的长尾数据问题,进而影响目标检测神经网络模型的整体性能提升。针对野生动物的长尾数据导致的目标检测精度低的问题,提出了一种基于两阶段学习和重加权相结合的长尾数据解决方法,并将该方法用于基于YOLOv4-Tiny的野生动物目标检测。首先,采集、标注并构建了一个新的野生动物数据集,该数据集具有明显的长尾数据特征;其次,采用基于迁移学习的两阶段方法训练神经网络,第一阶段在分类损失函数中采用无加权方式进行训练,而在第二阶段提出了两种改进的重加权方法,并以第一阶段所得权重作为预训练权重进行重加权训练;最后,对野生动物测试集进行测试。实验结果表明,在分类损失采用交叉熵损失函数和焦点损失函数下,所提出的长尾数据解决方法达到了60.47%和61.18%的平均精确率均值(mAP),相较于无加权方法在两种损失函数下分别提高了3.30个百分点和5.16个百分点,相较于所提改进的有效样本加权方法在焦点损失函数下提高了2.14个百分点,说明该方法能提升YOLOv4-Tiny网络对具有长尾数据特征的野生动物数据集的目标检测性能。 相似文献