排序方式: 共有6条查询结果,搜索用时 0 毫秒
1
1.
为方便非专业用户修图,提出一种基于Transformer的图像编辑模型TMGAN,使用户可通过自然语言描述自动修改图像属性。TMGAN整体框架采用生成对抗网络,生成器采用Transformer编码器结构提取全局上下文信息,解决生成图像不够真实的问题;判别器包含基于Transformer的多尺度判别器和词级判别器两部分,给生成器细粒度的反馈,生成符合文本描述的目标图像且保留原始图像中与文本描述无关的内容。实验表明,此模型在CUB Bird数据集上,IS(inception score)、FID(Fréchet inception distance)以及MP(manipulation precision)度量指标分别达到了9.07、8.64和0.081。提出的TMGAN模型对比现有模型效果更好,生成图像既满足了给定文本的属性要求又具有高语义性。 相似文献
2.
3.
4.
采用顶空固相微萃取-气质联用技术(HS-SPME-GC-MS)对鹰嘴豆纳豆挥发性成分进行了测定与分析。结果表明,发酵24 h、36 h、48 h和60 h的鹰嘴豆纳豆分别鉴定出54、50、39和37种挥发性成分,包括醇类、醛类、酮类、酸类、酯类、吡嗪类、烃类、氨气和其他类物质,其中吡嗪类、酸类、酯类是鹰嘴豆纳豆的主要挥发性成分。吡嗪类物质在发酵36 h时相对含量大幅提高,其中2,3,5,6-四甲基吡嗪在48 h时含量最高,为17.95%;酸类物质相对含量随着发酵时间延长先减少后增加,其中反式阿魏酸含量在48 h时最高,为15.16%;酯类物质随发酵时间的延长逐渐降低,从发酵24 h的17.54%减少到60 h的2.89%。 相似文献
5.
6.
特征工程是机器学习中重要的一环。梅尔倒谱系统特征是语音的关键信息,提取该特征是语音识别的特征工程之一。首先分析了梅尔特征的提取过程,包括预加重、分窗、窗函数、短时傅里叶、能量普计算、三角滤波、取对数、离散余弦变换和倒谱抬升八个步骤,其中重点分析了窗函数和梅尔三角滤波,这两个过程因有多种算法应用于不同的语音识别场景。在三角滤波过程中,引入了梅尔尺度的概念。然后,把梅尔特征的提取步骤在Python语言中,使用librosa库函数中的mfcc函数进行关键步骤实现。结果表明,梅尔倒谱系特征是语音识别中的典型特征,其提取过程对于其它特征的提取具有广泛的借鉴意义。 相似文献
1