期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

宋莉娜冯旭鹏刘利军黄青松《计算机应用研究》2018,35(3)

随着微博用户的增多,微博平台的信息更新频繁,针对微博文本的数据稀疏性、新词多、用语不规范等特点,提出了基于SOM聚类的微博话题发现方法。首先从原始语料中对文本进行预处理,通过词向量模型对短文本进行特征提取,降低了向量维度过高带来的计算量繁重问题;然后,采用改进的SOM对话题进行聚类,该算法改善了传统文本聚类的不足,进而能够有效的发现话题。实验表明,该算法较传统文本聚类算法的综合指标F值有明显提高。相似文献

2.

面向肺结节多语义特征分类的不确定性多任务损失方法

张帅威冯旭鹏刘利军黄青松《光电子．激光》2021,32(1):47-55

肺结节的早期诊断对后续的治疗非常重要.尽管深度学习方法在肺结节良恶性分类等任务中取得了良好的结果,但是这些方法没有提供有意义的诊断功能,导致获得的结果缺乏客观性.越来越多的研究者引入了肺结节的其他语义特征来解决这个问题,但是多个语义特征的引入会造成模型的负迁移.为了解决肺结节多个语义特征之间同步共享知识的程度不同造成的... 相似文献

3.

面向短文本情感分类的特征拓扑聚合模型

胡杨冯旭鹏黄青松付晓东刘骊刘利军《中文信息学报》2016,30(5):28-35

由于短文本极稀疏性和特征分散的特点,短文本的情感分类效果总是不及篇章文本的情感分类,针对此问题,该文提出面向短文本情感分类的特征拓扑聚合模型。模型首先从特征点互信息,情感指向相似度,主题归属差异值三个维度整合计算情感特征的关联度,然后根据特征关联度建立拓扑聚合图模型,通过在图上求解强联通分量聚合高关联度情感特征,从大量未标注语料中提取相似特征对训练集特征进行补充,同时降低训练空间维度。实验将模型应用于短文本情感分类,与基准算法对比能提高分类准确率和召回率分别达0.03和0.027。验证了模型在缓解短文本极稀疏性和特征分散问题上的效果。
相似文献

4.

三床串联化学链生物质气化实验分析与预测

陈鸿伟刘博朝贾建东刘玉强梁锦俊陈哲冯旭鹏朱楼《动力工程学报》2021,41(8):667-673,699

在自行搭建的三床串联化学链(TBS-CLC)生物质气化系统上研究了各控制参数(空气反应器风速、燃料反应器风速、循环物料质量和气化室床料高度)对循环流率的影响,将实验测得的129组数据作为训练样本和测试样本,利用反向传播(BP)神经网络模型、遗传算法(GA)优化的BP神经网络模型即GA-BP模型和支持向量机(SVM)模型... 相似文献

5.

基于标签相似度的不良信息多标签分类方法

刘卓然胡杨刘骊冯旭鹏刘利军黄青松《计算机应用研究》2016,33(4)

在多标记分类中,标签与标签之间的相关关系是影响分类效果的一个重要因子。而传统的经典多标签分类方法如BR算法,ML-KNN算法等,忽略了标签之间的相关关系对实际分类的影响,分类效果一直不能令人满意。面对类别关联度极高的不良信息的多标签分类,分类效果更是大打折扣。针对上述问题,本文改进一种经典的多标签分类算法RAkEL,首先根据训练文本计算出各标签之间的相似度系数,然后再根据自定义不良信息层次关系计算出综合标签相似度系数矩阵,最后在RAkEL算法投票过程中根据综合标签相似度与中心标签重新确定最终的结果标签集合。与传统的分类方法在真实的语料库上进行多标签分类效果对比,实验证明,该方法在对不良信息分类具有较好的效果。相似文献

6.

基于平行语料库的双语协同中文关系抽取

郭勃冯旭鹏刘利军黄青松《计算机应用》2017,37(4):1051-1055

针对在中文资源的关系抽取中,由于中文长句句式复杂,句法特征提取难度大、准确度低等问题,提出了一种基于平行语料库的双语协同中文关系抽取方法。首先在中英双语平行语料库中的英文语料上利用英文成熟的句法分析工具,将得到依存句法特征用于英文关系抽取分类器的训练,然后与利用适合中文的n-gram特征在中文语料上训练的中文关系抽取分类器构成双语视图,最后再依靠标注映射后的平行语料库,将彼此高可靠性的语料加入对方训练语料进行双语协同训练,最终得到一个性能更好的中文关系抽取分类模型。通过对中文测试语料进行实验,结果表明该方法提高了基于弱监督方法的中文关系抽取性能,其F值提高了3.9个百分点。相似文献

7.

基于用户属性与覆盖范围的意见领袖挖掘研究

李亚星王兆凯刘利军冯旭鹏黄青松《计算机应用研究》2017,34(12)

针对微博信息的交互性和不确定性,本文提出一种基于用户属性与覆盖范围的意见领袖研究方法。该方法分别计算用户属性值和用户传播覆盖范围。根据粉丝忠实程度计算出用户属性值从而得到用户属性排名。利用用户间微博内容主题相似度构建贡献图,获得用户覆盖范围排名。最后,结合用户属性排名和用户覆盖范围排名生成最终的意见领袖排名。实验结果表明,本方法相比其它意见领袖挖掘方法有更好的效果。相似文献

8.

聊天机器人中用户就医意图识别方法

余慧冯旭鹏刘利军黄青松《计算机应用》2018,38(8):2170-2174

传统的聊天机器人中用户意图识别一般采用基于模板匹配或人工特征集合等方法,针对其费时费力而且扩展性不强的问题,并结合医疗领域聊天文本的特点,提出了基于短文本主题模型（BTM）和双向门控循环单元（BiGRU）的意图识别模型。该混合模型将用户就医意图识别看作分类问题,使用主题特征,首先通过BTM对用户聊天文本逐句进行主题挖掘并量化,然后送入BiGRU进行完整上下文学习得到连续语句最终表示,最后通过分类完成用户就医意图识别。对爬取的语料进行实验,BTM-BiGRU方法明显优于传统的支持向量机（SVM）等方法,其F值更是高出目前较好的卷积长短期记忆组合神经网络（CNN-LSTM）近1.5个百分点。实验结果表明,在本任务上该混合模型重点考虑研究对象的特点,能有效提高意图识别的准确率。相似文献

9.

基于主题模型的胸部X光片诊断报告异常检测方法

尤诚诚冯旭鹏刘利军黄青松《计算机工程与科学》2020,42(4):741-748

胸部X光片是患者胸部检查的优先选择,对患者的诊断治疗起着重要的作用。医生依据自身的经验和习惯书写胸部X光片诊断报告,由于一些主观或者客观的原因,会开具一些影像描述与诊断结论不相符的异常诊断报告,因此对诊断报告进行异常检测有着重要的研究意义。胸片诊断报告未登录词多、数据高维稀疏,缺乏大量有效标注,传统方法检测异常胸片诊断报告效果不佳,为此,提出了一种基于主题模型的胸部X光片诊断报告异常检测方法。首先用双向LSTM-CRF模型结合诊断报告中的字符级特征,获取特定的医疗术语特征,解决诊断报告中未登录词多,描述自由的问题。然后依据领域知识和模板将诊断报告进行有效的特征扩展,缓解数据稀疏问题。最后用LDA模型判断诊断报告中影像描述与诊断结论特征是否匹配,检测出异常胸片诊断报告。实验结果表明,在阈值为2的情况下,异常检测的准确率为92.82%,召回率为69.54%,检测性能优于传统方法的。相似文献

10.

基于聚类集成的微博话题发现方法

冯旭鹏马震谢波刘利军黄青松《计算机工程与应用》2017,53(8):81-86

微博中短文本、用语不规范和大量噪音等特性使得传统话题发现方法不能很好地从中获取新话题。针对微博以上特性和话题动态性提出一种基于聚类集成的微博话题发现方法,该方法考虑微博发布的非线性时间因子,采用改进的K-Means方法分别融合微博的各个特性构造其对应的基聚类器,并评估各基聚类器之间的有效性和差异性,以此设置集成投票权值并最终进行聚类集成。实验对比结果表明,该方法将微博发现话题的准确性提升约9.5%,能够更有效地探测到新话题。相似文献