首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 921 毫秒
1.
通过对微博虚假信息的分析,基于DCA算法的思想,提出一种检测微博虚假信息的方法。以新浪微博为例,从虚假信息发布者的用户属性和虚假信息评论的文本内容两个方面进行分析。从用户方面选取用户的特征属性,如是否认证、有无简介、地址信息是否详细、关注数、粉丝数等,从评论内容方面选取评论与微博内容的相关性、评论的支持性及其置信度等特征属性,将以上属性的分析结果作为区别虚假信息与真实信息的特征信号,并基于树突状细胞算法(Dendritic Cells Algorithm, DCA)实现新浪微博虚假信息的识别。使用新浪微博真实数据对算法有效性进行了验证和对比实验,结果表明该方法能够有效检测出新浪微博中的虚假信息,具有较高的检测准确率。  相似文献   

2.
微博是信息共享的重要平台,同时,也成为虚假消息产生和推广的重要平台,虚假消息的传播严重扰乱了社会秩序。为了快速、有效地识别微博虚假消息,提出一种基于梯度提升决策树(GBDT)的虚假消息检测方法。首先,从评论的角度分析微博虚假消息和真实消息之间存在的差异,在此基础上提取评论中的文本内容、用户属性,信息传播和时间特性的分类特征;然后,基于分类特征,采用GBDT算法实现微博虚假消息识别模型;最后,在两个真实的微博数据集上进行验证。实验结果表明,基于GBDT的识别模型能有效提高微博虚假消息检测的准确率。  相似文献   

3.
周诗龙  徐俊刚 《软件学报》2013,24(S2):150-161
目前,微博搜索大多应用向量空间模型计算查询词与文档间的相关程度,通常使用TF-IDF(termfrequency-inverse document frequency)统计方法来确定词的权重.然而仅使用词进行微博搜索并不能检测到某条微博的信息含量,而这些往往是查询用户所关注的问题.为此提出了一种基于分析特征与动态步长的微博排序学习算法.首先,定义了一些微博分析特征,经过统计分析获得的这些分析特征可以用来预测用户行为;其次,在此基础上,提出了以词性为单位计算微博相关度的方法,结合信息熵计算方法得到微博词性信息的含量,并用来预测该微博的信息含量;最后,在现有ListNet排序学习算法的基础上,引入了动态步长的概念,对步长进行了动态优化,最终形成了一种基于动态步长的微博排序学习算法——RDLS(ranking based on dynamic learning stepsize)算法.实验结果表明,无论是基于直接特征还是加入分析特征,在相同迭代轮数情况下,相比ListNet算法,RDLS 算法可以训练出更优的模型,在微博排序方面有更好的表现.  相似文献   

4.
赵辉  王红军  彭博  龙治国  李天瑞 《软件学报》2022,33(4):1326-1337
特征学习是机器学习中的一项重要技术,研究从原始数据中学习后置任务所需的数据表示.目前,多数特征学习算法侧重于学习原始数据中的拓扑结构,忽略了数据中的判别信息.基于此,提出了基于随机近邻嵌入的判别性特征学习模型.该模型将对判别信息的学习与对拓扑结构的学习融合在一起,通过迭代求解的方式,同时完成对这两者的学习,从而得到原始...  相似文献   

5.
目的 判别式目标跟踪算法在解决模型漂移问题时通常都是在预测结果的基础上构建更可靠的样本或采用更健壮的分类器,从而忽略了高效简洁的置信度判别环节。为此,提出高置信度互补学习的实时目标跟踪算法(HCCL-Staple)。方法 将置信度评估问题转化为子模型下独立进行的置信度计算与互补判别,对相关滤波模型计算输出的平均峰值相关能量(APCE),结合最大响应值进行可靠性判定,当二者均以一定比例大于历史均值时,判定为可靠并进行更新,将颜色概率模型的输出通过阈值处理转化为二值图像,并基于二值图像形态学提取像素级连通分量属性(PCCP),综合考虑连通分量数量、最大连通分量面积及矩形度进行可靠性判别,当置信度参数多数呈高置信度形态时,判定为可靠,进行更新;否则,判定为不可靠,降低该模型的融合权重并停止更新。结果 在数据集OTB-2015上的实验结果表明,HCCL-Staple算法与原算法相比,距离精度提高了3.2%,成功率提高了2.7%,跟踪速度为32.849帧/s,在颜色特征适应性较弱的场景和目标被遮挡的复杂场景中均能有效防止模型漂移,与当前各类主流的跟踪算法相比具有较好的跟踪效果。结论 两种子模型的置信度判别方法均能针对可能产生低置信度结果的敏感场景进行有效估计,且对输出形式相同的其他模型在置信度判别上具有一定的适用性。互补使用上述判别策略的HCCL-Staple算法能够有效防止模型漂移,保持高速的同时显著提升跟踪精度。  相似文献   

6.
随着微博平台的快速发展,垃圾信息检测与过滤也面临着巨大的考验,实时精确地识别垃圾信息对于提高用户的体验以及微博平台的可持续发展意义重大.本文根据新浪微博的真实数据,提出了一种基于多特征的垃圾微博检测方法.首先,提取微博的显式特征(用户特征、内容特征);然后利用文档主题生成模型(LDA)提取微博中的隐含主题特征;最后根据所提取的微博特征利用支持向量机(SVM)构建分类器.实验结果表明,该方法相比于现有方法在准确率和F1值方面都有一定的提升.  相似文献   

7.
针对现有的基于图的半监督学习(graph-based semi-supervised learning,简称GSSL)方法存在模型参数敏感和数据空间判别信息不充分等问题,受最近特征空间嵌入和数据稀疏表示思想的启发,提出一种稀疏近似最近特征空间嵌入标签传播算法SANFSP(sparse approximated nearest feature space embedding label propagation).SANFSP首先利用特征空间嵌入投影点来稀疏表示原始数据;然后,度量原始数据和稀疏近似最近特征空间嵌入投影间的相似性;进而提出稀疏近似最近特征空间嵌入正则化项;最后,基于传统GSSL 方法的标签传播算法,实现数据标签的平滑传播.同时,还将SANFSP 算法简单拓展到out-of-sample 学习.SANFSP 算法在人造和实际数据集(如人脸识别、可视物件识别以及手写数字分类等)上取得了有效的实验结果.  相似文献   

8.
随着微博的日趋流行,新浪微博已成为公众获取和传播信息的重要平台之一,针对微博数据的话题挖掘也成为当前的研究热点。提出一个面向大规模微博数据的话题挖掘方法。首先对大规模微博数据进行分析,基于Bloom Filter算法对数据进行去重处理,针对微博的特有结构,对文本进行预处理,提出改进的LDA主题模型Social Network LDA(SNLDA),采用吉布斯采样法进行模型推导,挖掘出微博话题。实验结果表明,方法能有效地从大规模微博数据中挖掘出话题信息。  相似文献   

9.
命名实体识别是自然语言处理领域的一项基础性技术。近年来微博等网络社交平台发展迅速,其独特的形式对传统的命名实体识别技术提出了新的挑战。故提出一种基于条件随机场模型的改进方法,针对微博文本短小、语义含糊等特点,引入外部数据源提取主题特征和词向量特征来训练模型,针对微博数据规模大、人工标准化处理代价大的特点,采取一种基于最小置信度的主动学习算法,以较小的人工代价强化模型的训练效果。在新浪微博数据集上的实验证明,该方法与传统的条件随机场方法相比F值提高了4.54%。  相似文献   

10.
张蓉  张献国 《计算机应用》2021,41(5):1275-1281
针对虚假评论检测中不能充分利用评论的非语义特征的问题,提出了一种新的基于层次注意力机制与异构图注意力网络的层次异构图注意力网络(HHGAN)模型。首先,通过层次注意力机制学习评论文本中词级别和句级别的文档表示,重点捕获对虚假评论检测有重要意义的单词和句子;然后,将学习到的文档表示作为节点,并选取评论中非语义特征作为元路径来构建具有双层注意力机制的异构图注意力网络;最后,设计一个多层感知器(MLP)用以判别评论类别。实验结果表明,HHGAN模型在yelp.com中提取的餐厅数据集和酒店数据集上的F1值分别到达0.942和0.923,效果明显优于传统的卷积神经网络(CNN)模型和其他神经网络基准模型。  相似文献   

11.
基于归一化互相关测度(NCC)的模板匹配已经在图像处理领域得到了广泛的应用。对图像进行边缘检测然后进行模板匹配,可充分利用图像的空间相关性,锐化模板匹配结果的相关峰,提高匹配的准确度,可以获得更高的定位精度。为了有效提高定位精度,考虑到导弹制导系统的算法实时性、体积以及为适应战场不同任务阶段采用不同匹配策略的灵活性要求,基于FPGA,通过结合Sobel边缘检测,进一步改进了提出的图像归一化互相关模板匹配高速并行实现架构。对边缘检测前后图像模板匹配的仿真比较结果表明,边缘检测处理可有效锐化相关峰;基于Altera的FPGA芯片EP2S90和开发软件Quartus Ⅱ 8.0的并行实现架构功能与时序仿真及在实际目标识别系统中的应用表明,这种方案可有效地提高系统的运算速度和定位精度,FPGA实现本身也进一步缩小了系统的体积。  相似文献   

12.
咽擦音是腭裂语音中一种常见的代偿性构音异常,咽擦音的自动检测对腭咽功能的评估具有重要的临床意义。对腭裂语音咽擦音的自动检测算法进行了研究,提出分段指数压缩Gamatone滤波器组(Piecewise Exponent Compression Gammatone Filters,PECGTFs)和基于Softsign的多通道(Softsign-based Multi-Channel,SSMC)模型相结合提取语音信号的谱特征参数,采用KNN分类器,实现腭裂语音咽擦音的自动检测。实验共测试306个语音样本,并对比了使用不同的Gammatone滤波器、使用高斯差分(Difference of Gaussian,DoG)增强和SSMC模型增强对咽擦音自动检测结果的影响。实验结果表明,使用PECGTFs与SSMC相结合的算法对腭裂语音咽擦音的自动检测正确率达94.95%,对临床诊断具有一定的参考价值。  相似文献   

13.
针对驾驶场景中目标检测卷积神经网络模型检测精度较低的问题,提出一种基于改进RefineDet网络结构的多尺度特征融合目标检测方法。在RefineDet网络结构中嵌入LFIP(Light-weight Featurized Image Pyramid,轻量级特征化的图像金字塔)网络,将LFIP网络生成的多尺度特征图与RefineDet中的ARM(Anchor Refinement Module,锚点框修正模块)输出的主特征图相融合,提升特征层中锚点框初步分类和回归的输出效果,为ODM(Object Detection Module,目标检测模块)模块提供修正的锚点框以便于进一步回归和多类别预测;在RefineDet网络结构中的ODM之后嵌入多分支结构RFB(Receptive Field Block,感受野模块),在检测任务中获得不同尺度的感受野以改善主干网络中提取的特征。将模型中的激活函数替换为带有可学习参数的非线性激活函数PReLU(Parametric Rectified Linear Unit,参数化修正线性单元),加快网络模型的收敛速度;将RefineDet的边界框回归损失函数替换为排斥力损失函数Repulsion Loss,使目标检测中的某预测框更靠近其对应的目标框,并使该预测框远离附近的目标框及预测框,可以提升遮挡情况下目标检测的精度;构建驾驶视觉下的目标检测数据集,共计48 260张,其中38 608张作为训练集,9 652张作为测试集,并在主流的GPU硬件平台进行验证。该方法的mAP为85.59%,优于RefineDet及其他改进算法;FPS为41.7 frame/s,满足驾驶场景目标检测的应用要求。实验结果表明,该方法在检测速度略微下降的情况,能够较好地提升驾驶视觉下的目标检测的精确度,并能够一定程度上解决驾驶视觉下的遮挡目标检测和小目标检测的问题。  相似文献   

14.
为准确分割脑部磁共振图像(MRI)的灰质、白质和背景,提出一种基于C-V模型和马尔可夫随机场的全自动分割方法。采用C-V模型与形态学相结合的方法对脑MRI进行预处理,去除多余脑组织,获得待分割图像。引入灰度场局部熵的思想对惩罚因子进行估计,利用马尔可夫随机场模型建模实现脑灰白质的分割,并运用形态学方法获得最终分割结果。对96幅IBSR图像和46幅临床图像进行实验,结果表明,该方法能够实现脑部MRI灰白质的全自动分割,且具有较好的分割精度和较快的处理速度。  相似文献   

15.
现有的现场可编程门阵列(FPGA)芯片在进行单粒子翻转(SEU)检错时,只能针对FPGA配置单元进行周期性重复擦写而不能连续检错纠错。为此,设计一种能连续检测SEU错误并实时输出检错信息的硬核检测电路。该设计改进传统FPGA芯片的数据帧存储结构,能对芯片进行连续回读循环冗余校验(CRC)。在FDP3P7芯片上的流片实现结果表明,该电路能在50 MHz工作频率下连续对芯片进行回读CRC校验,并正确输出SEU帧检错信息。  相似文献   

16.
在某些固定的工业应用场景中,对目标检测算法的漏检容忍性非常低。然而,提升召回率的同时,目标周围容易规律性地产生一些无重叠的虚景框。传统的非极大值抑制(NMS)策略主要作用是抑制同一目标的多个重复检测框,无法解决上述问题。为此设计了一种各向异性NMS方法来对目标周围不同方向采取不同的抑制策略,从而有效消除规律性的虚景框。固定的工业场景中的目标形状和规律的虚景框往往具有一定关联性。为了促进各向异性NMS在不同方向的精确执行,设计了一种比例交并比(IoU)损失函数用来引导模型拟合目标的形状。此外,针对规则目标使用了一种自动标注的数据集增广方法,在降低人工标注工作量的同时扩大了数据集规模。实验结果表明,所提方法在轧辊凹槽检测数据集上的效果显著,应用于YOLO系列算法时在不降低速度的同时提升了检测精度。目前该算法已成功应用于某冷轧厂轧辊自动抓取的生产线。  相似文献   

17.
卷积神经网络在基于视觉的机器人抓取检测任务上取得了较好的检测效果,但是大多数方法都有太多的计算参数,不适合资源有限的系统。针对这个问题,基于SqueezeNet轻量级神经网络,结合DenseNet多旁路连接加强特征复用的思想,提出了轻量级抓取检测回归模型SqueezeNet-RM(SqueezeNet Regression Model),并使用SqueezeNet-RM从RGB-D图像中提取多模态特征,预测二指机器人夹持器的最佳抓取位姿。在标准的康奈尔抓取数据集上,提出的轻量级抓取检测网络与经典的抓取检测方法相比,在保证检测准确率不降低的情况下,模型占用更少的存储空间,表现出更快的检测速度和更高的泛化性能,所提出的模型占用的存储空间比AlexNet模型减少86.97%,平均检测速度快3倍,适用于FPGA(Field Programmable Gate Array)或者资源受限的移动机器人抓取检测系统。  相似文献   

18.
铁路路基病害不断增加,其中翻浆冒泥病害和路基下沉病害最为常见,严重影响铁路安全运营。车载地质雷达检测方法是铁路路基病害检测的一种常用方法。然而,通过雷达图像对路基病害进行识别仍以人工判别为主,且需要专家丰富的经验。由于路基病害形态复杂、尺度较大,如何对铁路路基病害进行自动识别是一项具有挑战性的任务。针对这些问题,通过探地雷达实地采集数据构建了铁路路基病害数据集,提出了一种铁路路基病害实时智能检测方法(LS-YOLOv3)。该方法针对铁路路基病害的特点设计了深度残差网络提取病害特征,并采用多尺度预测网络在4个尺度上进行特征融合,形成铁路路基病害实时检测模型。实验结果表明,与传统的HOG+SVM算法、双阶段的Faster-RCNN算法、Cascade R-CNN算法、单阶段的YOLOv3算法和轻量化的TinyYOLOv2、TinyYOLOv3算法相比,提出的算法获得了最高的均值平均精度(82.67%)并在配有英伟达GeForce RTX 2080Ti GPU的计算平台上实现了实时检测(32.26 frame/s)。旨在尝试提供一种铁路路基病害检测领域的实时性新方法。  相似文献   

19.
师夏阳  张风远  袁嘉琪  黄敏 《计算机应用》2022,42(11):3379-3385
攻击性言论会对社会安定造成严重不良影响,但目前攻击性言论自动检测主要集中在少数几种高资源语言,对低资源语言缺少足够的攻击性言论标注语料导致检测困难,为此,提出一种跨语言无监督攻击性迁移检测方法。首先,使用多语BERT(mBERT)模型在高资源英语数据集上进行对攻击性特征的学习,得到一个原模型;然后,通过分析英语与丹麦语、阿拉伯语、土耳其语、希腊语的语言相似程度,将原模型迁移到这四种低资源语言上,实现对低资源语言的攻击性言论自动检测。实验结果显示,与BERT、线性回归(LR)、支持向量机(SVM)、多层感知机(MLP)这四种方法相比,所提方法在丹麦语、阿拉伯语、土耳其语、希腊语这四种语言上的攻击性言论检测的准确率和F1值均提高了近2个百分点,接近目前的有监督检测,可见采用跨语言模型迁移学习和迁移检测相结合的方法能够实现对低资源语言的无监督攻击性检测。  相似文献   

20.
针对布谷鸟算法(CS)的不足,提出了混合引力搜索与高斯扰动的精英布谷鸟搜索算法(GGECS)。该算法提出了自适应控制策略,将布谷鸟算法中的步长因子和发现概率进行动态地调整,并使用帕累托法则进行精英分类,分别对属于不同类别的鸟巢进行引力搜索和高斯扰动,从而提高算法的种群多样性,避免算法陷入局部最优解,提高了算法的寻优精度和收敛速度。使用8个标准测试函数进行仿真实验。结果表明,该算法较CS和ICS算法具有更好的全局搜索能力,其测试函数最优解也更为接近最优解的理论值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号