首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
高明霞  陈福荣 《计算机应用》2016,36(8):2071-2075
针对中文微博信息的特点及这些特点的可测量性和实际任务,系统地梳理了中文微博信息可信度测量指标,并将其进行了谱系化分析,提出一个基于信息融合的中文微博可信度评估框架CCM-IF。首先,为本质不同的三个异构特征:文本内容、信息作者与信息传播使用了不同的度量方式;其次,基于决策层可信度的模糊认知特点,采用了多维证据理论进行特征融合;最后,收集了新浪微博两个真实数据集进行了一系列实验。实验结果表明,与传统信息检索排序方法平滑语言模型(LMJM)相比,CCM-IF符合用户需求的信息占比提高了10%~20%。因此,作为一个静态质量评估指标,CCM-IF可直接用于微博检索排序、垃圾微博过滤等实际任务。  相似文献   

2.
《计算机工程》2018,(3):144-150
为解决现有起源过滤机制导致溯源效用低下的问题,提出一种数据起源过滤机制。扩展PROV数据模型,将其中的依赖关系泛化为不确定的依赖关系,并证明使用不确定的依赖关系进行溯源效用恢复的合理性。构建效用评估模型,定量地评估包含不确定依赖关系的过滤视图的效用。提出"删除+修复"的起源过滤新机制,删除敏感节点或边,并在保证溯源结果不增的前提下,引入不确定的依赖关系,恢复过滤视图的溯源效用。实验结果表明,与现有的典型起源过滤机制相比,采用该机制可得到具有更高效用的起源过滤视图。  相似文献   

3.
针对来源于多个业务系统的重复主数据影响主数据质量、主数据同步及主数据挖掘等问题,提出重复主数据检测算法fastCdrDetection。从数据可信度的角度出发,在考虑数据源可信度、数据最后更新时间及数据长度的基础上,建立主数据可信度模型,并实现可信记录生成算法。设计非递归的字符串相似度计算算法FiledMatch,解决了由中文简写、缩写、错误拼写造成的主数据重复问题,采用sourceKeys算法对来源于同一业务系统、具有同样业务主键的重复记录进行预处理,从而提高重复主数据检测效率。通过对某电网基建物资63万余条供应商存量数据及23万余条模拟数据进行实验,结果表明,与PQS算法相比,fastCdrDetection算法的召回率由74%提高到88%,准确率由61%提高到95%,证明了算法的有效性。  相似文献   

4.
计算机仿真系统已经发展为重要的产品开发和系统测试手段.由于仿真系统对于用户往往是透明的,所以直接从系统本身对其可信度进行评估比较复杂.仿真数据是仿真系统的直接输出,它可以最直观地反映仿真系统的本身性质,所以对于仿真数据可信度的评估尤为重要.为了能够对仿真数据可信度有着更好的评价,通过引入灰色系统理论,建立了仿真数据的灰色关联分析方法.最后通过一个实例具体说明了该理论在仿真可信度评估中的应用.  相似文献   

5.
《软件》2017,(10)
在大数据时代,信息数量的快速增长造成了大量雷同、虚假信息的存在,导致了有效信息选取的困难。针对这个问题,本文研究了信息可信度的评价标准,并以实例的形式进行了可信度的定性和定量分析。本文是针对情报研究学科的需求而进行的初步探索。  相似文献   

6.
针对微博虚假用户问题,以新浪微博为研究平台,对微博用户的行为进行分析,从在线时长、发帖时间、互动程度等方面,提取用于区分用户类别的特征变量,运用逻辑回归算法,提出一个基于逻辑回归的微博用户可信度评价模型。实验结果表明,该模型能够对传统的虚假用户“僵尸粉”进行识别,对新型虚假用户有较高的识别率,可以根据置信值的大小对用户进行大致分类,实用性较强。  相似文献   

7.
C-Rank:一种Deep Web数据记录可信度评估方法   总被引:1,自引:0,他引:1  
针对Web信息可信度问题,提出了一种为Deep Web数据记录计算可信度的有效方法C-Rank。该方法为每一条记录构造一个S-R可信度网络,包含两种类型顶点及三种类型边。首先基于可信度传播的思想,利用顶点出度为每一个顶点计算其局部可信度值;再利用Record顶点入度及相邻Site顶点的可信度值,为该Record顶点计算权值;继而求得整个S-R网络的全局可信度值。实验证明,C-Rank方法能够合理而有效地评价数据记录的可信度,从而达到甄别虚假信息,为用户推荐可信数据记录的目的。该方法普遍适用于Deep Web的各个领域。  相似文献   

8.
可信网络连接是面对传统的网络信息安全系统的不足而提出的,采取了主动的防御保护措施。可信度的评估是可信网络的一个重要环节,提出了基于可信度的层次化评估模型,将可信度按照不同的影响因素进行分层,并使用层次分析法(AHP)对可信度进行量化分析。首先建立可信度的层次化评估模型,然后对提出的可信度层次评估模型进行量化分析,最终经过分析计算出各因素对可信度的具体影响数值。根据数值分析,对可信度进行评估。  相似文献   

9.
《信息与电脑》2022,(1):182-185
现有城市形象评价方法大都依赖于评价者主观提出的指标体系,针对此现象,提出一套以微博数据为基础的城市形象评价方法,在一定程度上提升评价过程的客观性与可重复性。首先对获取到的城市数据预处理后,运用K-Means聚类算法得到城市形象的评价类别;其次采用LDA主题模型对有效类别总结主题、提取二级指标操作,利用情感分析技术计算目标城市情感得分即为城市形象评分;最后以武汉市和苏州市为例,利用该方法评价了城市形象。  相似文献   

10.
仿真系统可信度评估及模型验证方法研究   总被引:5,自引:2,他引:5  
该文对仿真系统可信度评估的一些概念和M&S过程中V&V的应用进行了综述.讨论了有关概念模型验证的一些问题,并介绍了模型验证的贝叶斯(Bayes)方法.  相似文献   

11.
随着微博研究的深入,对微博用户可信度的评价成为一个研究热点。针对微博用户可信度评价的问题,提出了一种基于关联关系的用户可信度分析方法。以新浪微博为研究对象,首先从用户的资料信息、交互信息和行为信息三个方面出发,分析了用户的7个相关特征,利用层次分析法(AHP),进而得到用户自评价可信度;然后以用户自评价作为基点,以用户关系网络作为载体,结合用户之间潜在的用户互评关系,通过改进PageRank算法,提出了用户可信度评价模型User-Rank,进而,利用关系网络中其他用户对待分析用户的可信度进行综合评价。大规模的微博真实数据的实验表明,所提方法能够取得良好的用户可信度评价效果。  相似文献   

12.
屈志毅  田楠  温莉娟 《计算机应用》2012,32(6):1532-1535
传统算法在背景建模过程中孤立地对像素进行分析,在处理缓慢移动物体和往复运动物体时常常发生误判。针对这一情况,提出一种新的背景建模方法。该方法通过对像素值稳定性、像素值出现频率以及像素间的空间联系统计分析,评估出每一像素值作为背景的可信程度,进而得出背景。对比已有的背景建模算法,该方法在分析过程中考虑了物体的整体属性,在适应环境的变化与背景扰动的同时,能明显减少现有算法对缓慢移动物体和往复运动物体的误判。  相似文献   

13.
为保证M&S可信性评估工作有效和成功地完成,构建了由影响因素、校核与验证(verification and validation, V&V)过程和可信性特性组成三维可信性信息空间,并以此为理论基础,以V&V过程模型为基本框架,综合分析可信性在V&V过程中不同阶段的评价标准,建立了M&S可信性评估模型;在分析了模糊综合评估模型的基础上,以某飞行视景仿真系统的设计与开发为例,进行可信性评估。应用实例表明,所建立的评估模型及采用的评估方法合理有效。  相似文献   

14.
移动Ad Hoc网由于没有固定基础设施,使得网络节点间的信任问题变得日益突出。针对已有信任评估模型在证据收集和信任融合方面的不足,提出了一个多维证据融合信任评估模型。通过拓展Watchdog机制,检测节点对包的各种历史处理行为,来扩宽直接信任证据收集的维度;同时使用Beta分布下的贝叶斯统计方法,计算每种行为的可信度,之后通过证据合成规则来融合多种行为,以提高信任评估的准确性。通过仿真实验,验证了该模型的有效性;分析表明,模型中使用信息贴近度量化推荐权重,降低了恶意推荐带来的影响,保证了信任评估的健壮性。  相似文献   

15.
传统方法使用对称及非对称加密对传感器网络系统进行安全保障,需要大量的加解密计算且在密钥被破解后不能准确判断数据的可信性,不能有效保证无线传感器网络系统安全。为保障无线传感器网络系统安全,针对无线传感器网络中节点信息可信度问题,本文提出了一种基于BP网络判断节点信息可信度的方法。该方法在边界路由器上使用BP神经网络,对采集的多特征值数据进行训练,然后用训练所得结果判断节点可信度,进而筛选出数据。该方法具有较低的系统开销与较高的安全保证,能够筛选出问题节点,并保证传感器网络的安全运行。实验结果表明,该方法认证时间短,能达到预期效果。  相似文献   

16.
Reconciliation is the process of providing a consistent view of the data imported from different sources. Despite some efforts reported in the literature for providing data reconciliation solutions with asynchronous collaboration, the challenge of reconciling data when multiple users work asynchronously over local copies of the same imported data has received less attention. In this paper, we propose AcCORD, an asynchronous collaborative data reconciliation model based on data provenance. AcCORD is innovative because it supports applications in which all users are required to agree on the data values to provide a single consistent view to all of them, as well as applications that allow users to disagree on the data values to keep in their local copies but promote collaboration by sharing integration decisions. We also introduce a decision integration propagation method that keeps users from taking inconsistent decisions over data items present in several sources. Further, different policies based on data provenance are proposed for solving conflicts among multiusers' integration decisions. Our experimental analysis shows that AcCORD is efficient and effective. It performs well, and the results highlight its flexibility by generating either a single integrated view or different local views. We have also conducted interviews with end users to analyze the proposed policies and feasibility of the multiuser reconciliation. They provide insights with respect to acceptability, consistency, correctness, time‐saving, and satisfaction. Copyright © 2017 John Wiley & Sons, Ltd.  相似文献   

17.
为了更好地评价仿真系统可信度,提出了一种基于Rough Set和Fuzzy结合的仿真可信度评估方法。该方法首先将决策者经验权系数同Rough Set确定的属性重要度结合起来确定最终指标权系数,然后采用Fuzzy法对仿真系统可信度进行全面综合地评价,并用模糊状态方程式的方式表示结果。最后,以轨道交通ATC仿真系统可信度评估为例,验证了该方法的有效性和实用性,为仿真系统可信度评估提供了方便快捷的途径。  相似文献   

18.
针对传统线性回归推荐算法没有考虑用户兴趣漂移、活跃度和评分可信度等影响因素,为进一步提高算法的准确度和对用户偏好的拟合度,提出一种融合评分可信度的线性回归推荐算法。首先将用户的兴趣漂移度、活跃度和用户对商品的评价信息综合考虑到用户评分可信度的计算方法中;然后将该方法融合到传统线性回归推荐算法系数矩阵求解过程当中;最后利用优化后的线性回归推荐算法对用户评分进行预测。为了验证该算法的准确性,在Hadoop集群和亚马逊商品评分数据集上与传统的线性回归推荐算法进行了对比,实验结果表明,该算法在处理效率、推荐效果和拟合程度上有明显提高。  相似文献   

19.
雷靖玮  伊鹏  陈祥  王亮  毛明 《计算机应用》2022,42(12):3831-3840
针对传统静态检测及动态检测方法无法应对基于大量混淆及未知技术的PDF文档攻击的缺陷,提出了一个基于系统调用和数据溯源技术的新型检测模型NtProvenancer。首先,使用系统调用捕获工具收集文档执行时产生的系统调用记录;其次,利用数据溯源技术构建基于系统调用的数据溯源图;而后,用图的路径筛选算法提取系统调用特征片段进行检测。实验数据集由528个良性PDF文档与320个恶意PDF文档组成。在Adobe Reader上展开测试,并使用词频-逆文档频率(TF-IDF)及PROVDETECTOR稀有度算法替换所提出的图的关键点算法来进行对比实验。结果表明NtProvenancer在精确率和F1分数等多项指标上均优于对比模型。在最佳参数设置下,所提模型的文档训练与检测阶段的平均用时分别为251.51 ms以及60.55 ms,同时误报率低于5.22%,F1分数达到0.989。可见NtProvenancer是一种高效实用的PDF文档检测模型。  相似文献   

20.
针对软件可信性评估模型客观性不强的问题,提出了基于测试过程数据的软件可信性度量模型。该模型根据软件测试过程和能力成熟度模型CMM模型选取软件测试过程中的关键可信属性,利用软件测试中的过程数据作为可信证据,通过测试过程数据进行可信属性的定量度量,最后,将这些分散的可信指标通过D-S证据理论进行融合得到软件的可信性。实例表明,该度量模型在软件可信性评估中是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号