首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
杨超  秦廷栋  范波  李涛 《计算机科学》2018,45(11):138-142, 159
将人工免疫危险理论引入到用户行为特征的分析中,以有效地识别微博水军用户。以新浪微博为例,分析了新浪微博水军的行为特征,选取微博总数、微博等级、是否认证、阳光信用、粉丝数等特征属性,将属性分析结果作为区别水军与正常用户的特征信号,并基于树突状细胞算法(Dendritic Cells Algorithm,DCA)实现新浪微博水军的识别。使用新浪微博用户的真实数据对算法的有效性进行了验证和对比实验,结果表明该方法能够有效检测出新浪微博中的水军用户,具有较高的检测准确率。  相似文献   

2.
微博是信息共享的重要平台,同时,也成为虚假消息产生和推广的重要平台,虚假消息的传播严重扰乱了社会秩序。为了快速、有效地识别微博虚假消息,提出一种基于梯度提升决策树(GBDT)的虚假消息检测方法。首先,从评论的角度分析微博虚假消息和真实消息之间存在的差异,在此基础上提取评论中的文本内容、用户属性,信息传播和时间特性的分类特征;然后,基于分类特征,采用GBDT算法实现微博虚假消息识别模型;最后,在两个真实的微博数据集上进行验证。实验结果表明,基于GBDT的识别模型能有效提高微博虚假消息检测的准确率。  相似文献   

3.
现有微博好友推荐算法使用的用户信息比较单一,不能充分利用微博用户信息来刻画用户特征,导致推荐效果不理想。为解决该问题,在综合分析用户标签信息、内容信息、交互信息以及社交拓扑信息的基础上,通过计算主题相关度、兴趣相关度、用户亲密度进行特征挖掘,并采用K最近邻分类算法为目标用户进行微博好友推荐。在新浪微博真实用户数据集上的实验结果表明,该算法的准确率、召回率、F1度量值分别为16.5%,26.8%,19.2%,推荐效果优于基于内容的推荐算法和基于社会过滤的推荐算法。  相似文献   

4.
微博已经成为网民信息获取、分享的主要平台之一。对信息分享进行预测, 是对微博信息传播进行监管控制的基础。微博用户和信息属性中包含着用户偏好、生理特征、内容类型等数据, 基于这些数据可进行信息分享预测。分析了微博信息传播模式、分享预测理论方法, 基于PA算法提出了信息分享预测模型, 以新浪微博数据为例验证了预测模型。结果表明, 该模型对信息分享具有较高的预测准确率。  相似文献   

5.
首先对国内微博平台的信息进行了综合分析,主要介绍了微博信息的定义,在错综复杂的微博信息中哪些信息比较重要,以及这些微博信息包含哪些详细的内容,是如何组织的。然后选取新浪微博平台作为研究对象,利用新浪微博API设计了爬虫程序,抽取用户信息;以用户的关注人数、粉丝数和发布的微博数为标准对用户信息进行了定量分析。最后根据分析结果,针对不同特征的用户群体提出了相应的标签推荐方法。  相似文献   

6.
首先对国内微博平台的信息进行了综合分析,主要介绍了微博信息的定义,在错综复杂的微博信息中哪些信息比较重要,以及这些微博信息包含哪些详细的内容,是如何组织的。然后选取新浪微博平台作为研究对象,利用新浪微博API设计了爬虫程序,抽取用户信息;以用户的关注人数、粉丝数和发布的微博数为标准对用户信息进行了定量分析。最后根据分析结果,针对不同特征的用户群体提出了相应的标签推荐方法。  相似文献   

7.
针对微博虚假用户问题,以新浪微博为研究平台,对微博用户的行为进行分析,从在线时长、发帖时间、互动程度等方面,提取用于区分用户类别的特征变量,运用逻辑回归算法,提出一个基于逻辑回归的微博用户可信度评价模型。实验结果表明,该模型能够对传统的虚假用户“僵尸粉”进行识别,对新型虚假用户有较高的识别率,可以根据置信值的大小对用户进行大致分类,实用性较强。  相似文献   

8.
冯永韩楠  贾东风 《计算机应用》2013,33(12):3559-3562
为从微博服务平台产生的大量实时信息中抽取新闻事件,提出了一套完整的云计算环境下的微博事件检测跟踪算法。首先采用新的基于微博转发数和评论数的权值计算方法,将微博文本表示成向量空间模型;再利用基于代表点的增量层次密度聚类(RIHDBSCAN)算法抽取关键词,最终实现新闻事件的检测和跟踪。针对单一节点无法快速高效地处理海量微博数据的问题,将算法部署在云计算平台Hadoop上。通过在新浪微博平台上获取的真实数据进行实验,结果表明,所提出的权值计算方法比  相似文献   

9.
文中以新浪微博为研究对象,以分析新浪微博的信息转发与传播特征为研究目的,并对传播行为进行预测.在获取大量新浪微博在线数据的基础上,对各种可能影响用户转发行为的因素进行统计、分析,挖掘各种影响因素特征并进行建模.提出基于用户属性、社交关系和微博内容三类综合特征,使用机器学习的分类方法,对给定微博的用户转发行为进行预测.基于微博网关注关系拓扑,利用概率级联模型对给定微博的转发路径进行预测,为预测微博的影响范围提供依据.文中通过实验分析了新浪微博符合复杂网络特征、社交类特征对转发行为有重要影响,并验证了传播预测的有效性.  相似文献   

10.
随着互联网的发展,用户倾向于在购物、旅游、用餐之前参考线上评论.之后,他们也会发表评论来表达自身意见.线上评论越来越具有价值.评论对用户决策的重要导向作用催生了虚假评论.虚假评论,指用户由于利益、个人偏见等因素发布的不符合产品真实特性的评论.这些虚假评论语言上模仿真实评论,消费者很难识别出来.国内外学者综合运用自然语言处理技术来研究虚假评论检测问题.从特征工程的角度分析,虚假评论检测方法可以分为三类:基于语言特征和行为特征的方法、基于图结构的方法、基于表示学习的方法.主要描述了检测的一般流程,归纳了三类研究方法常用的特征,比较了方法的优缺点,并且介绍了研究常用的数据集.最后探讨了未来研究方向.  相似文献   

11.
由于Java生成Word和Excel文档十分困难且代码量也比较大,本文提出FreeMarker模板引擎在线动态生成Excel和Word文档的方案,并把相关技术应用到库尔勒科技服务平台,经过实践证明,该方案生成的Word和Excel文档符合Office标准,打印也不会变形,是当前用来生成具有固定结构的Excel和Word文档的较佳方案。  相似文献   

12.
利用环境星1A/1B遥感影像,运用Jiménez-Munoz & Sobrino's普适性单通道算法定量反演广州市的地表温度(Land Surface Temperature,LST) ,结合MNF主成分分析和支持向量机获取的不透水面分布格局,利用面向对象分类方法获得了土地利用覆盖情况,重点研究广州市不透水面、土地覆盖和植被指数与城市热环境的定量关系。研究结果显示:基于大气水汽含量实测数据的JM&S普适性单通道算法反演结果更精确;广州市2009~2011年的不透水面面积和土地覆盖与平均地表温度相关性分析表明:广州市连续3 a呈现城市扩张的现象,城市热效应显著加剧;城市平均地表温度与不透水面面积呈现正相关,与城市的植被指数和裸土指数呈现负相关。  相似文献   

13.
 针对现有本体存储模式存在的无法推理及操作不便等缺陷,本文提出一种新的OWL(Web Ontology Language)文件向关系数据库映射及存储的模式。该模式将本体文件数据提取至由本体ER图(Entity Relationship Diagram)设计的底层数据库中,同时在提取过程中自动获取隐含语义数据,再将底层数据库中的数据映射为便于用户操作的数据库。实验结果表明,该模式既保留了本体文件的隐含语义,又提高了查询效率,同时极大地方便了普通用户对本体数据的操作。  相似文献   

14.
经典BLP安全公理的一种适应性标记实施方法及其正确性   总被引:20,自引:2,他引:20  
经典的 Bell & L a Padula( BL P)模型是在计算机安全系统中实现多级安全性 ( ML S)支持的基础 ,被视作基本安全公理 .结合以 L inux为基础的一个安全操作系统 ( RS- L inux)的开发 ,讨论抽象的 BL P安全公理在安全操作系统实现中的实际意义 .从理论上构造 BL P公理的一种新的实施方法 ( ABL P方法 ) ,并给出该方法的正确性证明 .ABL P方法主要由 3条访问控制规则构成 ,其特点是允许主体的当前敏感标记进行适应性调整 ,它以常规实施方法为基础 ,克服了常规实施方法在标记指派方面的不足 ,为安全判定增加了灵活性 .  相似文献   

15.
 针对3G的eHRPD和4G的TD-LTE移动通信系统进行混合组网时,每种网络制式下的小区在用户增多时都有可能过载,除了传统的与邻近小区进行基站的切换,还可以在不同制式之间进行垂直切换。本文以网络资源利用率为参考,对系统内的用户进行异系统垂直切换,从而使混合组网后的系统负载得到均衡。通过该整合系统的仿真,在保证无线链路丢失率不受显著影响前提下,该方法使得蜂窝小区的平均吞吐率有所提高,并能找到使得吞吐率最大时的最佳切换阈值。  相似文献   

16.
图书馆在提供文献收集、整理和查阅等功能的基础上,开展了大量研究工作并发表了丰富的研究成果。对发表的文献进行信息挖掘,可为相关研究提供参考和借鉴。通过趋势线分析获取各个国家图书馆在不同时期的发文趋势,采用质心法可以刻画出全球图书馆国际发文数量随着时间变化其重心发生迁移的特征。分析结果显示,这两种方法成功地应用到了文献计量分析中,为文献计量学研究提供了新的方法。  相似文献   

17.
现有的个性化推荐通常会忽略时间信息对用户行为的影响,导致预测准确性较低。本文根据用户属性信息和用户评分信息,建立基于时序背景LDA与协同过滤的混合模型(TLDA-CF)。通过离线与在线推荐提高推荐效率;根据用户对项目的评分信息,以及各时间段内项目的被访问量分别建立LDA模型,解决数据稀疏性问题;设置动态权值平衡用户选择趋势提高推荐准确性;对于没有评分信息的新用户,采用用户聚类,引用协同过滤算法预测新用户喜好,解决冷启动问题。将该算法应用在MovieLens数据集上,实验结果表示,该算法在推荐召回率和准确率、F1值上都优于传统的LDA模型。  相似文献   

18.
三峡库区滑坡灾害严重,应用传统监测方法不仅耗资巨大,而且效率不高。通过对近年来迅速发展起来的地表形变探测新技术--重轨星载InSAR技术进行了相关研究,并针对三峡库区近地表大气水汽含量变化频繁的特点,研究了大气水汽变化对重轨星载InSAR观测精度的影响,在对Zebker的相关研究结论进行实证后,探讨了重轨星载InSAR技术应用于三峡库区滑坡监测的可行性。  相似文献   

19.
中国江淮、黄淮地区陆面微波比辐射率的变化特征   总被引:2,自引:0,他引:2       下载免费PDF全文
陆面微波比辐射率较高且易变,造成陆面上反演降水以及其它大气参数较为困难。对于地表特征复杂的中国,陆面微波比辐射率的研究还很有限。通过利用Tropical Rainfall Measuring Mission (TRMM)卫星上同步扫描的VIRS(红外和可见光)与TMI(微波)资料以及微波辐射传输模式反演了中国江淮、黄淮地区陆面微波比辐射率。然后,结合MODIS提供的地表类型数据,分析了江淮、黄淮地区不同地表微波比辐射率的时空变化特征。 结果表明该地区的农作物地表比辐射率最小,垂直与水平比辐射率极化差最大;而森林地表比辐射率最大,极化差最小。此外,不同地表的微波比辐射率昼夜变化明显,季节变化不明显。比辐射率估算误差中,地表温度、微波亮温和大气相对湿度3因子的准确计算对22 GHz和85 GHz的影响较为明显,对其它通道影响较小。对于小于85 GHz的通道,比辐射率估算精度受微波亮温的影响最为明显,地表温度其次,相对湿度最小;对于高频85 GHz,相对湿度的影响最明显,其次是微波亮温,最后是地表温度。  相似文献   

20.
内蒙古锡林浩特草原GLASS LAI产品的真实性检验   总被引:1,自引:0,他引:1  
结合内蒙古锡林浩特草原区域的实地测量数据和Landsat TM高分辨率遥感数据,对两景GLASS LAI产品进行真实性检验,同时以MODIS LAI产品为比照。结果表明:①GLASS LAI产品和MODIS LAI产品均高估,其中7月中旬GLASS LAI产品高估约11%,其高估的程度明显小于MODIS LAI(高估约36%),而8月末两者高估的程度相似;②GLASS LAI产品与Landsat TM反演LAI产品有较好的一致性,两期数据的决定系数R2分别达到0.72和0.58,优于MODIS LAI产品(0.61和0.27);③GLASS LAI和MODIS LAI两个产品的误差主要来自于模型的准确性,真实性检验中数据定量化误差小于5%。结论表明:GLASS LAI产品数据在锡林浩特草原区域的观测精度和一致性都优于MODIS LAI产品数据,更适用于相关研究。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号