首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 958 毫秒
1.
提出了一种基于页视图现率、独立与数据量、以访问者数据为中心的向量空间描述模型,每个面视图对应向量空间中的一个点。由于页视图在不同的会话中含有的行为取向的语义信息不同,先将会话进行向量描述,然后将会话向量聚类为用户行为类,得到代表不同的行为取向的行为语义向量,最后将量化的行为取向信息用于指导访问者行为。  相似文献   

2.
为了揭示用户的访问模式,对传统的基于聚类技术构建用户概貌方法进行了研究,同时引入语义事务分析的观点,提出一种基于潜在语义模型构建用户概貌的方法.通过语义分析中的奇异值分解(SVD)算法,将构建的用户会话-浏览页面矩阵向量空间投影到潜在语义向量空间;利用扩展的K-means聚类算法,对潜在语义向量空间聚类生成用户会话聚类;计算浏览页面均值向量,构建以加权浏览页面集表示的用户概貌;最后采用加权平均访问百分比(WAVP)方法评价构建的用户概貌,表明了该方法的有效性.  相似文献   

3.
为克服基于漏洞库等传统安全防护策略的短板,实现对未知攻击行为的识别和预警.使用时间窗划分和深度包检测技术,将端到端的通信内容转化为控制行为序列.根据工控协议的语义特性,采用语义向量模型将行为序列转化为统一维度的特征向量.基于单类支持向量机(OCSVM)仅使用正常行为样本构造的异常识别模型,克服了无法从生产环境中获得异常样本的困难.对于所仿真出的多种异常行为序列,模型识别的平均准确率能够达到93%以上.  相似文献   

4.
针对当前的信息检索模型并不能提供语义信息的检索问题,提出了一个基于描述逻辑方法的语义检索模型,定义了文档的逻辑视图、查询的逻辑视图和两种视图之间的相似度计算方法,并给出了模型的存储结构.该模型将用户的检索请求和待查询的数据(文档)转化成基于描述逻辑知识库为基础的个体集合,不仅能够有效表示文档和查询的语义信息,而且有利于计算机自动推理的实现,可以有效提高检索的准确率和召回率.  相似文献   

5.
基于互联网或移动网的即时通信成为一种广泛应用的大众通信方式.对即时短语消息内容进行聚类可以分析短语消息的内容特征,从而跟踪或发现当前的热门话题,预防或审计犯罪活动,也可以协助建立其他数据挖掘应用.针对短语消息内容短、关键词出现次数少,甚至主题关键词隐藏在上下文或短语会话里的特点,提出了WR-KMeans聚类方法,自动将主体间的交互短语消息合成为会话,使聚类分析对象的内容更长,上下文信息更丰富;对于不在会话中出现,但与会话中的词具有较强语义关系的词,将其扩充进会话的表示向量,从而避免因关键词稀少造成的相似度偏差.WR-KMeans在这种扩展的会话向量集上进行聚类.通过实验与另外两个常用的聚类算法进行比较,WR-KMeans生成的聚类结果具有更好的质量.  相似文献   

6.
空间语义增强下的城市交通事故数据可视分析   总被引:1,自引:0,他引:1       下载免费PDF全文
目的 海量城市交通事故数据可能蕴含有交通事故的空间模式,挖掘出交通事故的空间模式有助于开展交通事故的防治工作。目前交通管理部门虽然记录了交通事故发生地的空间位置信息,但没有对事故发生地进行空间语义描述,从而影响对交通事故空间模式的深入分析。因此,提出一种交通事故数据空间语义增强方法,并设计了一套可视分析系统。方法 基于城市兴趣点来增强交通事故数据的空间语义。以事故发生点为中心获取周围城市兴趣点,使用特征向量刻画兴趣点的数量、类别及其与事故发生点的距离,并称此向量为空间语义特征向量。将空间语义特征向量和相应的交通事故关联,以达到增强其空间语义的目的。然后,基于空间语义特征向量,使用自组织映射聚类算法对交通事故进行聚类分析,根据其空间语义特征将交通事故分为若干类别。最后,通过使用地图视图展示事故点数据、聚类视图和平行坐标视图展示聚类分析的结果及其空间语义特征的可视化方法,对交通事故的空间模式进行分析。结果 针对空间语义增强的交通事故数据以及相关分析任务,有效地使用上述数据分析方法与可视化技术,设计并实现了一套多视图关联的可视分析系统,提供了便捷的交互方式辅助用户分析。通过研发人员和交通警察共同对安徽省合肥市2018年的交通事故数据进行分析,将交通事故发生地划分9类并指出每类地点的空间语义特点,进一步分析出了事故高发区域的空间语义特性。结论 本文提出的交通事故数据空间语义增强方法和可视分析方法可以帮助用户揭示交通事故的空间语义模式,有助于深入分析和认识交通事故的成因,能为交通事故防治相关的城市建设工作提供建议。  相似文献   

7.
曹林  朱国刚 《计算机工程与设计》2016,(4):1011-1016,1041
提出一种基于三维时空直方图特征的人体行为识别方法。通过引入时间维度构建三维时空概念,探索时空中梯度方向信息,由梯度方向经过空间中不同的区域形成梯度直方图,获取时空特征矩阵,结合K均值聚类提取时空直方图特征来描述人体行为;采用图像显著性检测算法,获取人体行为轮廓,从轮廓图中提取二维轮廓特征;将获得的特征输入支持向量机进行训练以及人体行为识别。实验结果表明,相比其它特征描述的方法,该方案对人体行为的特征描述更丰富,识别准确率更高。  相似文献   

8.
基于行为描述的软件构件组合兼容性检查   总被引:1,自引:0,他引:1       下载免费PDF全文
张驰 《计算机工程》2010,36(12):46-47
定义构件的基调视图和行为视图,给出将构件行为转化为π演算进程表达的建模方法,并设计实现构件行为的π演算描述自动转换的算法。结合一个电子商务的实例,借助π演算的操作语义和形式化推理技术实现对软件构件组合时的兼容性进行检查。  相似文献   

9.
综合利用形状和颜色特征的台标识别   总被引:1,自引:0,他引:1  
电视台台标是一个电视台的标志,包含了该电视台台名、节目取向等重要语义信息,是实现视频分析、理解和检索的重要语义源之一.本文根据台标的时空视觉特征,提出基于时空不变区域检测的方法来进行台标分割,并提出对台标特征用空间分布直方图和基于HSV空间的彩色直方图相结合的方法进行描述,最后用支持向量机进行台标识别.实验表明该算法识别正确率较高,效果基本令人满意.  相似文献   

10.
网络新闻内容除了直接的文本信息之外,通常还使用高度语义概括后的标签信息对新闻中出现的图片、音视频等多媒体信息进行描述,使得新闻内容中出现了不同语义层次、不同粒度的内容概念(直接的文本特征与标签特征)描述.文本特征维度通常较高,导致特征数较少的视图在聚类中的作用被弱化.同时,各个视图对聚类簇结构的贡献程度不一样.针对以上...  相似文献   

11.
关于提取Web用户浏览行为特征的研究   总被引:5,自引:0,他引:5  
当前,Web日志挖掘技术已成为实现网站个性化服务的研究热点.运用Markov模型来预测用户的浏览模式,从而提高站点访问率、为站点重组提供有利信息是该领域广泛采用的方法之一.但传统方法建立的Markov模型,存在着数据冗余复杂、模型庞大繁琐等问题.针对这些问题,介绍了一种改进的Markov模型.其方法主要是在原有模型的基础之上,在数据清洗、用户会话识别过程中删除一些不予考虑的因素,大大简化了建立的Markov模型,提高了Web日志挖掘的效率.  相似文献   

12.
李新洁  张新有 《微机发展》2011,(10):19-22,27
对反垃圾邮件行为识别技术进行了研究。提出了一种基于会话层的垃圾邮件识别方法,在分析发送过程中的邮件行为特征基础上,提取出能够区分垃圾邮件和正常邮件的行为特征,并采用支持向量机分类算法建立行为特征识别模型,找出垃圾邮件行为规律。该方法在邮件正文发送之前对垃圾邮件进行过滤,能够有效地节省带宽。采用真实的邮件数据集合分别使用行为识别技术与基于内容的过滤技术进行实验,验证该技术具有较好的邮件分类能力。  相似文献   

13.
基于用户行为和会话的Web应用测试方法   总被引:2,自引:2,他引:0       下载免费PDF全文
Web应用程序难以创建有效的测试用例,使其既能满足测试的需求,又能测试Web应用程序的多用户交互行为。针对上述问题,采用从Web日志数据中得到域数据创建测试用例的方法,从Web日志中获取用户行为数据和用户会话数据。提出一种基于用户行为和用户会话的测试新方法,通过实验验证该方法在功能覆盖和故障检测方面的有效性。  相似文献   

14.
基于语义空间的支持向量机的文本过滤   总被引:2,自引:0,他引:2  
传统的基于支持向量机的文本过滤,用向量空间模型来表示文本和用户模板,向量空间模型假设特征项之间是线性无关的,该假设引入了许多因具体用词变化不定而带来的词汇噪音信息,影响了基于支持向量机的文本过滤的过滤性能。提出基于语义空间的支持向量机的文本过滤,用语义来表示文本和用户模板。该方法主要通过奇异值分解提取文本的潜在语义空间,在语义空间上训练支持向量机得到用户模板和过滤阈值,文本流上的文本映射到语义空间上,在语义空间上计算用户模板和新文本的相似度。实验表明:该方法的过滤性能可以达到 98. 67%。  相似文献   

15.
一种基于用户播放行为序列的个性化视频推荐策略   总被引:4,自引:0,他引:4  
本文针对在线视频服务网站的个性化推荐问题,提出了一种基于用户播放行为序列的个性化推荐策略.该策略通过深度神经网络词向量模型分析用户播放视频行为数据,将视频映射成等维度的特征向量,提取视频的语义特征.聚类用户播放历史视频的特征向量,建模用户兴趣分布矩阵.结合用户兴趣偏好和用户观看历史序列生成推荐列表.在大规模的视频服务系统中进行了离线实验,相比随机算法、基于物品的协同过滤和基于用户的协同过滤传统推荐策略,本方法在用户观看视频的Top-N推荐精确率方面平均分别获得22.3%、30.7%和934%的相对提升,在召回率指标上分别获得52.8%、41%和1065%的相对提升.进一步地与矩阵分解算法SVD++、基于双向LSTM模型和注意力机制的Bi-LSTM+Attention算法和基于用户行为序列的深度兴趣网络DIN比较,Top-N推荐精确率和召回率也得到了明显提升.该推荐策略不仅获得了较高的精确率和召回率,还尝试解决传统推荐面临大规模工业数据集时的数据要求严苛、数据稀疏和数据噪声等问题.  相似文献   

16.
凌海峰  王浩 《计算机工程与应用》2012,48(36):121-124,176
Web用户会话聚类是电子商务领域的NP-难问题,目的是发现相似的用户访问行为模式。该问题难度在于对大规模的Web会话进行聚类,且每个会话都表示为高维向量。提出一种细菌觅食算法和K-means相结合的优化算法,用知名的数据集测试其有效性。对Web会话进行聚类,与流行的聚类算法进行比较,实验结果显示该算法高效且性能更优。  相似文献   

17.
基于本体的个性化领域信息服务   总被引:8,自引:0,他引:8  
以数字图书馆领域个性化服务为例,以空间向量模型表示用户兴趣和资源特征,并借助于构建的领域本体和“知网”知识词典对向量进行概念上的扩展,形成用户和资源特征概念空间向量,并通过向量相似度计算寻找最优的资源,从而为用户提供个性化信息服务。实验数据说明了基于概念的相似度计算比基于关键词的相似度计算具有更明显的优越性。  相似文献   

18.
会话识别是用户访问行为分析的基础和关键工作,其质量对于识别和发现用户的信息需求具有决定性的影响。目前常用的是基于时间阈值的切分方法,但是该方法存在的主要问题是针对不同用户时间阈值难以准确地确定。提出了一种新的基于聚类技术的会话识别优化方法,首先建立了基于聚类的会话识别优化模型,然后采用改进的K-means算法进行会话识别。实验结果表明该方法与传统方法相比具有较好的效果。  相似文献   

19.
本文针对Web日志中用户会话识别阈值问题,给出一种基于时间密度的频度分析方法。文中首先将基于时间间膈参数刻度的用户访问频度定义为一个随机向量,给出了随机向量的切尾算法;然后建立频度与IP用户的相关矩阵,矩阵的列为访问频度,矩阵的行为用户IP,矩阵中的每一个值为某一时间间膈的访问频度。通过列向量的聚类分析,对不同类别用户的访问行为进行探讨。最后,对会话识别的阈值进行参数估计,并通过抽样对阈值进行检测和参数修正。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号