排序方式: 共有44条查询结果,搜索用时 31 毫秒
1.
随着信息技术的不断发展和应用,大量信息系统积累了海量多源异构数据,这些数据中有很大一部分都是结构化数据,具有高维度、低质量、无标注等特点,难以进行特征提取与进一步的知识提炼。主题建模是文本处理和数据挖掘中的一个非常重要的方法,它是一种无监督学习算法,最初用于对无结构的自然语言文本进行建模,可以有效地从文本语义中提取主题信息,以进行特征提取和降维分析,然而主题建模技术尚不能很好应用在关系复杂的多源数据,尤其是结构化数据的处理中。提出了一个基于可扩展主题建模技术的针对结构化与非结构化多源数据分析框架,通过数据导入、数据分析、数据可视化三个步骤对多源数据进行基于主题建模技术的数据分析,并在此基础上实现了一个多源数据分析工具,最后通过两个数据集的实验证明了所提的多源数据分析框架的有效性。 相似文献
2.
《计算机科学与探索》2017,(10):1591-1598
开发人员通常通过问答网站的搜索引擎进行相关软件问答文档的搜索。在检索结果中,包含优质代码片段(使用示例)的问答文档往往更受青睐,但如何度量这些文档中代码片段的质量仍是个巨大的挑战。针对这个问题,提出了一种基于代码模式的软件问答文档检索优化方法。该方法能够基于当前检索结果,抽取文档中的代码片段,分析代码片段中的公共代码模式,并基于代码模式度量文档中代码片段的质量,从原有检索结果中向用户推荐高质量的软件问答文档。以软件开发人员在实践过程中遇到的真实问题为基础进行了实验,对比Stack Overflow的搜索结果,所提方法在准确率指标NDCG@5上提升了40%。 相似文献
3.
《计算机科学与探索》2016,(7):901-914
作为大数据处理的一种重要模式,图处理被广泛地应用在机器学习、数据统计和数据挖掘等场景中。在企业级应用中,多种类型的大数据处理框架通常会部署在同一个分布式集群中,其运行环境是开放、共享的,这时图处理需要考虑运算资源动态变化的问题。为了能适应这种动态性,更加充分地利用开放共享环境的资源,图处理框架应该具备弹性伸缩能力。通过调研,发现现有的图处理框架尚未完全实现弹性伸缩。为此,介绍了一种支持弹性伸缩的分布式并行图处理框架SPar Ta G。首先基于任务并行模型定义了图处理任务集及任务模型;其次基于任务迁移机制设计并实现了可动态伸缩的图处理框架;最后设计了一个基于负载均衡的调度算法,实现了动态伸缩的图处理过程。实验结果说明,SPar Ta G的性能与当前流行的开源图处理框架Giraph相近,且具有较好的弹性伸缩能力。 相似文献
4.
5.
RFID标签所有权转移协议研究 总被引:11,自引:0,他引:11
无线射频识别技术(RFID)是适用于普适计算环境的技术之一,它的应用正在变得随处可见.RFID安全与隐私问题是这些应用的基本需求之一,由于RFID标签的资源限制,传统的安全元素不能很好地应用到RFID标签中.因此,设计轻量级的安全机制非常重要.应用中,贴有标签的物品经常发生所有权的转移.这就需要保护原所有者与新所有者的... 相似文献
6.
无线射频识别(RFID)采用唯一的电子标签识别物理对象,可高速收集大量目标数据.为向各类应用提供语义信息,RFID系统需从收集的数据中检测用户自定义的复合事件.通过提出一种基于Petri网的RFID事件检测方法,引入形式化的ED-net模型描述复合事件语义,并以此为基础实现一种事件检测方法.ED-net模型是对传统Petri网的一种扩展,提供了描述用户自定义类型、函数及表达式的能力,可精确描述RFID复合事件的属性及时域、非时域、参数化等约束条件.通过对RFID事件形式化描述,各种RFID事件可以统一在ED-net模型,并可自动化进行检测处理,避免了不同复合事件间公共子事件重复检测的问题.最后,经过实验测试和分析,验证了该形式化方法的有效性及其优势. 相似文献
7.
在用于构建深度学习模型的深度学习框架中,算子的正确计算对于深度学习模型的正确预测至关重要.然而,已有的深度学习框架缺陷检测方法只能通过比较和推测的方式找到不同深度学习框架之间计算结果相差较大的算子,而且无法检测深度学习模型在训练过程中产生的计算错误,具有很大的局限性.针对此问题,本文设计并实现了基于元算子的深度学习框架缺陷检测方法,通过将不同深度学习框架中算子的共性计算逻辑抽象为“元算子”,支持在不改变模型代码的前提下绑定元算子的具体实现,从而可以细粒度地对比同一模型使用不同深度学习框架的运算结果,进而发现缺陷.本文的方法同时支持训练过程和推断过程的缺陷检测,还可以对计算错误的定位进行验证.本文验证了元算子计算的准确性,并评估其运算性能;收集了深度学习框架中已知有错误计算的算子,并将本文方法应用在包含这些算子的深度学习模型上,验证了本文缺陷检测方法的有效性. 相似文献
8.
行走是日常生活中最常见的行为之一,它的特征可以反映人的身份、健康等重要信息.例如,行走的速度、方向、步数、步长等细粒度的参数可以为室内追踪、步态分析、老人看护等情境感知应用提供关键信息.因此,在近几年中,利用环境中已有的Wi-Fi信号对行走进行感知受到了研究人员的广泛关注.为了利用Wi-Fi信号感知行走,当前的方法都需要进行大量的行走数据采集,通过经验观察或者离线学习,提取信号特征来识别行走以及估计行走参数.由于缺乏理论指导,所提取信号特征较为间接且往往包含与环境和感知目标相关的冗余信息,所以当环境和感知目标发生变化时,系统需要重新进行学习,使其难以被应用于无线环境易变的真实场景中.不同于以往工作,首次在不需要任何预训练的情况下,利用环境中已有的Wi-Fi信号实现了在连续活动中对行走行为的精准识别,并且能够同时精确地估计行走的速度、方向、步数、步长等多维信息,为上层情境感知应用提供关键的上下文信息.特别地,通过分析人在行走过程中产生的多普勒效应和Wi-Fi信道状态信息(channel state information)之间的关系,建立基本的多普勒速度运动模型,揭示了行走行为和信道状态信息变化之间的理论关联.同时,基于该模型,通过多重信号分离(multiple signal classification)算法从信道状态信息中提取出了与环境和感知目标均无关、仅与人运动状态相关的信号特征——多普勒速度.最后,通过深入研究多普勒速度和人的行走真实速度之间的映射关系,提出了基于多普勒速度的行走识别与细粒度的行走参数估计方法,且经过在不同环境中、由不同实验者进行的大量实验也表明了行走识别和行走参数估计方法的准确性和鲁棒性.其中,对于行走识别的准确率达到了95.5%,行走速度大小估计的相对中位误差为12.2%,方向估计的中位误差为9°,步数统计的准确率达90%,步长估计的中位误差为0.12m. 相似文献
9.
行走追踪在真实场景中具有广泛应用,可以用于安防监控、老人看护、室内导航等场景.近年来,基于无线射频信号的非接触式行走追踪受到了研究人员的广泛关注,包括基于Wi-Fi信号、RFID信号等的行走追踪系统.然而,现有的行走追踪系统依然面临感知范围小、感知设备部署稠密等问题.在本文中,我们首次将用于物联网低功耗、远距离通信的LoRa技术应用到非接触式的大范围行走追踪中,显著地增加了行走追踪系统的感知距离.特别地,通过利用LoRa网关上配置的多天线,利用两根天线上接收信号的比,可以有效地消除噪声干扰以及收发不同步带来的误差,从而进一步提升了感知范围,然后利用计算切线向量相位变化的方法准确计算原始信号中动态分量的相位变化来在估计行走距离和方向.基于此,本文提出基于LoRa的非接触感知系统,可以在一段自然连续的行走活动中准确地判断人的动静状态并切割出行走片段,进而计算出行走的距离和方向,实现人的行走追踪.实验验证了系统计算行走距离和方向的准确性和实时性,其中距离计算的平均误差为3.8%,准确判断行走方向所需时间为0.7 s. 相似文献
10.
敏捷开发采用用户故事表达用户需求.一般采用格式受限的自然语言编写,但在用户故事编写过程中经常出现一些表述上的缺陷.典型的缺陷包括缺失必要信息、意思表达含糊不清、故事间有重复或存在冲突等.这很大程度上影响了需求的质量,影响软件开发项目的进行.提出一种用户故事需求质量提升方法.从故事缺陷定位的角度出发,该方法构建了用户故事概念模型,并根据实际案例总结并提出11条用户故事应遵循的质量准则.从而提出故事结构分析、句法模式分析以及语法分析等技术,用于自动构建带场景用户故事的实例层模型,并根据准则进行故事缺陷检测,进而提升用户故事质量.在包含36个用户故事84个场景的实际项目中进行实验,自动检测出173个缺陷,缺陷检测的准确率和召回率分别达到88.79%和95.06%. 相似文献