排序方式: 共有21条查询结果,搜索用时 15 毫秒
1.
在对潜在语义分析和主题模型2种语言模型的基本原理和方法分析的基础上,给出了其在主题内容识别及文本数据挖掘方面的应用前景. 进一步从全信息自然语言理解方法论出发,指出了语言计算研究的突破性进展:一方面需要与认知科学相结合,借鉴认知科学的研究成果;另一方面要重视从语用的维度进行研究. 相似文献
2.
鲁棒局部保持投影的表情识别 总被引:1,自引:0,他引:1
针对局部保持投影的流形学习算法对于噪声与异常值的敏感性,提出了一种鲁棒的局部保持投影算法. 其基本出发点是首先对所有数据点进行评估,以获得它们可能成为异常值的信息,然后再将这种信息用于邻域选择与低维嵌套中. 采用鲁棒局部保持投影进行人脸的表示方法,对JAFFE表情数据库进行了实验,结果表明,该方法有效. 相似文献
3.
近年来,随着科学技术的发展,各种设备日志层出不穷,然而传统的基于单节点的集中式日志分析已经无法满足日志海量、异构、多样等要求,何有效的利用分布式计算资源解决海量日志分析问题成为当下日志研究的一个热点问题。本文提出了基于消息队列rabbitmq的集群方案,并在此基础上测试了海量数据的分布式计算.对比实验结果说明集群优势可以有效的解决日志分析海量数据的问题。 相似文献
4.
5.
借鉴自动文摘领域复合式文摘的思想,提出了一个全信息知识制导的科技期刊初审辅助系统框架,并在车牌自动识别研究领域中实现.该系统根据科技论文的特点,结合编辑人员的工作经验,将编辑初审细化为4个方面的评判,在基于全信息的领域知识库指导下,模拟编辑人员 “粗读细读精读”循序渐进的审稿过程,通过理解来稿的内容辅助编辑人员完成初审工作.实验系统的初步测试结果表明,该系统的整套方法是行之有效的. 相似文献
6.
许多实际应用已经证明,k-means算法能够有效地得到好的聚类结果。但是,k-means直接算法的时间复杂度和模式复杂度对数据量的大小非常敏感,无法满足一些高性能的应用场合,如个性化服务中对用户数据进行的群组分析。对此,笔者提出了一种新颖的基于k-d树的聚类算法。这种算法采用空间数据结构—k-d树组织所有的样本数据,可以高效地搜索到离某个给定的聚类中心最近的全部模式。实验结果表明,该方案可以显著提高k-means直接算法的运算速度,在距离运算量和总的运算时间上,可把性能提高1~2个数量级。 相似文献
7.
探测是安全的第一步,对于工控设备资产信息进行有效的探测和获取是实现工业互联网信息监测和安全漏洞发现的重要起点。结合modbus、s7、dnp3和BACnet四种工控协议的通信机制和数据报文结构提出了一种针对运行在不同工控协议上的工控设备的并发进行资产探测的通用方法。通过实验证明,该方法较传统的探测方式在功能上具有通用性,在性能上提高了对工控设备的资产信息探测速率和准确率,可以为工控设备的安全预警、设备检测与维护提供帮助。 相似文献
8.
文本倾向识别的置信度估计 总被引:1,自引:0,他引:1
由于置信度模型可以有效地判断观测数据与文本倾向模板之间的匹配程度,因此可以用在文本倾向识别中,有效地定位识别结果,从而提高系统的识别率和稳健性。该文讨论了文本倾向识别中的置信度的基本原理,介绍了假设检验和区间估计在文本倾向识别中的应用。 相似文献
9.
10.
计算机网络在各行业中获得广泛应用的时候,网络安全也成为机构和企业越来越关注的问题.虽然防火墙、防病毒系统、漏洞扫描等安全产品被部署于网络中,但多种安全设备缺乏有效整合,而对其产生的海量日志信息,网络管理人员往往难以应付,网络安全威胁依然突出.统一网络安全管理平台是一个解决方案,但因为企业网络环境越来越复杂,分布式的部署在大量日志信息的传输上存在困难.为此,本文在分布式框架的基础上考虑了几种传输方式,最终选用数据库直接映射的方式完成数据传输. 相似文献