共查询到20条相似文献,搜索用时 109 毫秒
1.
针对检索引擎返回的查询结果数量巨大,用户难以在较短的时间获取有用的信息,传统FCM聚类算法的距离无法完全准确描述文本间的相似程度,本文提出了一种新的文本间的距离定义,改进了模糊C均值聚类(FCM)聚类算法,利用新改进的算法对搜索引擎返回的结果进行聚类,方便了用户查询。实验证明了算法的可行性与有效性。 相似文献
2.
一种聚类模式下基于密度的改进KNN算法 总被引:1,自引:0,他引:1
KNN是基于实例的算法,训练样本的数量影响KNN的分类性能.合理的样本剪裁可以提高分类器的效率.提出了一种聚类条件下基于密度的KNN改进模型.首先使用聚类方法对训练集进行基于类别的选择,裁剪边缘样本以减少噪音;再基于类别密度对样本进行加权,改善k近邻选择时大类别、高密度训练样本的占优现象.试验结果表明,本文提出的改进KNN分类算法提高了KNN的分类效率. 相似文献
3.
针对Deep Web的查询需求,文章提出了改进的对Deep Web数据源的分类方法:在对数据源进行分类时,采用了KNN分类算法来进行。由于KNN分类算法的K值选的过大或者过小都会对分类结果产生影响,因此提出了对K值进行优化的改进的KNN算法。文章利用k-means聚类算法来进行聚类,分别计算取得每个类别的k个距离相近的数据并计算这k个数据到聚类中心的距离,把这个距离的倒数作为该数据点对分类结果的贡献值。对训练集进行聚类后返回聚类中心,根据聚类中心计算权重,从而进一步来计算每个类别中k个最近邻贡献值之和S,选取S最大的类别作为测试数据的类别来进行分类,从而可达到比较好的分类效果。 相似文献
4.
KNN算法是经典的文本分类算法.训练样本的数量和类别密度是影响算法性能的主要瓶颈,合理的样本剪裁可以提高分类器效率.文中提出了一种基于聚类的改进KNN分类模型.首先对训练集进行聚类,基于测试样本与簇之间的相对位置对训练集进行合理裁剪以节约计算开销;然后基于簇内样本分布进行样本赋权,改善大类别样本的密度占优现象.实验结果表明,本文提出的样本剪裁方法提高了KNN算法的分类性能. 相似文献
5.
6.
针对传统聚类算法存在的聚类类别数难以确定、易陷入局部极大和无法反映用户反馈的语义信息的问题,提出了一种基于免疫克隆选择和语义计算的自适应资源检索算法。其主要处理环节是使用语义相似度计算公式来计算抗体的免疫优势;引入了自适应优先算子来动态调解聚类类别,检查用户动态反馈的有效性;引入组合因子来增加抗体种群中个体的多样性,以扩大解的搜索范围,避免过早出现早熟现象;实验结果表明,使用该算法比传统聚类算法具有良好的收敛性、稳定性和更高的全局最优。 相似文献
7.
在分布式检索中,基于主题的语言模型集合选择方法首先引入Relevance Model计算用户查询和信息集合中文档的相似度,在此基础上通过文本聚类得到集合中文档的主题信息,加入语言模型计算得到各个信息集合的查询相关度排名,以此完成集合选择.实验表明,与ODRI、CRCS和基于传统语言模型的集合选择算法相比,该方法的检索效果得到了显著提高. 相似文献
8.
离散文本已经成为一种占据重要地位的舆情信息表现形式,根据离散文本的特点,提出基于特征概念网的离散文本舆情信息的分聚类框架,在此基础上给出分聚类方案。在聚类算法中,运用了遗传算法的全局并行搜索能力、k—means的高效局部聚类能力和小生境的保持种群多样性抑制漂移能力;在分类算法中,先将训练文本库进行类内聚类成子类,对子类构建特征概念网以生成替代该子类的文本,再用KNN算法进行分类。最后结合舆情分析进一步提出了可用的改进方案。 相似文献
9.
10.
基于内容的图像检索是近年来计算机视觉领域的重要方向之一,如何快速准确地匹配视觉信息内容是图像检索最关键的部分。目前大多数检索方法采用BOF(bag of features)算法,该算法的检索精度较低,且运行速度较慢。提出了一种新的匹配方法,提高检索精度的同时有效减少了检索时间。本算法利用特征点的四个相对独立的角度对其进行分类,可大幅减少需要比较的特征算子的数量,并对每一分类中的特征点使用k-means算法聚类,得到若干个聚类中心。本方法对每一聚类的特征点进行汉明编码,并采用倒排表的方式进行信息存储。实验对象使用Holiday图像库,结果显示,检索精度和检索速度较原先算法得到了较大程度的改善,检索精度最高可提高55.9%,至0.8557,检索时间最多可降低49.3%,至0.35s。 相似文献
11.
多媒体多播系统中的动态资源分配技术以其有效利用系统资源,及满足具有差异性信道条件的多用户需求而受到业内广泛研究和重视。针对MRA_LCG算法和MRA_GAT算法存在的弊端,提出了MRA_FCF算法,利用灵活可控的速率均衡因子使得高速率多媒体信息向低速率上分流。仿真结果表明,所提MRA_FCF算法获得的吞吐量明显优于MRA_LCG算法的,且同时在保证组内用户公平性方面比MRA_GAT算法具有优势。 相似文献
12.
司钊 《电信工程技术与标准化》2013,(2):80-84
采用改进的贪婪算法分配时隙的无线资源,根据用户业务的QoS和数据队列信息确定用户的优先权,并在获知信道状态信息条件下,按照传输比特消耗功率最小原则搜索所有子载波信道,为用户动态分配子载波和比特。仿真结果表明,在两种传输速率要求下,当接入用户数相同时,改进算法比传统贪婪算法减少功率消耗3.9622W;改进算法多消耗1.9858W功率却增加了2个接入用户,用户消耗平均功率比前者少2.2456W/用户。 相似文献
13.
14.
15.
个性化搜索引擎中用户协作推荐算法的研究 总被引:7,自引:2,他引:5
个性化信息服务越来越成为信息检索领域中研究的热点,文章综合内容过滤和协作过滤两种技术的优点,给出了一种个性化搜索引擎系统的体系结构,并在此基础上提出了用户协作推荐算法.模拟实验表明,该结构和算法能够有效地推荐出与用户意图相关的信息,并且具有良好的可适应性. 相似文献
16.
Asynchronous Iterative Water-Filling for Gaussian Frequency-Selective Interference Channels 总被引:1,自引:0,他引:1
Scutari G. Palomar D.P. Barbarossa S. 《IEEE transactions on information theory / Professional Technical Group on Information Theory》2008,54(7):2868-2878
This paper considers the maximization of information rates for the Gaussian frequency-selective interference channel, subject to power and spectral mask constraints on each link. To derive decentralized solutions that do not require any cooperation among the users, the optimization problem is formulated as a static noncooperative game of complete information. To achieve the so-called Nash equilibria of the game, we propose a new distributed algorithm called asynchronous iterative water-filling algorithm. In this algorithm, the users update their power spectral density (PSD) in a completely distributed and asynchronous way: some users may update their power allocation more frequently than others and they may even use outdated measurements of the received interference. The proposed algorithm represents a unified framework that encompasses and generalizes all known iterative water-filling algorithms, e.g., sequential and simultaneous versions. The main result of the paper consists of a unified set of conditions that guarantee the global converge of the proposed algorithm to the (unique) Nash equilibrium of the game. 相似文献
17.
针对信道状态信息未知SWIPT-D2D((Simultaneous Wireless Information and Power Transfer Device to Device)无线通信网络环境下设备间信号干扰以及设备能量损耗问题,提出通过使用近端策略优化(Proximal Policy Optimization, PPO)算法,在满足蜂窝用户通信质量要求的前提下同时对D2D用户的资源块、发射功率以及功率分割比三部分进行联合优化。仿真结果表明,所提算法相比于其他算法能够为D2D用户制定更好的资源分配方案,在保证蜂窝用户保持较高通信速率的同时使D2D用户获得更高的能效。同时,当环境中用户数量增加时,所提算法相比于Dueling Double DQN(Deep Q-Network)以及DQN算法,D2D能效分别平均提高了15.95%和23.59%,当通信网络规模变大时所提算法具有更强的鲁棒性。 相似文献
18.
LiangXiaowen ZhuJinkang 《电子科学学刊(英文版)》2004,21(6):454-460
In this paper, a blockwise adaptive subcarrier allocation algorithm for multiuser Orthogonal Frequency Division Multiplexing (OFDM) system is introduced. Assuming the knowledge of channel information for all users, the algorithm minimizes the total transmit power while satisfying the total power and users‘ rate constraints. The result of simulation shows that the proposed algorithm reduces the average bit Signal-to-Noise Ratio (SNR) by approximately 4 dB compared with OFDM-Frequency Division Multiple Access (OFDM-FDMA), and supports more users in a multiuser Rayleigh fading channel. As assigning subcarriers in block, the computational complexity of the algorithm is much lower than that of the derivation of “water-filling” algorithm. 相似文献
19.
尽管用户可自主生成个性化数据以更全面描述个人偏好,但由于用户创建数据不严谨、不可控,导致生成的庞大数据集大多存在质量低、噪声严重的缺陷.因此管理复杂网络信息时,不能仅使用写入性知识,必须重视具有大量领域知识的专家,因为其可为系统提供高质量的信息.本文通过构建和分析用户兴趣分布曲线以发现兴趣领域专家,并提出甄别状态不正常的伪专家算法.由于网络中权威专家数量较少,所以所提供的信息是有限的.因此本文定义的领域专家不仅包含权威专家,而且包含普通用户中对某领域有极高关注的兴趣领域专家.实验证明算法的正确性和高效性,并且较低的复杂度使其可处理海量用户节点信息. 相似文献