期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

Web文本挖掘技术及其应用的研究

郭玉滨《数字社区&智能家居》2006,(3):18-18,126

文章详细研究了Web文本挖掘的定义及类型，重点分析了Web文本挖掘算法，总结了文本挖掘的应用，提出了今后工作的重点。相似文献

2.

文本挖掘技术研究

LIN Hai-wen 《数字社区&智能家居》2008,(34)

文章报告了文本挖掘技术的现状、文本挖掘的过程、文本挖掘研究的课题,最后对文本挖掘的前景做了展望。相似文献

3.

文本挖掘技术研究

林海文《数字社区&智能家居》2008,3(12):1711-1712

文章报告了文本挖掘技术的现状、文本挖掘的过程、文本挖掘研究的课题，最后对文本挖掘的前景做了展望。相似文献

4.

Web文本挖掘技术研究 总被引：221，自引：1，他引：220

王继成潘金贵张福炎《计算机研究与发展》2000,37(5):513-520

作为从浩瀚的Ｗｅｂ信息资源中发现潜在的、有价值知识的一种有效技术,Ｗｅｂ挖掘正悄然兴起,倍受关注,目前,Ｗｅｂ挖掘的研究正处于发我统一的结论,需要国内外学者在理论上开展更多的讨论,同时,Ｗｅｂ挖掘系统的开发对其研究也将起到很大推进作用,首先探讨了Ｗｅｂ挖掘的有关理论,从Ｗｅｂ挖掘的定义、Ｗｅｂ挖掘与Ｗｅｂ信息检索的关系、Ｗｅｂ信息检索的关系、Ｗｅｂ挖掘任务的分类与功能等方面加以阐述,然后重点分析了相似文献

5.

Web文本挖掘技术及其应用的研究

郭玉滨《数字社区&智能家居》2006,(8)

文章详细研究了Web文本挖掘的定义及类型,重点分析了Web文本挖掘算法,总结了文本挖掘的应用,提出了今后工作的重点。相似文献

6.

文本挖掘理论概述

巩知乐张德贤《福建电脑》2008,24(9):21-22

文本挖掘是一个从非结构化文本信息中获取用户关心或感兴趣模式的过程。对文本挖掘进行深入的研究将大大提高从海量的文本数据中获取有用知识的效率。本文首先介绍了文本数据挖掘的研究概况,之后着力对当前基于Web文本挖掘的一般处理过程进行了详细的描述,同时总结了文本分类和文本聚类的一些主要算法,在文章的最后对文本挖掘在信息技术中的发展前景做了合理的预测和展望。相似文献

7.

关于文本挖掘中文本聚类算法的研究

蔡坤姜保庆《福建电脑》2009,25(4):45-46

本文首先介绍文本挖掘的定义及一般处理过程。重点探讨了文本挖掘中的关健技术文本聚类。相似文献

8.

分层聚类算法在文本挖掘中的应用

刘卓徐斌《网络安全技术与应用》2010,(7):61-62

随着Internet技术的高速发展,如何从海量的Web信息中快速而有效地获得所需信息也就成为一项重要课题,而数据挖掘技术是解决这一难题的有效办法。其中数据挖掘中的聚类方法是用来发现数据分布的一项重要方法。本文首先阐述了Web挖掘的有关理论,然后针对Web挖掘中的分层聚类法进行了较为详细的论述,最后使用该算法并结合改进的特征权值计算方法和文本相似度的计算方法,建立了训练文本库。相似文献

9.

WEB文本挖掘的研究

吴岳芬刘洪辉《数字社区&智能家居》2006,(4):87-89

文章首先探讨了Web挖掘的地位，基于WEB的文本挖掘是WEB挖掘的重要组成部分。文章重点对文本特征提取、文本分类、文本聚类等WEB文本挖掘关键实现技术做了介绍，最后讨论了Web文本挖掘的价值。相似文献

10.

一个文本挖掘方法在扩展的电子商务系统中的应用

包书哲周东清侯志刚《计算机应用研究》2003,20(12):107-108

数据挖掘技术是电子商务系统不可缺少的重要工具，两者的结合具有长远的发展前途。初探了将一种基于SOM的文本聚类方法应用于一个扩展的电子商务系统的方法，使之用来进行注册客户的聚类挖掘，有利于充分利用网络资源，提高网络系统的使用效率。相似文献

11.

基于高维聚类的探索性文本挖掘算法

张爱科符保龙《计算机应用》2013,33(4):988-990

建立了一种基于高维聚类的探索性文本挖掘算法,利用文本挖掘的引导作用实现数据类文本中的数据挖掘。算法只需要少量迭代,就能够从非常大的文本集中产生良好的集群;映射到其他数据与将文本记录到用户组,能进一步提高算法的结果。通过对相关数据的测试以及实验结果的分析,证实了该方法的可行性与有效性。相似文献

12.

A context-aware recommender method based on text and opinion mining

Camila Vaccari Sundermann Renan de Padua Vítor Rodrigues Tonon Ricardo Marcondes Marcacini Marcos Aurélio Domingues Solange Oliveira Rezende 《Expert Systems》2020,37(6):e12618

A recommender system is an information filtering technology that can be used to recommend items that may be of interest to users. Additionally, there are the context-aware recommender systems that consider contextual information to generate the recommendations. Reviews can provide relevant information that can be used by recommender systems, including contextual and opinion information. In a previous work, we proposed a context-aware recommendation method based on text mining (CARM-TM). The method includes two techniques to extract context from reviews: CIET.5_embed, a technique based on word embeddings; and RulesContext, a technique based on association rules. In this work, we have extended our previous method by including CEOM, a new technique which extracts context by using aspect-based opinions. We call our extension of CARM-TOM (context-aware recommendation method based on text and opinion mining). To generate recommendations, our method makes use of the CAMF algorithm, a context-aware recommender based on matrix factorization. To evaluate CARM-TOM, we ran an extensive set of experiments in a dataset about restaurants, comparing CARM-TOM against the MF algorithm, an uncontextual recommender system based on matrix factorization; and against a context extraction method proposed in literature. The empirical results strongly indicate that our method is able to improve a context-aware recommender system. 相似文献

13.

基于文本挖掘技术的专利质量评价与实证研究 总被引：3，自引：0，他引：3

刘玉琴汪雪锋雷孝平《计算机工程与应用》2007,43(33):12-14

分析了专利价值评价现状及其应用限制,在此基础上提出了基于文本挖掘技术的专利质量评价方法,用以挖掘专利数据内部的、客观的信息。通过新颖度度量函数量化专利的技术新颖程度,依此来评价某一个行业内的专利质量。然后,将该方法应用到我国光通信技术领域,进行相关专利的质量评价。相似文献

14.

基于文本分析的故障序列模式挖掘算法

常文兵苑星龙周晟瀚李磊《计算机应用研究》2019,36(9)

针对结构化程度差、表达形式各异的文本数据,提出了一种基于文本信息的故障序列模式挖掘算法,用于发掘故障之间的时序关系。为从文本记录的故障信息中挖掘故障规律,首先将文本信息向量化,对故障文本信息进行相似度衡量,将表达相同意义的故障归为一类。在此基础上根据故障特性,提出最大窗口阈值、最小共现度阈值的概念,构建故障序列模式挖掘算法框架。最后对某型飞机文本故障信息进行序列模式挖掘,找出了正确的故障序列关系。实例验证了所提算法是正确有效的。相似文献

15.

基于本体论的文本挖掘技术综述 总被引：6，自引：0，他引：6

贾焰王永恒杨树强《计算机应用》2006,26(9):2013-2015

文本挖掘技术是从海量文本信息中获取潜在有用知识的有效途径。传统的文本挖掘方法由于不能有效运用语义信息而难以达到更高的准确度。本体论为语义信息的合理表示和有效组织提供了理论支持和技术手段。介绍和分析了常识本体和领域本体以及基于这些本体的文本挖掘方法。相似文献

16.

基于语言节奏的大规模文档去重算法研究

下载免费PDF全文

陈钒冯志勇李晓红赵庚《计算机工程与应用》2011,47(11):15-18

通过对Web中大规模文档研究发现,文档中的自然段落具有特殊的语言节奏。提出了一种基于语言节奏的文档重复性检测方法,通过构建文档中自然段落的语言节奏码并进行重复性分析,实现了基于段粒度的文档重复性检测。实验表明,此方法具有良好的召回率和准确率,可以将内容完全重复的文档、部分段落内容重复的文档及打乱段落顺序重组文档的重复性均检测出来,检测精度高且占用系统资源少。相似文献

17.

动态向量的中文短文本聚类

下载免费PDF全文

金春霞周海岩《计算机工程与应用》2011,47(33):156-158

因中文短文本特征词词频低、存在大量变形词和新词的特点,使得中文短文本相似度发生漂移,难以直接使用现有的面向长文本的聚类算法。针对短文本相似度漂移问题,提出了一种基于《知网》扩充相关词集构建动态文本向量的方法,利用动态向量计算中文短文本的内容相似度,进而发现短文本之间的内在关联,从而缓解特征词词频过低和存在变形词以及新词对聚类的影响,获得较好的聚类结果。实验结果表明,该算法的聚类质量高于传统算法。相似文献

18.

基于文本聚类技术的主题发现

郭建永蔡勇甄艳霞《计算机工程与设计》2008,29(6):1426-1429

阐述了一种主题发现系统,它能发现数据流中的隐含知识,并将其表述为含有主题/副主题的层次树,每个主题包含与其相关的文档集和文档摘要,以便于用户从层次树中浏览和选择所需主题.并提出了一种增量层次聚类算法,该算法结合了划分聚类和凝聚聚类的主要优点.实验结果表明,无论是作为主题检测系统还是分类和概括工具,该算法都是高效的. 相似文献

19.

基于主题的Web文本聚类方法

张万山肖瑶梁俊杰余敦辉《计算机应用》2014,34(11):3144-3146

针对传统Web文本聚类算法没有考虑Web文本主题信息导致对多主题Web文本聚类结果准确率不高的问题,提出基于主题的Web文本聚类方法。该方法通过主题提取、特征抽取、文本聚类三个步骤实现对多主题Web文本的聚类。相对于传统的Web文本聚类算法,所提方法充分考虑了Web文本的主题信息。实验结果表明,对多主题Web文本聚类,所提方法的准确率比基于K-means的文本聚类方法和基于《知网》的文本聚类方法要好。相似文献

20.

基于弹幕文本挖掘的社交媒体KOL研究

周忠宝朱文静王皓郭修远王立峰《计算机工程与科学》2022,44(3):521-529

社交媒体关键意见领袖KOL为品牌营销带来更多机会,所以备受广告主青睐,但KOL行业的低门槛进入和数据造假行为,导致广告主无法快速找到与自身品牌匹配的KOL。基于以上背景,对KOL发布在社交平台的视频进行研究,对视频中的弹幕文本进行动态主题分析,刻画弹幕主题随时间的变化,同时使用卷积神经网络模型对含有广告的视频弹幕文本进行情感分析,进一步分析观众对于KOL推广行为的情感极性。实验结果表明,本文提出的KOL分析方法更加全面具体地评估了KOL的商业价值,能够帮助广告主高效找到合适的KOL。相似文献