首页 | 本学科首页   官方微博 | 高级检索  
     

领域知识在文本聚类应用中的机遇和挑战
引用本文:景丽萍,恽佳丽,于剑.领域知识在文本聚类应用中的机遇和挑战[J].计算机工程与科学,2010,32(6):88-91.
作者姓名:景丽萍  恽佳丽  于剑
作者单位:北京交通大学计算机与信息技术学院,北京,100044
基金项目:国家重点基础研究发展规划(973计划),国家自然科学基金 
摘    要:最近几年,越来越多学者意识到单靠数据驱动的无监督聚类方法很难满足用户对富含语义信息的文本数据的处理需求。领域知识,如领域本体的人工或自动构建、百科全书Wikipedia的网上公布为文本处理带来了新的希望和美好的前景。本文主要阐述领域知识在文本聚类过程中的具体应用、研究现状和所面临的挑战。

关 键 词:领域知识  文本聚类  知识表示  文本表示模型
收稿时间:2009-09-06
修稿时间:2009-12-10

 Domain Knowledge in Text Mining:Opportunities and Challenges
JING Li-ping,YUN Jia-li,YU Jian. Domain Knowledge in Text Mining:Opportunities and Challenges[J].Computer Engineering & Science,2010,32(6):88-91.
Authors:JING Li-ping  YUN Jia-li  YU Jian
Affiliation:(School of Computer and Information Technology,Beijing Jiaotong University,Beijing 100044,China)
Abstract:Recently, more and more researchers realize that it is hard to satisfy the users’ needs of the data driven unsupervised learning methods in text data analysis. Fortunately, the appearance of domain knowledge provides a bright future for this problem. Domain knowledge, at present, is usually represented as ontology hierarchy (built artificially) or encyclopedia (e.g., online Wikipedia). In this paper, we describe how the domain knowledge is used in processing text mining, review the related work,and point out the challenges in this research direction.
Keywords:domain knowledge  text mining  knowledge representation  text representation model
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号