共查询到20条相似文献,搜索用时 140 毫秒
1.
AIP(All day Information Pursue)平台,即全天候信息跟踪平台,作为关注多方面消息的企业或团体查看Internet上新信息的一种解决方案,弥补了搜索引擎一些方面的不足.它能够从Internet上获取每日的新信息,利用网页自动分类去除不相关文章.通过此平台,用户可以按时间、按类别来查看信息,也可以对文章加以标注推荐给别人阅读. 相似文献
2.
3.
二、连结(Links)连结是WWW最富有吸引力的地方。你只要在荧幕上某个特别显眼的字句上,按一下鼠标按钮,测览器就会去抓取与该字句一个相关的文件并显示出来,作为WWW网页的作者,你有责任把字句连到意义确实相关的地方,不过从技术上来说,你可以随便把它连到Internet上任何服务器上的任何文件。当然,你可以连到另一个WWW上的文件,也可以连到任何GO-pher文件、WAIS查询、Usenet讨论群、ftp、telnet、finger等各式各样的Internet服务上。连结的标签称为描(ancho),因为它可以是向外跳跃的出发点,也可以是另一个连结跳跃的目… 相似文献
4.
5.
数字化校园网信息资源组织模型与实现 总被引:5,自引:0,他引:5
1.问题引入 Internet的出现和发展,使得人类全部的信息资源以前所未有的程度和方式在全球内相互联通。信息资源即为在In-ternet上公开发布的网页和在线数据库的总和。在数字化校园实施过程中,如何开发利用信息资源,满足用户对信息的个性化需求,是信息化建设取得实效的关键。基于Internet的不同应用系统有不同的信息资源组织方式,如提供产品支持的站点按面向任务的模式组织资源,在线购物系统则按产品目录分类。信息资源组织方式与应用系统提供的信息服务直接相关,也对Web站点的主页和一级页面内容设计产生影响。 相似文献
6.
一种模仿人类的自动文本分类算法 总被引:6,自引:0,他引:6
1.引言 Internet上有着大量的且快速增长的文本,文本是信息和知识的宝贵资源。随着Internet的快速发展,不久的将来,人们所需要的大部分信息都可以在网上找到。Internet正在成为人类的信息宝库,但是随着网上信息的爆炸性增长,人们想从这个信息宝库中获得自己所需要的信息已经变得日益困难,因此,如何快速有效地获得有用的信息已成为人们十分关 相似文献
7.
Windows Live Messenger更新到9.0后,就可以在主界面底部的“最近更新”里查看到MSN好友最近更新的信息了,包括头像、昵称的更换和最新发表的文章、留言、网页活动等,通过网页,可以查看到邮件、网络中最近更新等诸多内容。 相似文献
8.
网络已经深入到人们生活的每个部分。现在只要有一条电话线,再购回一只Modem便可安坐家中获得无穷无尽的信息。离线浏览工具可以帮助我们将网站的内容拷到硬盘上慢慢浏览,从而节省高昂的电话费。 离线浏览工具按功能主要分为2类,一种是Cache(缓存)浏览器,它可以查看已经浏览过的网页,但仍需要先 相似文献
9.
杯中水 《数字社区&智能家居》2010,(6):91-92
网上的信息是经常更新的,如果我们关注的信息有了新内容,而没有来得及浏览,或者想要浏览又得一次次登录搜索查看,岂不白白浪费了很多时间。其实,我们可以请个"保姆",帮着我们查看网页更新与变化,那就是"www.580k.com(我帮您看)"网。 相似文献
10.
你知道吗?Internet临时文件夹位于系统盘的WINDOWS\Temporary Internet Files目录下,你查看过的网页文件都会存放在这里。由于Internet Explorer可以从硬盘上直接打开已经查看过的网页,这样就比从Web服务器上读取网页内容要快得多。Internet临时文件夹在方便查看网上资源的同时,也蕴藏着许多值得探索的技巧,看了下面的内容你就会知道。 相似文献
11.
12.
随着网络信息资源的迅速增加,对于主题Web文本信息的搜索与分类日益成为信息处理领域的一个重要问题。本文建立了一个面向化工领域的Web文本搜索与分类系统,该系统在crawler子系统搜集Web文档的基础上,利用支持向量机对网页进行二次分类,找出化工专业中文网页;然后利用向量空间模型,对分类好的专业网页进行多子类分类。与综合搜索引擎相比,具有速度快、搜索信息准确度高和具备学习能力的特点。 相似文献
13.
IPSMS:一个网络舆情监控系统的设计与实现 总被引:3,自引:0,他引:3
描述一个网络舆情监控系统IPSMS(Internet public sentiment monitoring system)。该系统试图将网络新闻及论坛、BBS上的帖子依关键词搜索,并依事件聚类,让管理者通过阅读事件可以了解正在发生或已经发生的事件,并提供自动持续追踪事件发展的功能,以协助管理者快速完整且全面地了解事件全貌。系统由网页抓取器、网页解析器及跟踪检测系统三部分组成。由于网络舆情的特点是数据量巨大,为了提高效率,系统采用了网页清理技术,并且在话题跟踪过程中使用了k-d tree方法。最后,对系统的未来工作进行了展望。 相似文献
14.
基于Web Service架构的新闻服务研究 总被引:2,自引:0,他引:2
Internet特有的时效性,使得网络新闻出版和服务正在步入一个快车道。尽管基于HTTP/HTML架构的Web新闻服务方式在新闻的时空性方面超越了传统媒体,但它的交互性还不足以满足个性化新闻定制和阅读的需求。该文提出了一种基于WebService架构和NewsML置标语言的新闻服务系统框架,讨论了新闻服务提供端、新闻注册端和新闻发现/阅读客户端的工作原理和关键技术。基于WebService架构和新闻语言NewsML的新闻服务系统,支持个性化的新闻定制和服务。 相似文献
15.
16.
面对互联网上占据全国页面总数50%以上的动态页面,当前网络舆情管控工作中的信息采集环节对以动态页面为主要发布形态的互联网媒体无法实现信息获取。鉴于此,文中提出了基于Rhino实现JavaScript动态页面解析的整体方案。实验结果表明该方案充分丰富了互联网舆情管控工作的数据源对象,是实现动态页面内超链接网络地址递归获取和网页主体内容提取行之有效的解决方案。 相似文献
17.
基于Rhino的JavaScript动态页面解析研究与实现 总被引:1,自引:0,他引:1
面对互联网上占据全国页面总数50%以上的动态页面,当前网络舆情管控工作中的信息采集环节对以动态页面为主要发布形态的互联网媒体无法实现信息获取.鉴于此,文中提出了基于Rhino实现JavaScript动态页面解析的整体方案.实验结果表明该方案充分丰富了互联网舆情管控工作的数据源对象,是实现动态页面内超链接网络地址递归获取和网页主体内容提取行之有效的解决方案. 相似文献
18.
19.
基于互联网多语种分布情况研究与分析 总被引:1,自引:0,他引:1
提出了一种互联网上语种识别和多语种分布统计的方法.方法针对各语种文字被使用频率不同的特点给出高频字定义,以高频字作为关键字进行网页查询和网页语种识别,然后引用概率论中加法公式的推广公式统计互联网上各语种网页分布情况,并结合高频字被使用频率对各语种文字分布情况做出进一步统计.实验方法和数据结果对计算机工作者全面了解互联网特征提供参考. 相似文献
20.
The core of the Internet and World Wide Web revolution comes from their capacity to efficiently share the huge quantity of data, but the rapid and chaotic growth of the Net has extremely complicated the task of sharing or mining useful information. Each inference process, from Internet information, requires an adequate characterization of the Web pages. The textual part of a page is one of the most important aspects that should be considered to appropriately perform a page characterization. The textual characterization should be made through the extraction of an appropriate set of relevant concepts that properly represent the text included in the Web page. This paper presents a method to obtain such a set of relevant concepts from a Web page, essentially based on a relevance estimation of each word in the text of a Web page. The word-relevance is defined by a combination of criteria that take into account characteristics of the HTML language as well as more classical measures such as the frequency and the position of a word in a document. Besides, heuristic rules to obtain the most suitable fusion of criteria is achieved via a statistical study. Several experiments are conducted to test the performance of the proposed concept extraction method compared to other approaches including a commercial tool. The results obtained here exhibit a greater success in the concept extraction by the proposed technique against other tested methods. 相似文献