首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 156 毫秒
1.
为解决英语命名实体链接问题,提出了一种基于上下文信息和排序学习的实体链接方法. 首先使用上下文信息对实体指称进行扩充,并在维基百科中检索候选实体列表;然后通过抽取实体指称与候选实体之间的各类特征,利用ListNet排序算法对候选实体列表进行排序,选出Top1的候选实体作为链接结果;最后对未找到候选的实体指称即NIL实体,通过实体聚类算法进行关联链接. 实验结果表明,该方法在KBP 2013实体链接数据集上的F值为0.660,比KBP 2013实体链接评测中所有参赛队伍的平均F值高0.092,比系统BUPTTeam2013的F值高0.162.  相似文献   

2.
针对基于特征向量的实体关系抽取方法中分类算法分类精度的不足,提出了基于集成学习算法的实体关系抽取方法.该方法将实体特征组合并转化为特征向量,使用集成学习中的ADABoost.MH算法来构造实体关系抽取的分类器,弱分类器采用决策树进行构造,通过提高分类效果好的分类器的权重和分类错误样本权重的方式来提高分类的精度,从而实现实体关系类别的识别.该方法在对《人民日报》语料库的测试中,得到了比较好的效果.  相似文献   

3.
互联网的快速发展以及Web数据的日益庞大,使用户从Web中获取有用信息变得日益困难,如何快速有效地从Web中准确抽取信息已经成为亟待解决的问题,Web信息抽取技术应运而生.提出了一种新的基于XML的WEB信息自动抽取方法,采用数据转换算法将HTML文档标准化,通过学习样本实例的XPATH表达式,形成抽取规则库,并利用规则库对其它同类页面实现信息的自动抽取.实验结果表明,该方法具有较高的查全率和查准率,且抽取结果具有自描述性,方便于建立各个领域的数据抽取系统.  相似文献   

4.
为了对半结构化文本实现自动抽取信息.介绍了一种基于Boosting算法的信息抽取方法,它能够自动对一个训练例生成规则,将该规则应用于正例集并改变正例集权重分布,找到权重最大的正例生成下一条规则.给出了一种能描述不符合英文词法的词的模式匹配约束.试验表明:在特征简单的抽取规则学习中,该方法精确度与召回率可达100%.在特征比较复杂的抽取规则学习中,该方法F1评估值也能达到80%以上.  相似文献   

5.
针对现有网络论坛信息抽取的不足,提出了一种基于重复模式发现算法的论坛信息抽取方法.该方法首先利用SgmlReader解析器将HTML文档转换为格式规范的XHTML文档,然后通过计算XHTML文档结构中DOM子树相似度,自动发现论坛页面结构的重复模式.该方法通过自动定位重复模式进行论坛信息抽取,较好地解决了在论坛信息抽取过程中需要人工查找、定位重复模式或者通过人工分析论坛页面代码定制抽取规则的问题.试验结果表明,该方法具有较好的准确性、通用性和实用性.  相似文献   

6.
信息抽取技术在LBS中的应用   总被引:1,自引:0,他引:1  
由于LBS系统的终端设备处理能力较低,显示屏幕较小,再加上无线数据网络带宽不足,因此无法浏览整个Web网页。采用信息抽取技术可以将用户感兴趣的信息提取出来,再发送给用户终端,有效地解决上述问题,信息抽取技术将是LBS系统中的一项重要应用。提出了一种基于信息抽取的从删.到WML的页面转换方法,首先标记少量的Web网页形成样本实例集,采用归纳算法生成信息抽取规则;其次应用抽取规则和模式匹配来处理结构和风格类似的Web页面;最后将抽取结果转换为WML页面。开发了原型系统,通过对实际数据源的抽取,验证了此方法的有效性。  相似文献   

7.
环境激励下的结构模态参数可以通过不同点输出信号的互功率谱识别出来.将包含结构模态参数的互功率谱理论公式与不同点输出信号计算得到的互功率谱之差作为目标函数,通过搜索模态参数的取值而使目标函数最小,从而将优化问题转化为模态参数识别问题.量子粒子群算法是一种基于群体智能理论的优化算法.论文将量子粒子群算法应用到上述优化问题中识别环境激励下的结构模态参数.最后采用数值模拟的简支梁对该方法进行有效性验证.结果表明,量子粒子群可以有效地识别环境激励下的结构模态参数.  相似文献   

8.
基于遗传算法的数据挖掘方法及应用   总被引:1,自引:0,他引:1  
车间作业调度问题的研究不仅具有重大的现实意义,而且具有深远的理论意义.该文采用数据挖掘算法从大量的车间作业调度中抽取一些有价值的信息或知识,然后应用这些知识来辅助车间作业调度.应用数据挖掘算法从车间作业调度最优方案中抽取出最优调度方案的一些模式知识来发展一些规则集辅助车间作业调度.这些规则可以看作是隐含在车间作业调度最优方案中的,事先未知的潜在有用的信息.根据这些规则可以产生比简单指派更好的车间作业调度方案.最后的数据实例表明该方法无论在调度质量还是在计算速度上都具有较好的性能.  相似文献   

9.
在命名实体识别的研究基础之上,论文把抽取人名实体与机构实体间的任职关系看成分类问题.即根据现代汉语句子中任职动词的类别属性将任职关系信息抽取模式分类.应用决策树的方法确定句子的抽取模式,实现人在机构中的任职关系信息抽取.并对建立的基于该决策树的任职关系抽取系统进行开放测试,平均召回率和精确率分别为91.47%和89.15%,实验结果表明,基于决策树的现代汉语中任职关系抽取是一种值得继续探讨的方法.  相似文献   

10.
为对网络在线评论进行高效率的文本分析与提取,本文提出一种基于HtmlParser的文本抽取解析算法.首先通过语言与格式规则进行标签筛选,实现基于HtmlParser的网页文本数据抽取算法,然后采用Regex模式对抽取文本进行清洗去噪.最后通过实验,结合正确率与召回率等指标验证了算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号