首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对传统的金融预测系统仅仅依靠股票价格和市场指数等定量数据而不能很好地满足实时性和高准确性的问题,提出一种基于加权关联规则和文本挖掘的新闻传播Agent实现方法。首先,利用中文知识与信息处理系统将每个新闻标题分离得到每个中文单词;然后,利用加权关联规则算法检测频繁出现在同一条新闻标题中的多个术语,并提取名词、动词和复合语;最后,根据新闻供给市场第一个交易日股票交易金融价格指数为提取的关键字分配权重,并根据新闻标题的权重值判断其对股票价格的影响程度。新闻标题特征数据库上的实验验证了该方法在金融新闻标题的实时信息发布应用中的可行性,实验结果表明,相比其他几种预测方法,该方法取得了更高的预测准确率和召回率。  相似文献   

2.
网络环境下的新闻自动发布与管理系统   总被引:3,自引:0,他引:3  
本文介绍了一种新闻自动发布与管理系统,并详细介绍了新闻标题和新闻内容页面的自动生成方法。  相似文献   

3.
本文针对实际党建领域中的新闻标题进行自动生成,提出了一种融合指针网络的自动文本摘要模型-Tri-PCN.相比于传统基于编码器-解码器框架的自动文本摘要模型,党建新闻标题生成模型还需要满足1)从更长的文本序列提取特征; 2)保留关键的党建信息.针对党建新闻比普通文本摘要任务面临更长文本序列问题,论文使用Transformer模型在解码阶段提取多层次全局文本特征.针对党建新闻标题生成过程中需要保留关键的党建信息,论文引入指针生成网络模型的复制机制在新闻标题生成时可以直接从新闻文本中复制关键词信息.实验采用ROUGE值作为评测指标,结果表明本文提出的Tri-PCN模型在党建新闻领域自动文本摘要任务上效果明显优于基准模型,比其他模型具有更好的效果.  相似文献   

4.
文章介绍了体育新闻搜索引擎系统 Geeking 的框架结构和各项功能,其结构分为网页爬取、胜者表构建、检索处理、用户界面 4 个部分,其主要功能包含查询词校正、自动补全、检索结果排序、相似新闻聚类以及显示页面中关键词高亮并提供网页快照。输入查询请求时,系统根据搜索日志和新闻热词自动补全查询词,搜索不到相关结果时校正查询,给出推荐的查询词。检索新闻文档时,使用胜者表快速查找查询词项的相关文档,综合 tf-idf 权重和新闻标题、发布时间等因素计算文档的相关性并按得分排序。在相似新闻聚类中,结合最长公共子序列和编辑距离衡量新闻标题之间的相似度,以新闻标题相似度代表新闻文档的相似度。测试结果表明,基于胜者表的 Geeking 搜索引擎系统各项功能协调效果好,检索响应速度快。  相似文献   

5.
根据新闻文本的特点,分别对新闻标题与正文进行分析,该文提出了一种针对新闻文本的特征加权的主题句抽取方法。首先对新闻主题句在文本中的分布情况进行分析,选取了位置特征;然后根据新闻标题对于新闻主旨的提示作用,选取了标题句子重合度与关联度的特征,且在关联度特征中将基于加权二部图的最大匹配算法融入其中;最后依据句子的得分排名,进行主题句抽取。实验显示,利用该方法进行主题句抽取的P@1为75.9%,P@3 达到92.4%。  相似文献   

6.
随着网络新闻类型门户网站的不断增多,如何从纷繁复杂的Web信息中得到我们需要的新闻标题成为了一个问题。这里通过正则表达式对门户网站新闻主页进行主题抽取,得到新闻主题列表,为用户访问网络提供方便。  相似文献   

7.
雷芳 《计算机科学》2014,(4):479-482
当今社会对新闻翻译人才的需求,使得新闻翻译教学日益重要。以林克难提出的“看易写”理论为指导,从一个崭新的视角, 研究新闻翻译教学新模式,将“看易写”理论融入新闻翻译教学,为其提供理论支撑和方法论支持,该理论符合新闻英语翻译的实 际情况,对新闻英语翻译教学有切实的指导作用。当今翻译界对新闻翻译实践研究较多,对新闻翻译教学研究还不够深入与系统。 以“看易写”翻译理论为指导,从新的视角出发,研究新闻翻译教学模式的构建问题,可以提高新闻翻译教学质量。  相似文献   

8.
为从大量的复杂非规范网页结构中自动抽取出新闻标题,该文提出一种基于密度和文本特征的新闻标题抽取算法(title extraction with density and text-features, TEDT)。主要通过融合网页文本密度分布和语言特征的语料判定模型,将网页划分为语料区和标题候选区,选取语料后通过TextRank算法计算对应的key-value权重集合,最后采用改进的相似度计算方法从标题候选区抽取新闻标题。该算法能有效划分语料和标题区域,降低网页噪声干扰,准确抽取出新闻标题。实验结果表明,TEDT的准确率和召回率均优于传统的基于规则和相似度的新闻标题抽取算法,证明了TEDT不仅对主流新闻网站有效,而且对复杂非规范网页也广泛适用。  相似文献   

9.
文本过滤是指从大量的文本中寻找满足用户需求的文本的过程。以互联网上下载的突发事件新闻文本为研究背景,提出了基于新闻标题的文本过滤模型,根据示例文本构建标题过滤模板,采用基于关键字的过滤方法对突发事件新闻文本进行过滤。其特点是实现简单,过滤速度快,有一定的实际作用。  相似文献   

10.
不同国家应用不同母语交际,造成了国际之间交流的语言壁垒,提出基于语义关联度的英语段落机器翻译方法研究。设计编码器处理英语段落信息,选取RelArtNet算法计算英语单词与句子语义关联度,构建英语段落翻译信息调序模型,通过联合训练方法训练神经机器翻译模型,将待翻译的英语段落输入至训练好的翻译模型中,实现了英语段落的机器翻译。实验数据显示:提出方法英语段落机器翻译时间低于最高限值,BLEU指数大于标准数值,证实提出方法应用性能较好。  相似文献   

11.
针对目前现有的新闻推荐系统未能充分考虑新闻的语义信息,对新闻文本建模因子的单一性问题,提出注意力与多视角融合的新闻推荐算法(Attention-BodyTitleEvent, Attention-BTE).利用BERT模型以及注意力机制分别对新闻标题、正文、事件向量化,将三者融合即新闻向量化表示,再对候选新闻和用户浏览新闻数据进行处理,分别得到对应的候选新闻向量化和用户向量化,并将其进行点乘得到用户点击候选新闻的概率,即新闻推荐结果.实验数据表明,与其他的新闻推荐算法相比,该模型在F1指标上提高了约6%.  相似文献   

12.
带有时间标志的演化式摘要是近年来提出的自然语言处理任务,其本质是多文档自动文摘,它的研究对象是互联网上连续报道的热点新闻文档。针对互联网新闻事件报道的动态演化、动态关联和信息重复等特点,该文提出了一种基于局部—全局主题关系的演化式摘要方法,该方法将新闻事件划分为多个不同的子主题,在考虑时间演化的基础上同时考虑子主题之间的主题演化,最后将新闻标题作为摘要输出。实验结果表明,该方法是有效的,并且在以新闻标题作为输入输出时,和当前主流的多文档摘要和演化摘要方法相比,在Rouge评价指标上有显著提高。  相似文献   

13.
蔡群英 《福建电脑》2008,24(7):145-146
RSS是一种用于共享新闻标题和其他Web内容的XML格式标准,在互联网上应用非常广泛。本文结合ASP.NET和XML技术,开发一个在线的RSS新闻聚合阅读器,并对阅读器的结构设计和实现的关键技术进行阐述。  相似文献   

14.
新闻文本分类是自然语言处理领域中一项重要任务,本文使用新闻标题进行文本分类。随着BERT预训练模型的崛起,BERT模型在多项NLP(NaturalLanguageProcessing)任务中都取得了较好的效果,并应用在新闻分类任务中。为了提高新闻分类这一主要任务的效果,本文引入辅助任务判断两个新闻是否是同类新闻,对BERT预训练模型在辅助任务和主要任务上进行微调。在THUCNews数据集上进行实验,实验结果表明,引入辅助任务的BERT新闻分类模型在效果上优于原BERT模型。  相似文献   

15.
提出一种识别网络新闻中主要内容与标题不相符或相关性不大的低价值新闻的算法。该算法先从新闻标题中提取出最能反映新闻主题的两个主题词,再分析主题词在正文中的分布情况,并计算出相关概率,以相关概率来判断是否为低价值新闻。实验证明该算法的识别率可达到85.71%,高于基于主题句相似度计算方法的72%,且该算法不受新闻正文长度的影响,是一种实用有效的识别方法。  相似文献   

16.
从海量Web新闻网页中抽取高纯度新闻,并以结构化的形式存储,是舆情监测、话题更新等研究的基础。本文提出一种基于噪音过滤包装器的方法抽取Web新闻,归纳包装器时,若2页面字符串对比失配,计算其字符串标签路径比,根据阈值α,标记不同符号区分新闻内容和噪音。同时提出了朴素贝叶斯Web新闻标题分类器和时间分类器抽取新闻题目和时间。实验结果表明,本文方法与其他抽取技术相比准确率和鲁棒性有显著的提高,具有重要的实际应用价值。  相似文献   

17.
英语新闻听力是大学英语听力教学的一项重要内容,英语新闻听力自主学习模式是一种以学习者为中心,充分发挥学习者主体 性的英语教学模式,英语新闻听力课程具有时效性、实用性和综合性等特点,提出英语新闻听力课程师生自主学习模式,在这门课程 中教师实现自我发展、学生自主学习,充分发挥英语新闻听力优点和自主学习特点,有效提升大学英语新闻听力的教学效果。  相似文献   

18.
高旸  周莉  张勇  邢春晓  孙一钢  朱先忠 《软件学报》2010,21(Z1):349-362
互联网新闻资讯对证券市场和投资者有举足轻重的影响,新闻进行情感分类后再展示给用户,可以帮助投资者迅速做出投资决定.从文本分类的基本方法出发,实现了基于N-gram 统计模型的新词发现方法,并将所得结果用于构建中文分词词典和情感词典.同时引入评价理论,并用朴素贝叶斯、K 近邻和支持向量机3 种方法进行股票新闻标题的情感分类实验.所用实验数据来自2009 年“新浪财经”共计23 万余条的新闻标题,结果表明二分类的准确率最高可达82.9%.此外,还实现了一个原型系统用于展示股票新闻的分类结果.  相似文献   

19.
赵元 《自动化技术与应用》2022,(10):114-116+162
常规方法匹配输入名词和翻译名词关联语义时,译文组合关联程度达不到最优,造成名词翻译召回率和准确率较低。提出基于机器辅助的高校英语专有名词自动翻译方法。预处理英语专有名词文件,建立英语平行语料库,为机器辅助提供语料,分割用户输入名词和语料库检索名词语义,根据关联系数和编辑距离,匹配语义关联的输入名词和检索名词,建立语义匹配评价体系,选取最优匹配译文组合作为翻译译文。采用英语专有名词实体集设置对比实验,结果表明,该方法提高了翻译召回率和准确率,以及两项指标调和均值,专有名词翻译结果更加准确。  相似文献   

20.
网页噪声过滤是网页预处理中关键的一步,其处理结果对后续处理的效率和准确性都有很大的影响。本文基于文本块字符数的统计规律,在总结了新闻网页特点的基础上设计了一种高效的新闻网页噪声过滤算法。该算法不仅完成了新闻正文的提取,也实现了新闻标题和报道时间的提取。试验证明,该算法有很高的处理速度,同时其提取的准确率也有了进一步的提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号