排序方式: 共有33条查询结果,搜索用时 13 毫秒
1.
在微博情感倾向性分析中,一种典型分析方法是先对微博进行主客观分类,再对判定为主观的微博进行褒贬分类,但其问题在于主客观分类错误将直接传导到褒贬分类。针对这一问题,本文提出了一个主客观分类和褒贬分类融合的评估情感倾向性强度的模型。首先使用改进的逻辑回归模型构建主客观分类模型,并结合情感词典构建褒贬分类模型;然后,将二者融合,构建情感倾向性强度模型来选出具有较强情感的微博;最后应用褒贬分类模型判定情感倾向性。该方法在第六届中文倾向性分析评测(COAE2014)的微博观点句识别任务中获得了主要指标Micro_F1值和Macro_F1值的第二名。 相似文献
2.
3.
查询会话中的用户行为分析 总被引:1,自引:1,他引:0
为了更好的理解搜索用户的检索行为,在查询会话基础上分析了用户修改查询的行为规律及用户、查询和点击三者之间的关系.从查询会话的角度,综合考虑了会话中修改的次序、用户、查询和点击等多方面因素,发现了用户修改查询的规律,证明了查询推荐的必要性.统计结果显示:用户修改查询的方式和修改次数有关,而对应的点击数量相对稳定;最终查询... 相似文献
4.
Parsing is a fundamental problem in natural language processing. This paper presents a critical overview of the state-of-the-art in statistical parsing technology, including the primary statistical theory, statistical models and the parsing evaluation. At last we give our point on the statistical parsing direction. 相似文献
5.
6.
7.
机器翻译系统跨领域移植方法的研究 总被引:1,自引:0,他引:1
机器翻译系统跨领域移植是降低系统开发代价的关键性因素。论文以翻译模板对训练语料库机器译文评测分数的贡献为依据,对其进行评价。从模板库中过滤出适应目标领域的翻译知识,以实现系统向新领域的快速移植。利用论文所提出的方法将一个通用领域的机器翻译系统向旅游领域进行移植,并使用来自旅游领域的2469句汉语句子作为测试语料进行开放测试。实验结果表明在开放测试中,机器译文的5元Nist评分提高了2.2807,上升了71.1%。 相似文献
8.
评价对象抽取的研究难点在于如何精确地表示大范围的上下文信息.本文针对微博观点句,采用了基于双向循环神经网络(BRNN)的方法来抽取评价对象并对评价对象的情感倾向进行判定.BRNN的隐藏层对上下文进行了抽象,如果经过良好地训练,就能在循环处理句子时有效地表示远距离的有序上下文信息,而无需对上下文窗口长度进行限定.本文选择了词、词性、依存句法树以及产品词典等特征构建了BRNN模型.通过实验发现,上述4种特征组合获得了最优实验结果,通过与CRF模型的对比,本文提出的方法在相互覆盖模式下F值比CRF模型高出0.61%,验证了本文方法的有效性.本文方法在COAE2015任务3的资源受限评测任务中,获得了最好结果. 相似文献
9.
基于等价伪译词模型的无指导译文消歧研究 总被引:2,自引:1,他引:1
该文提出了一种基于等价伪译词进行无指导译文消歧的方法.该方法利用源语言岐义词不同语义下目标语译文的单义同义词集合,定义并构造等价伪译词.利用等价伪译词从目标语语料中自动获取大量已标注语义的目标语实例.由这些实例得到的目标语语义知识,可直接形成该等价伪译词的语义分类器.利用Hownet可将含目标歧义词的英语实例映射成汉语诃集合,然后利用这个语义分类器进行译文消歧.在国际标准语义评测集上进行的测试表明,该方法优于其余两种自动获取已标注语料的系统,且与Senseva1-2 ELS上可比较的最好无指导系统的性能相当. 相似文献
10.
短语统计机器翻译的句法调序模型 总被引:2,自引:0,他引:2
为了处理统计机器翻译中的长距离调序,在基于短语的统计翻译模型的基础上提出了句法调序模型.该模型按照短语切分来分割句法树结构,从而能够避免短语和句法结构的不一致性.在该模型中依据短语对齐和短语内词对齐确定句法树部分结构的调序顺序,依据各个节点上的调序概率计算子结构的调序概率,作为对数线性模型的特征函数.该模型的实验结果比经典的短语统计翻译模型的BLEU评分有明显提高.结果表明句法调序模型对于基于短语的统计机器翻译是有效的,能够较好地将句法知识和短语翻译过程结合起来. 相似文献