首页 | 本学科首页   官方微博 | 高级检索  
     

基于多粒度语义交互的无监督法律裁判文书检索
引用本文:周献杭,申妍燕. 基于多粒度语义交互的无监督法律裁判文书检索[J]. 集成技术, 2022, 11(2): 55-66. DOI: 10.12146/j.issn.2095-3135.20210413001
作者姓名:周献杭  申妍燕
作者单位:中国科学院深圳先进技术研究院 深圳 518055
基金项目:法律人工智能联合实验室项目(Y9Z028)
摘    要:随着法律文书数据越来越多,信息过载问题日益严重,快速且准确地在海量法律文书中进行检索显得非常必要。法律文本作为一种特殊的文本形式,具有篇幅较长、结构复杂、专业性强等特点,传统基于关键字的文本检索方法不能满足用户查询法律信息的需求,容易出现答非所问、检索不全等问题。此外,基于语义的文本检索方法,大多依赖于对含有大量标注数据的法律文本进行有监督学习,而法律文本数据的人工标注则严重依赖专家知识,导致其需要高昂的人力成本。该文提出一种基于无监督学习的法律文书检索模型,分别从法律概念、词语和词组3个方面进行多粒度无监督文本匹配,避免了没有训练数据导致的冷启动问题。在法律裁判文书数据集上进行检索实验的结果表明,与基准模型相比,该模型在MAP、MRR和NDCG@10指标上均有显著提升,取得了优秀的检索效果,具有有效性和先进性。

关 键 词:无监督学习  文本检索  法律文书检索  多粒度语义交互

Unsupervised Legal Case Retrieval Based on Multi-granularity Semantic-Aware Interaction
ZHOU Xianhang,SHEN Yanyan. Unsupervised Legal Case Retrieval Based on Multi-granularity Semantic-Aware Interaction[J]. , 2022, 11(2): 55-66. DOI: 10.12146/j.issn.2095-3135.20210413001
Authors:ZHOU Xianhang  SHEN Yanyan
Affiliation:Shenzhen Institute of Advanced Technology, Chinese Academy of Sciences, Shenzhen 518055, China
Abstract:With the ever-increasing size of legal cases in China, relevant legal case retrieval given a user query has attracted considerable attention. Conventional keyword-based retrieval systems look for matching cases that contain one or more words specified by the user. However, keyword searching is sharply focused on finding the exact terms specified in the query, making the retrieval systems miss many relevant documents. On the other hand, semantic-aware information retrieval methods usually rely heavily
Keywords:unsupervised learning   text retrieval   legal case retrieval   multi-granularity semantic interaction
本文献已被 万方数据 等数据库收录!
点击此处可从《集成技术》浏览原始摘要信息
点击此处可从《集成技术》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号