排序方式: 共有9条查询结果,搜索用时 93 毫秒
1
1.
基于层叠条件随机场的旅游领域命名实体识别 总被引:3,自引:0,他引:3
针对旅游领域,提出了一种基于层叠条件随机场模型的旅游领域命名实体识别方法。该方法在低层条件随机场中以字为切分粒度,结合旅游景点常用字表、景点常用后缀表、地名常用字表等特征词典,实现简单旅游命名实体的识别;其识别结果传递到高层模型,以词为切分粒度,结合复杂特征,实现嵌套景点、特产风味、地点的识别。最后进行了两组相关实验,结果表明,在开放测试中,层叠条件随机场模型相比于单层模型,F值提高了8个百分点;相比于HMM模型,正确率提高了8个百分点,召回率提高了22个百分点,F值提高了15个百分点。 相似文献
2.
4.
5.
为解决传统推荐系统中存在的冷启动难题,基于距离反映偏好的假设提出了一种融合矩阵分解与距离度量学习的社会化推荐算法。该算法同时对样本和距离度量进行训练,在满足距离约束的前提下更新距离度量和用户与项目的坐标,并将用户与项目嵌入到统一的低维空间,利用用户与项目之间的距离生成推荐结果。基于豆瓣和Epi-nions数据集的对比实验结果验证了该方法可有效提高推荐系统的可解释性和精确度,明显优于基于矩阵分解的推荐方法。研究结果表明,所提方法缓解了传统推荐系统中存在的冷启动问题,为推荐系统的研究提供了另一种可供参考的研究思路。 相似文献
6.
近年来,LDA(Latent Dirichlet()al.location)主题模型通过挖掘文本的潜在语义主题进行文本表示,为短文本的相似度计算提供了新思路。针对短文本特征稀疏,应用LDA主题模型易导致文本相似度计算结果缺乏准确性的问题,提出了基于LDA的多特征融合的短文本相似度算法。该方法融合了主题相似度因子ST(Similarity Topic)和词语共现度因子CW(Co-occurrence Words),建立了联合相似度模型以规约不同ST区间下CW对ST产生的约束或补充条件,并最终权衡了准确性更高的相似度结果。对改进后的算法进行文本聚类实验,结果表明改进后的算法在F度量值上取得了一定程度的提升。 相似文献
7.
8.
谓词的自动识别是浅层句法分析的重要内容。本文提出了基于支持向量机分类算法的谓词自动识别方法,重点描述了在特征构建过程中基于信息增益的特征筛选方法与基于同义词词林的特征词度量方法。信息增益方法选取对分类影响较大的特征,降低了特征维度;同义词词林的度量方法将特征词映射为深层次的语义概念,增强了特征的表达能力,强调了属性特征与模型的相关度。在小规模语料库上的实验表明,谓词识别的最好F-Score达到了84.0%,相较于对数据无任何处理的情况F-Score提高了4.6%。结果表明,这种新的特征筛选与特征度量方法在谓词识别中十分有效,可以极大提高分类器的性能。 相似文献
1