排序方式: 共有37条查询结果,搜索用时 7 毫秒
1.
2.
为了有效解决专利文献中术语抽取问题,提出采用字符串之间的结合强度融合词性过滤法抽取术语的方法.根据专利文献中术语出现的特点,提出了字符串之间的边界结合度方法和字符串之间的串边结合度方法,度量了字符串间的结合强度.在此基础之上,根据术语内部结构中词性的组成特点,提出了术语双字词性过滤的方法,并与结合强度的计算方法进行融合.实验结果表明,该方法对中文专利术语抽取有很好的效果,平均正确率为80.24%,平均召回率为80.61%. 相似文献
3.
采用支持向量机(SVM)方法实现搜索引擎日志中"N+V+N"、"V+N+N"型短语功能类别识别。通过选取不同特征,构建多特征模板,实现对"N+V+N"、"V+N+N"型短语中名词短语、动词短语、主谓短语三种功能短语的自动识别,并且针对不同词性标注集对实验结果是否有影响进行了实验。实验结果显示,SVM在搜索引擎日志短语识别中有很高的识别率。 相似文献
4.
一种结合超链接分析的搜索引擎排序方法 总被引:5,自引:0,他引:5
为了提高搜索引擎的检索性能,文章设计了一种搜索引擎的综合排序方法。它采用改进的布尔检索模式、中文分词、超链接分析以及索引链接文本等技术,主要具有以下特点:对经典布尔型检索模式所作的改进使得文档相关度不再是严格的0或1;超链接分析通过互联网的链接结构计算出每个网络文档的质量;通过中文分词和索引链接文本可以更加准确地获得一个网络文档的信息内涵。将3者结合可以充分利用各自优势而弥补不足。 相似文献
5.
对运动模糊图像进行恢复处理需要两个关键参数的支持:模糊角度和模糊长度.为此,提出了一种时间复杂度比传统Radon变换更低的新方法对频域中的图像进行角度检测.根据傅里叶频谱的特性,新方法以扇形方式展开,扫描出一条穿过圆心且亮度最大的直线,该直线的倾斜角度为频域图像中平行条纹的倾斜角度;利用Radon变换的性质将先前求得的模糊角度进行投影求和得到模糊长度.实验结果表明,新方法不仅降低了时间复杂度,还提高了模糊角度和模糊长度检测的准确性. 相似文献
6.
一种改进的基于《知网》的词语语义相似度计算 总被引:18,自引:1,他引:18
中科院刘群的基于《知网》的词语相似度计算是当前比较有代表性的计算词语相似度的方法之一。在测试中我们发现对一些存在对义或反义的词语与同义、近义词语一样具有较高的相似度,一些明显相似的词反而相似度较低,如“美丽”与“贼眉鼠眼”的相似度为0.814 815,与“优雅”的相似度为0.788 360 ,“深红”与“粉红”的相似度仅为0.074 074,这将不利于进行词语的极性识别。基于文本情感色彩分析的需要,把词语相似度的取值范围规定为[-1,+1],在刘群论文的基础上,进一步考虑了义原的深度信息,并利用《知网》义原间的反义、对义关系和义原的定义信息来计算词语的相似度。在词语极性识别实验中,得到了较好的实验结果P值为99.07%,R值为99.11%。 相似文献
7.
9.
进入我的发言主题之前,我想说我不太同意移动收费。我觉得整个内容产业包括三个部分,一个是内容的提供者;第二个就是服务者;第三个是消费者。对于内容的提供者来说,最关心的就是大家都提到的版权问题。我知道有一个公司跟国家信息中心合作,在香港上市的时候突然撤回来了,什么原因呢?没有版权。所以内容增值服务公司绝对不能说发财了,你要说发财了,肯定有一百人跟你打官司,所以只能是偷偷摸摸挣钱。第二做资源整合的,IT 的供应商等,包括通讯之间的 相似文献
10.