排序方式: 共有7条查询结果,搜索用时 15 毫秒
1
1.
大多数基于有指导机器学习方法的情感分类采用N元(n-gram)词袋(bag-of-words)模型,使用二值(binary)作为特征项的权重。本文系统地分析了信息检索中常用的特征权重计算方法,并从项频、倒文档率、归一化因子等角度加以借鉴和改进,研究其在商家评论上的应用。最主要的改进在于考虑了特征项在不同类别中分布情况的差异以及对倒文档率的平滑。在餐饮评论语料上的实验结果表明,经典的tf.idf若干变形,尤其是倒文档率类差异(delta idf)及平滑因子(smoothing factor)的引入,能有效提高分类准确率。在酒店、电脑、书籍等领域的在线评论公开数据集上也取得了较好的性能,证明了方法的普遍适用性。这一方法目前已经在中国电信号码百事通业务中用于餐饮商家及优惠券推荐,效果良好。 相似文献
2.
3.
根据回头沟金矿床普查阶段地质成果,总结了回头沟金矿床成矿地质条件、矿化富集规律及找矿标志,指出了矿区深部及外围找矿方向. 相似文献
4.
独享式计算机系统是一种小农经济模式 当前,我们行业各单位的计算机系统可以用这样一句话来形容:每个单位为追赶技术步伐,纷纷购买5年后才用到的设备;每个单位为了维持技术设备运行,不得不建立一个与本单位业务无关的、难于管理的技术部门。 各单位在做计算机系统规划时,有一个重要的参数:数据量。一个GB的容量意味着5亿个汉字,一个单位多少年才有5亿汉字的信息呢?为这5亿汉字,其他开销要10个GB的容量,但每个单位的服务器容量不会少于100GB。实际上当服务器和数据库管理系统报废时各单位都不会用到其性能的十分之一。为这台服务器… 相似文献
5.
6.
7.
1