期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

燕彩蓉周灵杰张青龙李晓林《软件学报》2019,30(3):822-844

因子分解机（factorization machine,简称FM）模型因为能够有效解决高维数据特征组合的稀疏问题且具有较高的预测精度和计算效率,在广告点击率预测和推荐系统领域被广泛研究和应用.对FM及其相关模型的研究进展进行综述,有利于促进该模型的进一步改进和应用.通过比较FM模型与多项式回归模型和因子分解模型之间的关联关系,阐述FM模型的灵活性和普适性.从特征的高阶交互、特征的场交互、特征的分层交互以及基于特征工程的特征提取、合并、智能选择和提升等角度,总结模型在宽度扩展方面的方法、策略和关键技术.比较和分析了FM模型与其他模型的集成方式和特点,尤其是与深度学习模型的集成,为传统模型的深度扩展提供了思路.对FM模型的优化学习方法和基于不同并行与分布式计算框架的实现进行概括、比较和分析.最后,对FM模型中有待深入研究的难点、热点及发展趋势进行展望. 相似文献

2.

基于划分的增量式字符串相似性连接方法

燕彩蓉朱斌王健黄永锋《计算机应用》2016,36(1):27-32

字符串相似性连接是数据质量管理的基本操作,也是数据价值发现的关键步骤。针对目前已有的方法不能满足面向大数据的增量式处理需求的问题,提出一种面向流式数据的增量式字符串相似性连接方法——Inc-Join,并对方法的索引技术进行了优化。该方法以Pass-Join字符串连接算法为基础,首先,采用字符串划分技术将字符串划分成多个互不相交的子串;然后,建立字符串的反向索引列表并将其作为状态;最后,新增数据只需根据状态进行相似性计算,每次连接操作结束后都对状态进行更新。实验结果表明,Inc-Join方法在不影响连接准确率的同时,有效将长、短字符串重复匹配次数减少为√n(n是批处理方式的匹配次数)。实验对3种数据集进行处理,发现使用批处理方式进行相似性连接的响应时间是Inc-Join的1至4.7倍,并呈现急剧递增的趋势;而且优化后Inc-Join方法的响应时间最小只占优化前的3/4,并随处理数据的增多所占比例越来越小。同时优化后的Inc-Join不需要保存状态,再一次减小了算法执行的时间和空间开销。相似文献

3.

一种集群服务器并行网页预取模型

燕彩蓉沈钧毅彭勤科《计算机工程》2005,31(24):47-49

提出了集群服务器并行网页预取模型,模型采用了马尔科夫链分析访问路径并在Web集群服务器的各节点上并行预取页面,把集群技术的高性能和高可靠性与预取技术的快速响应能力结合起来。实验表明,将此模型应用于集群服务器的分发器上,服务器系统具有更高的请求命中率和更大的吞吐量。相似文献

4.

基于隐私保护的序列模式挖掘 总被引：1，自引：1，他引：0

燕彩蓉朱明史有群《小型微型计算机系统》2008,29(7)

基于隐私保护的数据挖掘是信息安全和知识发现相结合的产物.提出一种基于隐私保护的序列模式挖掘算法PP-SPM.算法以修改原始数据库中的敏感数据来降低受限序列模式的支持度为原则,首先构建SPAM序列树,根据一定的启发式规则,从中获得敏感序列,再进一步在原始数据库中找到敏感数据,对其做布尔操作,实现数据库的清洗.实验表明,该算法在完全保护隐私的情况下,对于D6C10T2.5S4I4数据集,当修改3.5%的原始数据后,其序列模式丢失率为2%. 相似文献

5.

研究生“操作系统分析”课程探索

燕彩蓉冯向阳刘小强《计算机教育》2010,(22):80-82

针对研究生操作系统相关课程建设面临的理论和实践知识之间的平衡问题,以研究生人才培养为目标,提出理论与实践相结合的教学方法,经典与现代相结合的教学内容,精讲与泛讲相结合的教学手段。"操作系统分析"课程以早期Linux操作系统V0.12内核为主线,深入研究并实践操作系统内核,帮助学生打好基础;同时,从几个重要发展方向包括嵌入式系统、虚拟机技术、云计算等进行扩展,指明研究方向及热点。相似文献

6.

集群Web服务器的几种数据复制解决方案 总被引：2，自引：0，他引：2

燕彩蓉谢怡彭勤科沈钧毅《计算机应用研究》2003,20(5):119-122

提出了以下几种数据复制方案：基于主节点管理的对称复制，基于token的对称复制，以及快照复制和对称复制结合产生的混合复制；并且分析了基于主节点管理的对称复制的设计与实现。相似文献

7.

一种基于预取的集群服务器调度算法

燕彩蓉沈钧毅彭勤科《控制与决策》2006,21(3):319-322

针对集群服务器LARD调度算法只能利用已有缓存的问题，提出一种基于预取的算法Prefetch-LARD,该算法从Web访问日志中挖掘页面之间的转移概率，建立马尔科夫链模型，在调度请求时利用概率关系提前将下一次可能访问的文档从节点磁盘取到本地cache中，提高了请求的缓存命中率；算法还采用了加权的节点超载判断方法，以提高集群节点的负载均衡度，实验表明，在同样的测试环境下，Prefetch-LARD算法比LARD算法的缓存命中率提高26．9％，系统的吞吐量相应提高18．8％．相似文献

8.

基于用户行为的集群服务器对象分组优化研究

YAN Cairong 燕彩蓉沈钧毅彭勤科龚先定《计算机工程》2005,31(7):118-119,157

提出了一种基于用户行为的Locality型集群服务器结构,可以根据用户行为进行自适应的对象分组优化和集群节点的分组重构。采用改进的Apriori关联挖掘算法和基于最短距离的对象迁移算法,使得集群服务器整体负载降低,子集群负载均衡,用户响应速度提高。相似文献

9.

一种新的集群Web服务器体系结构及其数据复制算法

张小娣杨麦顺燕彩蓉楚丽平《微电子学与计算机》2003,20(12):12-15

数据副本管理是集群Web服务器(CWS)的一个重要研究内容，它与CWS的体系结构和具体的应用密不可分。文章提出了一种架构于IJnux虚拟服务器(INS)基础之上、应用广泛、可扩展性强的集群Web服务器结构，给出了相应特定的数据复制算法，包括数据定位和数据同步。通过实验对此复制算法进行了测试与分析，并和其它复制方案进行了比较，证明了本算法具有更高的可用性和更好的性能。相似文献

10.

面向Hadoop分布式文件系统的小文件存取优化方法

李铁燕彩蓉黄永锋宋亚龙《计算机应用》2014,34(11):3091-3095

为提高Hadoop分布式文件系统(HDFS)的小文件处理效率,提出了一种面向HDFS的智能小文件存取优化方法--SmartFS。SmartFS通过分析小文件访问日志,获取用户访问行为,建立文件关联概率模型,并根据基于文件关联关系的合并算法将小文件组装成大文件之后存至HDFS;当从HDFS获取文件时,根据基于文件关联关系的预取算法来提高文件访问效率,并提出基于预取的缓存替换算法来管理缓存空间,从而提高文件的命中率。实验结果表明,SmartFS有效减少了HDFS中NameNode的元数据空间,减少了用户与HDFS的交互次数,提高了小文件的存储效率和访问速度。相似文献