针对大语言模型的偏见性研究综述期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

针对大语言模型的偏见性研究综述

作者姓名：	徐磊胡亚豪潘志松

作者单位：	陆军工程大学指挥与控制工程学院,南京 210007

基金项目：	国家自然科学基金资助项目(62076251)

摘要：	偏见现象普遍存在于人类社会,并通常以自然语言为载体呈现.传统的偏见研究主要针对静态词嵌入模型展开,但随着自然语言处理技术的不断演进,研究对象逐渐转向上下文处理能力更强的预训练模型.而作为预训练模型的进一步发展,尽管大型语言模型凭借惊人的性能和广阔的发展前景在多个应用场景中得到了广泛部署,但其仍可能会从未经处理的训练数据中捕捉到社会偏见,并将偏见传播到下游任务中.含有偏见的大型语言模型系统会产生不良的社会影响和潜在危害,因此针对大型语言模型的偏见研究亟待深入探讨.探讨了自然语言处理中偏见的由来,并对从词嵌入模型到现在大型语言模型的偏见评估和偏见缓解方法进行了分析与总结,旨在为未来相关研究提供有益参考.
关键词：	自然语言处理词嵌入预训练模型大型语言模型偏见
收稿时间：	2024-02-12
修稿时间：	2024-09-17
本文献已被万方数据等数据库收录！
	点击此处可从《计算机应用研究》浏览原始摘要信息
	点击此处可从《计算机应用研究》下载全文