减轻大语言模型性别偏见的正则化方法OA
大语言模型凭借其强大的语言理解能力在简历筛选任务上展现出了优秀的性能,然而其存在的性别偏见可能会影响筛选结果的公平性。为了解决这一问题并保证模型性能,本文提出了一种基于正则化的模型训练方法,引入损失惩罚来引导模型降低偏见,并结合模型微调对简历筛选任务进行优化。在真实的简历和岗位描述数据集上进行的实验表明,采用该方法训练的模型能够有效减少性别偏见,并在简历筛选中保持良好的性能。
吴逢宇;叶阿勇
福建师范大学计算机与网络空间安全学院,福州350117福建师范大学计算机与网络空间安全学院,福州350117
计算机与自动化
大语言模型性别偏见正则化策略简历筛选信息检索
《福建电脑》 2025 (2)
P.18-23,6
移动网络中面向位置信息生命周期的隐私保护关键技术(No.61972096)资助。
评论