上传者: 42687692
|
上传时间: 2025-04-14 04:24:55
|
文件大小: 1.35MB
|
文件类型: PDF
内容概要:本文介绍了DATA ADVISOR,一种基于大型语言模型(LLM)的安全数据生成方法。通过动态监控和指导数据生成过程,提高生成数据的质量和覆盖范围,特别是在安全性方面。实验表明,与传统方法相比,DATA ADVISOR显著提升了三个代表性LLM的安全性能,同时保持了模型的实用性。
适合人群:研究大型语言模型安全性和数据生成的研究人员和技术专家。
使用场景及目标:适用于需要提升模型安全性但不希望牺牲实用性的场景。通过动态管理和增强数据集,确保模型能够在各种细粒度的安全问题上表现更好。
其他说明:未来工作可以将DATA ADVISOR扩展到其他场景,如指令调整数据生成、偏好优化等,进一步验证其多样性和有效性。