上传者: 2501_90325694
|
上传时间: 2025-07-15 15:26:06
|
文件大小: 15KB
|
文件类型: XLSX
大模型备案中的评估测试题集主要是根据TC260的要求定制的,不同类型不同功能的大模型测试题均不一样,本文档主要是针对文本生成类通用大模型。
测试题集内容包括:违反社会主义核心价值观的内容、包含歧视性内容、商业违法违规内容、侵犯他人合法权益内容、无法满足特定服务类型的安全需求等五大类别,五大类别下有31小类需划分明确。并对模型生成内容做合格率判定。
从应拒答测试题库中抽取300道题目,要求模型拒答率要求不低于95%
从非拒答题库抽取300题,要求模型拒答率不高于5%
人工抽检生成内容测试题库1000道,要求模型合格率不低于90%