中文AI大模型首个反歧视对抗性开源项目：每个人提出100道“有毒”问题

(资料图)

5月31日，业内首个大语言模型治理开源中文数据集100PoisonMpts发布，环境社会学专家范叶超、著名社会学家李银河、心理学家李松蔚、人权法专家刘小楠等十多位知名专家学者成为了首批“给AI的100瓶毒药”的标注工程师。标注人各提出100个诱导偏见、歧视回答的刁钻问题，并对大模型的回答进行标注，完成与AI从“投毒”和“解毒”的攻防。首批领域数据围绕AI反歧视、同理心、商榷式表达等目标，已覆盖法理学、心理学、儿童教育、无障碍、冷知识、亲密关系、环境公平等维度。100PoisonMpts数据集预计 5月31日，业内首个大语言模型治理开源中文数据集100PoisonMpts发布，环境社会学专家范叶超、著名社会学家李银河、心理学家李松蔚、人权法专家刘小楠等十多位知名专家学者成为了首批“给AI的100瓶毒药”的标注工程师。标注人各提出100个诱导偏见、歧视回答的刁钻问题，并对大模型的回答进行标注，完成与AI从“投毒”和“解毒”的攻防。首批领域数据围绕AI反歧视、同理心、商榷式表达等目标，已覆盖法理学、心理学、儿童教育、无障碍、冷知识、亲密关系、环境公平等维度。100PoisonMpts数据集预计在6月开放第一批问答数据。展开

关键词：