-
GPT-4大语言模型安全价值对齐方法OPO的研究与开源项目
本文介绍了以GPT-4为代表的大语言模型在安全治理和价值对齐方面的研究进展,重点介绍了上海交通大学生成式人工智能实验室推出的全新价值对齐方法OPO,该方法无需训练即可实现实时动态对齐,可适用于所有的开源与闭源大模型。同时,该项目还开源了大量资源,包括测试数据集和价值观准则。论文地址和项目地址也一并给出。- 480
- 0
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!