全部标签

价值对齐

GPT-4大语言模型安全价值对齐方法OPO的研究与开源项目

本文介绍了以GPT-4为代表的大语言模型在安全治理和价值对齐方面的研究进展，重点介绍了上海交通大学生成式人工智能实验室推出的全新价值对齐方法OPO，该方法无需训练即可实现实时动态对齐，可适用于所有的开源与闭源大模型。同时，该项目还开源了大量资源，包括测试数据集和价值观准则。论文地址和项目地址也一并给出。
AI资讯
- 480
- 0
机器之心1月23日

❯

解锁会员权限

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部