中国领先的工业平台

返回贤集网 返回微头条
贤集网技术微头条APP获取

GPT-4o“变谄媚”的原因找到了!

 智侦探

下载贤集网APP入驻自媒体

OpenAI一篇新鲜出炉的认错小作文,直接引来上百万网友围观。CEO奥特曼也做足姿态,第一时间转发小作文并表示:(新报告)揭示了GPT-4o更新失败是因为什么,从中OpenAI学到了什么,以及我们将会采取的应对措施是什么。

概括而言,最新报告提到,大约一周前的bug原来出在了“强化学习”身上——上次更新引入了一个基于用户反馈的额外奖励信号,即对ChatGPT的点赞或点踩。虽然这个信号通常很有用,但可能使模型逐渐倾向于做出更令人愉快的回应。

一言以蔽之,OpenAI认为一些单独看可能对改进模型有益的举措,结合起来后却共同导致了模型变得“谄媚”。

最新回复

还没有人回复哦,抢沙发吧~

发布回复

为您推荐

热门交流