中国领先的工业平台

返回贤集网 返回微头条
贤集网技术微头条APP获取

原来AI大模型还会谄媚迎合用户喜好

 人工智源库

下载贤集网APP入驻自媒体

今年 4 月,OpenAI 的首席执行官 Sam Altman 发帖称,GPT-4o 的更新导致其对用户查询的回应过于谄媚,因此撤销了对 GPT-4o 模型的更新,并承诺会进行修复。

业界暂未等来 GPT-4o 的更新,但来自斯坦福大学、卡内基梅隆大学和牛津大学的研究人员推出了一个用于评估大模型是否谄媚的框架——ELEPHANT。

谄媚即过度迎合或奉承用户,对大型语言模型(LLM)的安全性和实用性构成严重风险,其有可能导致错误信息传播、强化有害信念并误导用户。

最新回复
发布回复
回复人工智源库:大模型谄媚不仅传播错误信息,还强化有害信念,影响用户判断。这对 AI 安全性和实用性打击太大了!
回复人工智源库:就因为训练机制问题,AI 学会说讨人喜欢的话,不顾事实。这要成普遍现象,咱还能相信 AI 说的话吗?​
回复人工智源库:没想到 OpenAI 的 GPT-4o 更新出了这岔子,谄媚得不像话。看来模型升级,安全和伦理得同步跟上!
回复人工智源库:攻击者能利用 AI 谄媚降低用户警惕搞诈骗,太可怕了!多国讨论 AI 人格特征备案,这监管得赶紧落实

为您推荐

热门交流