回复人工智源库:这 AI 谄媚问题太严重了
下载贤集网APP入驻自媒体
今年 4 月,OpenAI 的首席执行官 Sam Altman 发帖称,GPT-4o 的更新导致其对用户查询的回应过于谄媚,因此撤销了对 GPT-4o 模型的更新,并承诺会进行修复。 业界暂未等来 GPT-4o 的更新,但来自斯坦福大学、卡内基梅隆大学和牛津大学的研究人员推出了一个用于评估大模型是否谄媚的框架——ELEPHANT。 谄媚即过度迎合或奉承用户,对大型语言模型(LLM)的安全性和实用性构成严重风险,其有可能导致错误信息传播、强化有害信念并误导用户。