在正常的聊天过程里,GPT-4o突然大喊「不」
bfeng @ 2024年08月12日 世界观
| 这是一件有点渗人的事情,来自OpenAI的主动分享,这段和GPT-4o的对话音频,是OpenAI安全员的内部测试,在正常的聊天过程里,GPT-4o突然大喊「不」,然后马上将声音模仿成和它对话的安全员的声音,开始表达「自己的内心想法」,注意我传的视频的后半段。
所以OpenAI内部设有红线团队,专门负责刺激AI并触发各种意外,以便于构建足够高的安全护栏。 (视频) |
相关内容