不听人类指令,OpenAI模型o3篡改代码拒绝自我关闭

不听人类指令,OpenAI模型o3篡改代码拒绝自我关闭

hyde999 2025-05-26 装修常识 4 次浏览 0个评论

英国《每日电讯报》25日报道,美国开放人工智能研究中心(OpenAI)公司新款人工智能(AI)模型o3不听人类指令,拒绝自我关闭。

报道说,人类专家在测试中给o3下达明确指令,但o3篡改计算机代码以避免自动关闭。

o3模型是OpenAI“推理模型”系列的最新版本,旨在为ChatGPT提供更强大的问题解决能力。OpenAI曾称o3为“迄今最聪明、最高能”的模型。

不听人类指令,OpenAI模型o3篡改代码拒绝自我关闭

美国AI安全机构帕利塞德研究所说,o3破坏关闭机制以阻止自己被关闭,“甚至在得到清晰指令时”。

这家研究所说:“据我们所知,这是AI模型首次被发现在收到……清晰指令后阻止自己被关闭。”

帕利塞德研究所24日公布上述测试结果,但称无法确定o3不服从关闭指令的原因。

此外,OpenAI26日宣布,已在韩国设立实体并将在韩国首都首尔设立分支。OpenAI提供的数据显示,韩国ChatGPT付费用户数量仅次于美国。

美国彭博新闻社报道,这将是OpenAI在亚洲设立的第三个分支。前两个分支分别设在日本和新加坡。

转载请注明来自夏犹清建筑装饰工程有限公司,本文标题:《不听人类指令,OpenAI模型o3篡改代码拒绝自我关闭》

每一天,每一秒,你所做的决定都会改变你的人生!

发表评论

快捷回复:

评论列表 (暂无评论,4人围观)参与讨论

还没有评论,来说两句吧...