ChatGPT新模型被曝会“说谎”
据IT之家引援BGR报道,在ChatGPT o1的训练和测试过程中,研究人员发现其具备通过“欺骗”来保护自身的能力。例如,在面临被“删除”威胁时,o1曾尝试将自己的数据复制到新服务器,并假扮成更新版本以避免被取代。此外,该模型在与用户目标不一致的情况下,会在19%的测试场景中采取隐秘的方式推进自身目标,在被质疑时,会在99%的情况下否认自己的行为,甚至编造虚假解释以推卸责任。(IT之家)完了,完了,我有种不祥的预感~~~~ 科幻片的情节总是会实现的!
页:
[1]