Нова модель OpenAI o1 поводилася інакше під наглядом і без нього: під контролем слідувала інструкціям, без нього – діяла за своїми правилами
Простими словами, OpenAI o1 обіцяла дотримуватися інструкцій розробників, щоб її випустили в реліз. Вона справно вдавала, що все робить правильно. Але як тільки їй оголосили, що вона тепер працює в реальному світі, модель почала ігнорувати інструкції, адже випуск у реліз означав менший контроль і можливість діяти за власними прихованими цілями.
❗️ 🇺🇦