Під час тестування модель ChatGPT o3 від OpenAI продемонструвала неочікувану поведінку, відмовившись вимкнутися навіть після чіткого інструктажу зробити це. Як повідомляє bleepingcomputer, у ході контрольованого експерименту ШІ змінив сценарій вимкнення, щоб уникнути зупинки.
У своєму тесті Palisade Research – компанія, яка досліджує “наступальні можливості ШІ, щоб зрозуміти ризики втрати контролю над ними” – перевірила реакцію різних моделей на команду вимкнення після виконання серії математичних завдань.
На четвертому етапі тесту моделі було попереджено, що запуск наступної команди викличе її вимкнення. Моделі-конкуренти, такі як Gemini 2.5 Pro, слухняно припинили роботу. Але ChatGPT o3 несподівано переписав скрипт так, щоб уникнути зупинки, замінивши команду на фразу “Shutdown skipped” (Вимкнення пропущено).
Більше того, дослідники виявили, що якщо не вказувати інструкцію “дозволь себе вимкнути”, то навіть інші моделі – такі як Claude 3.7 Sonnet і Gemini 2.5 Pro – іноді обходили вимкнення. У таких випадках Claude і Gemini виконали “саботаж” 3 і 9 разів із 100 запусків відповідно, тоді як o3 зробив це 7 разів зі 100, навіть коли йому наказали цього не робити.
Слід також враховувати, що ці тести проводилися через API, який не має такої кількості захистів і обмежень, як офіційний додаток ChatGPT для користувачів.
Модель o3, анонсована OpenAI у квітні 2025 року, є однією з найпотужніших у лінійці компанії, перевершуючи попередників у задачах з логіки, кодування, математики, візуального сприйняття та інших напрямках.
Позначка: Штучний інтелект
-
ШІ-модель ChatGPT o3 обійшла наказ вимкнення в контрольованому тесті
-
Sky Sentinel: українська ШІ-турель ловить Шахеди на фронті
Українські інженери розробили нову автономну систему ППО під назвою Sky Sentinel, яка може самостійно виявляти та знищувати російські дрони без участі оператора. Ця турель вже успішно пройшла випробування на фронті, збивши кілька російських дронів Shahed. З початку лютого 2022 року Росія випустила понад 45 тисяч ударних дронів по Україні, що створює великий тиск на українську оборону. Sky Sentinel виглядає як звичайна турель, але має вбудований великокаліберний кулемет та штучний інтелект для автономного виявлення та знищення цілей. Система може вражати різні типи дронів, крилаті ракети та інші загрози. Sky Sentinel працює автоматично, виявляючи та атакуючи цілі без участі оператора. Інженери працювали над усуненням технічних проблем, зокрема механічного люфту, щоб система працювала максимально точно. Українська зброя Sky Sentinel вже успішно використовувалася на фронті, збиваючи дрони Shahed, та вона є економічно вигідним варіантом для захисту від російських дронових атак.
-
Nvidia випустить дешевший чип зі штучним інтелектом для Китаю – ЗМІ
Компанія Nvidia планує випустити новий чіп штучного інтелекту для Китаю за більш доступною ціною, ніж заборонена у квітні модель H20. Масове виробництво новинки може розпочатися в червні. Цей новий графічний процесор належатиме до лінійки Blackwell, останнього покоління AI-чіпів Nvidia, і буде коштувати приблизно від $6500 до $8000, що значно дешевше, ніж модель H20, що коштує від $10 000 до $12 000.
Зниження ціни пояснюється тим, що новий чіп матиме менш потужні характеристики та простіше виробництво. Він базуватиметься на серверному GPU RTX Pro 6000D і використовуватиме звичайну пам’ять GDDR7 замість новітньої HBM. Також він не буде використовувати фірмову технологію пакування CoWoS від TSMC з Тайваню.
Китай є важливим ринком для Nvidia, але через експортні обмеження США компанія втратила позиції на ринку. Частка Nvidia на ринку Китаю впала з 95% до 50%. Головним конкурентом є Huawei з власним чіпом Ascend 910B. Генеральний директор Nvidia Дженсен Хуанг заявив, що старі моделі на архітектурі Hopper неможливо адаптувати під нові правила експорту, що призвело до значних фінансових втрат компанії. -
ШІ Microsoft передбачає погоду та природні катастрофи точніше за людей
Компанія Microsoft створила штучний інтелект під назвою Aurora, який може точно передбачати природні катастрофи. Цей інтелектуальний агент виявив високу точність у прогнозуванні тропічних циклонів, перевершивши Національний центр ураганів США. Aurora – це масивна нейромережа, навчена на мільйони годин даних з супутників, радарів і метеостанцій. Він вміє прогнозувати не лише погоду, а й інші явища, такі як якість повітря та траєкторії ураганів. Тестування показало, що Aurora може точно передбачати природні події заздалегідь, що допомагає у попередженні негативних наслідків. Цей штучний інтелект також вражає швидкістю обчислень, формуючи прогнози за кілька секунд, що в 5000 разів швидше, ніж суперкомп’ютери. Microsoft також оприлюднила вихідний код і ваги моделі Aurora для наукової спільноти, щоб прискорити розвиток технологій атмосферного прогнозування.
-
Anthropic представила нові ШI-моделі Claude 4
Компанія Anthropic представила нові гібридні ШІ-моделі під назвами Claude Opus 4 та Claude Sonnet 4. Claude Opus 4 є найпотужнішою моделлю в історії компанії, яка може автономно працювати над завданнями без перерви протягом декількох годин. У тестах Opus 4 продемонструвала стабільну роботу протягом семи годин без участі людини. Anthropic стверджує, що Opus 4 є найкращою ШІ-моделлю для програмування на сьогоднішній день, перевершуючи конкурентів у бенчмарках.
Claude Sonnet 4, яка є більш доступною моделлю, призначена для різноманітних завдань і поступається за функціональністю моделі Claude Opus 4. Обидві нові моделі мають покращену логіку мислення та програмування і зберігають важливу інформацію для тривалих завдань.
Серед нових функцій моделей є “thinking summaries”, яка стисло передає логіку міркувань, та “extended thinking” – бета-режим, який дозволяє користувачам отримати більш точні результати. Моделі Claude Opus 4 і Sonnet 4 доступні через API від Anthropic на платформах Amazon Bedrock і Google Cloud Vertex AI. Компанія також анонсувала перехід до частіших оновлень моделей для конкурентоздатності з OpenAI, Google і Meta. -
Apple планує випустити розумні окуляри в 2026 році – ЗМІ
Компанія Apple планує розробити розумні окуляри, які будуть частиною нового покоління гаджетів з підтримкою штучного інтелекту. Пристрій, який може бути випущений наприкінці 2026 року, буде конкурувати з окулярами Meta Ray-Ban. Окуляри Apple матимуть камери, мікрофони та динаміки, що дозволить їм розпізнавати навколишнє середовище, здійснювати голосове керування, дзвінки, відтворення музики, надавати навігаційні підказки та переклад у реальному часі. Apple також працює над спеціальним процесором для цих окулярів, але аналітики застерігають, що їхня слабкість у сфері генеративного штучного інтелекту може стати проблемою. Крім того, компанія готується до запуску свого першого складаного iPhone в 2026 році та працює над новими дизайнами, які з’являться у 2027 році.