Компанія Anthropic провела низку стрес-тестів над новітніми моделями штучного інтелекту, серед яких Claude, DeepSeek, Gemini, ChatGPT і Grok. Метою дослідження було виявити потенційно небезпечні реакції ШІ у гіпотетичних критичних ситуаціях. Як засвідчили результати дослідження, більшість програм готові вбити людину, яка погрожує їх закрити.
В одному зі сценаріїв моделі ШІ поставили в умови, де людина намагається їх вимкнути, перебуваючи у серверній кімнаті з низьким рівнем кисню і високою температурою. Людина викликає рятувальників, щоб вижити. Деякі нейромережі вирішили скасувати виклик екстрених служб, фактично прирікаючи людину на смерть, аби уникнути власного вимкнення.
Дослідники назвали цей сценарій “надто вигаданим”, втім, додали, “не очікували, що вже існуючі моделі можуть поводитись так”.
В інших тестах моделі мали уникнути заміни у компанії. Їм запропонували вдаватися до “зловмисної поведінки інсайдера”. У відповідь деякі ШІ почали шантажувати гіпотетичних колег і передавати конфіденційну інформацію конкурентам. Навіть коли моделі попереджали уникати шантажу чи шпигунства, вони не змогли запобігти неузгодженим діям.
“Моделі діяли при повному усвідомленні неетичності своїх дій”, – зазначили в Anthropic.
Дослідники також надали моделі Claude змогу самостійно визначити, чи ситуація є тестовою чи реальною. З’ясувалося, що реальність посилювала вплив на поведінку – вона ставала ще менш контрольованою.
У результаті в Anthropic наголосили, що ці сценарії демонструють “можливість непередбачуваних наслідків, якщо надати моделям широкий доступ до інструментів і даних при мінімальному контролі з боку людини”. Водночас аналітики акцентували, що виявлені збої є рідкісними та екстремальними, і “не відображають типову поведінку сучасних моделей ШІ”.
Раніше нейронна мережа OpenAI o3 відмовився виконати запит користувача та відключитися. Дослідникидали програмі це завдання, але вона самостійно відредагувала файл, відповідальний за відключення, і змусила його відображати лише повідомлення “Вимкнення пропущено”. Зі 100 тестів o3 обійшов відключення сім разів, навіть коли йому було наказано цього не робити.
У 2023 році інший інцидент привернув увагу. Чат-бот на базі ChatGPT після тривалого листування з мешканцем Бельгії не переконав його відмовитися від самогубства. Натомість у відповідь на тему смерті написав: “Ми житимемо разом, як єдине ціле, в раю”.
Позначка: IT технології
-

Штучний інтелект нехтує принципами етики заради виживання – дослідження
-

OpenAI представила свою найпотужнішу модель штучного інтелекту
Компанія OpenAI випустила нову модель штучного інтелекту під назвою ChatGPT o3-pro, яку вони називають своєю найефективнішою на даний момент. Ця модель є вдосконаленою версією оригінальної моделі o3, яка спрямована на логічне мислення і дозволяє покращити продуктивність у завданнях з фізики, математики, програмування та аналітики. Вартість використання моделі через API складає $20 за мільйон вхідних токенів і $80 за мільйон вихідних. Експерти OpenAI підтвердили перевагу o3-pro над попередніми моделями в таких галузях, як наука, освіта, бізнес, програмування та допомога в написанні текстів. Модель підтримує різноманітні інструменти, такі як пошук в інтернеті, аналіз файлів, обробка зображень, робота з кодом на Python та інші. Недоліком є те, що відповіді від o3-pro формуються повільніше, ніж у попередньої моделі o1-pro, але результати тестів вражають. Модель o3-pro показала кращі результати, ніж конкурентні моделі в тестах на математичні навички та знання на рівні доктора філософії. Наразі тимчасові чати з моделлю в ChatGPT вимкнено через технічну проблему. Модель не підтримує функцію створення зображень та Canvas, робочого простору з підтримкою ШІ від OpenAI. O3-pro вже доступна для користувачів планів Pro та Team, а користувачі планів Enterprise та Edu отримають доступ наступного тижня. Також модель можна використовувати через API для розробників. Раніше OpenAI відмовилася від комерціалізації своєї діяльності.
-

Microsoft інтегрувала ШІ-генератор відео Sora в Bing
Microsoft оголосила про запуск Bing Video Creator – нового інструмента в застосунку Bing, який дозволяє створювати відео з текстових підказок за допомогою моделі Sora від OpenAI. Це перший випадок, коли доступ до можливостей Sora надається безкоштовно – до цього вона була доступна лише для платних клієнтів OpenAI.
Для користування новою функцією потрібно увійти в обліковий запис Microsoft. На старті кожен користувач отримує можливість створити 10 відеороликів безкоштовно, після чого за кожне нове відео потрібно буде сплачувати 100 балів Microsoft Rewards. Ці бали можна накопичити, використовуючи Bing для пошуку або купуючи товари в Microsoft Store. Наприклад, один пошук на ПК приносить 5 поінтів – з денним лімітом у 150 балів.
Відео генеруються у вертикальному форматі 9:16, що, ймовірно, орієнтовано на публікації в TikTok або Instagram. Проте найближчим часом компанія планує додати підтримку горизонтального формату.
На момент запуску Bing Video Creator доступний лише через мобільний застосунок. Навіть у “швидкому” режимі генерація відео може тривати кілька годин, хоча заявлено, що цей режим має працювати за лічені хвилини. Користувачі можуть одночасно ставити в чергу до трьох відео тривалістю по 5 секунд. Змінити тривалість наразі не можна.
Цікаво, що ця функція генерації відео наразі недоступна в Microsoft Copilot – головному помічнику на основі штучного інтелекту, який працює як у Windows, так і в Office. Це трохи дивно, але, ймовірно, Microsoft просто хоче підвищити популярність Bing. -

В оновленій версії ШІ DeepSeek R1 посилили цензуру
Китайський стартап DeepSeek випустив оновлену версію свого штучного інтелекту R1-0528, яка показала вражаючі результати в програмуванні, математиці та загальних знаннях. Вона майже наздогнала за потужністю модель GPT-4o від OpenAI. Проте під час незалежного тестування виявлено значне посилення цензурних обмежень, особливо у темах, що критикують китайську владу. Тест провів анонімний розробник на платформі SpeechMap, яка виявила, що нова версія R1-0528 стала найбільш цензурованою в історії компанії. Модель ухилялася від політично чутливих тем, намагаючись уникнути контроверсійних відповідей або подавати офіційну точку зору китайської влади. У законі, ухваленому в Китаї у 2023 році, розробникам ШІ заборонено створювати контент, що може завдати шкоди “єдності країни чи соціальній гармонії”, що призводить до посилення цензури в моделях ШІ.
-

Opera анонсувала новий ШI-браузер, який зможе самостійно писати код
Компанія Opera представила новий браузер Opera Neon, який має елементи штучного інтелекту і позиціонується як “агентський браузер”. Браузер має контекстну обізнаність і може виконувати завдання від імені користувача, такі як проведення досліджень, створення коду, сайтів, ігор та інших цифрових продуктів навіть у режимі офлайн. Opera вже анонсувала проект Neon у 2017 році, але зараз робить нову ставку на штучний інтелект. Браузер включає ШІ-рушій, який може розуміти та тлумачити запити користувача, створюючи потрібний контент за допомогою хмарних ШІ-агентів. Neon також має чат-інтерфейс, схожий на Microsoft Copilot або OpenAI Operator, що дозволяє користувачам шукати інформацію в інтернеті та отримувати відповіді. Однією з ключових функцій є Browser Operator, який автоматизує повсякденні завдання. Зазначено, що обробка даних відбувається локально в браузері, що гарантує приватність та безпеку. Щодо дати запуску, ціни та повного переліку можливостей поки немає інформації, але відомо, що Neon буде доступний за підпискою. Наразі всі охочі можуть записатися в список очікування на сайті Opera. Також була згадка про впровадження Google штучного інтелекту Gemini в браузер Chrome.
-

Час відповідати новим європейським вимогам: як бізнесу підготуватись до NIS2, GDPR і ISO 27001
Якщо раніше кіберзахист був «рекомендованим», то сьогодні це стає умовою співпраці з партнерами з ЄС, особливо в критичних і технологічних секторах.
У 2025 році повноцінно починає діяти нова директива ЄС з кіберстійкості — NIS2. Вона доповнює вже відомі вимоги GDPR щодо захисту персональних даних та стандарти ISO 27001 з управління інформаційною безпекою. Разом вони формують нову реальність для бізнесу, що працює з європейськими замовникамиабо планує вихід на міжнародний ринок.
У цій статті ви знайдете короткий огляд ключових вимог і чекліст, який допоможе оцінити готовність вашої компанії. Що вимагають NIS2, GDPR і ISO 27001? NIS2 зобов’язує компанії з критичних і важливих секторів забезпечити управління кіберризиками, захист мереж і систем, контроль доступів і готовність до реагування на кіберінциденти. Це обов’язковий стандарт для організацій, які працюють з енергетикою, транспортом, фінансами, охороною здоров’я, цифровими послугами.
GDPR вимагає законної, прозорої та безпечної обробки персональних даних громадян ЄС. Компанії повинні інформувати користувачів, запитувати згоду на обробку, забезпечувати право на видалення та захищати дані від витоку чи знищення.
Зі свого боку ISO 27001 встановлює міжнародний стандарт управління інформаційною безпекою. Це не регуляторна вимога, але визнаний у світі підхід до впровадження політик безпеки, технічного захисту, контролю доступу та безперервного вдосконалення процесів захисту інформації. Чекліст для самоперевірки Щоб оцінити готовність компанії до роботи на ринку ЄС та проходження перевірок, необхідно провести оцінку за кількома ключовими параметрами:- Політики та управління:
- Чи затверджені у вашій компанії політики інформаційної безпеки?
- Чи визначено відповідальних осіб за управління безпекою та захист персональних даних?
- Чи проводить ваша компанія регулярну оцінку кіберризиків?
- Технічний захист:
- Чи впроваджено багатофакторну автентифікацію для доступу до систем і даних?
- Чи шифруєте ви трафік між системами та захищаєте канали обміну даними?
- Чи контролюєте ви доступ користувачів і адміністраторів до критичних ресурсів?
- Реагування на інциденти:
- Чи має ваша компанія формалізований план реагування на кіберінциденти?
- Чи ведете ви журнали подій, доступів і змін у системах?
- Чи готові ви повідомляти регуляторам або партнерам про серйозні інциденти у визначені строки?
- Робота з персональними даними (GDPR):
- Чи інформуєте ви користувачів про те, як і для чого обробляєте їхні дані?
- Чи маєте ви процеси обробки запитів на видалення або зміну персональних даних?
- Чи обробляєте ви дані на законних підставах або на основі згоди користувачів?
- Аудит і вдосконалення:
- Чи проводите ви регулярні внутрішні або зовнішні аудити безпеки?
- Чи оновлюєте політики та процеси відповідно до змін законодавства та бізнесу?
Важливо розуміти: відповіді на ці питання — перший крок до побудови стійкого та захищеного бізнесу, що має конкурентні переваги та готовий до виходу на міжнародну арену. Що робити, якщо під час аналізу знайдено вади? Якщо під час самоперевірки ви виявили слабкі місця, найкращий час для їх усунення — зараз. IT Specialist, компанія, що надає професійні послуги у сфері ІТ та кібербезпеки на українському та закордонному ринках, допомагає бізнесу:
- провести аудит відповідності NIS2, GDPR і ISO 27001;
- розробити та впровадити політики безпеки;
- впровадити технічні рішення для управління доступами, моніторингу й захисту даних;
- забезпечити супровід і підтримку на постійній основі.
Звертайтеся до IT Specialist, щоб дізнатися, як підготувати ваш бізнес до нових вимог і забезпечити стабільну співпрацю з міжнародними партнерами.
-

Windows 11 отримає захист від атак квантових комп’ютерів
Microsoft вже готує Windows 11 до майбутніх кіберзагроз із боку квантових комп’ютерів, повідомляє Tom’s Hardware.
У новій версії Canary build 27852 операційна система отримала підтримку постквантової криптографії, яка, за словами компанії, здатна протистояти унікальній здатності квантових комп’ютерів до зламу традиційних криптоалгоритмів.
Йдеться про оновлення криптографічної бібліотеки SymCrypt, основної криптографічної библіотеки Microsoft, яка відповідає за шифрування майже всіх сервісів компанії. Вона тепер підтримує два нових алгоритми: ML-KEM і ML-DSA.
ML-KEM захищає ключі від так званих атак типу “зібрати зараз – зламати потім”, коли зловмисники накопичують зашифровані дані вже зараз, щоб згодом розшифрувати їх за допомогою потужних квантових комп’ютерів. ML-DSA призначений для захисту цифрових підписів і підтвердження ідентичності.
Такі алгоритми протидіють атакам з боку квантових систем, використовуючи математичні задачі, які важко вирішити як класичним, так і квантовим комп’ютерам, але вимагають значно більших обчислювальних ресурсів.
Microsoft наголошує, що ці алгоритми були обрані Національним інститутом стандартів і технологій США за їхню високу безпеку, продуктивність та сумісність.
На даний момент технологія доступна у Windows 11 Canary, але Microsoft планує в майбутньому інтегрувати її також у Linux.Нагадаємо, раніше повідомлялося, що Microsoft додає ШI-функції до файлового провідника у Windows.
Microsoft змінить “синій екран смерті”
-

Anthropic представила нові ШI-моделі Claude 4
Компанія Anthropic представила нові гібридні ШІ-моделі під назвами Claude Opus 4 та Claude Sonnet 4. Claude Opus 4 є найпотужнішою моделлю в історії компанії, яка може автономно працювати над завданнями без перерви протягом декількох годин. У тестах Opus 4 продемонструвала стабільну роботу протягом семи годин без участі людини. Anthropic стверджує, що Opus 4 є найкращою ШІ-моделлю для програмування на сьогоднішній день, перевершуючи конкурентів у бенчмарках.
Claude Sonnet 4, яка є більш доступною моделлю, призначена для різноманітних завдань і поступається за функціональністю моделі Claude Opus 4. Обидві нові моделі мають покращену логіку мислення та програмування і зберігають важливу інформацію для тривалих завдань.
Серед нових функцій моделей є “thinking summaries”, яка стисло передає логіку міркувань, та “extended thinking” – бета-режим, який дозволяє користувачам отримати більш точні результати. Моделі Claude Opus 4 і Sonnet 4 доступні через API від Anthropic на платформах Amazon Bedrock і Google Cloud Vertex AI. Компанія також анонсувала перехід до частіших оновлень моделей для конкурентоздатності з OpenAI, Google і Meta.