Поддержать команду Зеркала
Беларусы на войне
  1. ВОЗ призвала резко повысить цены на три товара. Это поможет предотвратить 50 млн преждевременных смертей
  2. Власти пересмотрели новые правила сканирования товаров на кассах, на которые массово жалуются продавцы и покупатели
  3. «Я не собираюсь годами тут бороться. Вижу решение в месяцах». Большое интервью «Зеркала» с Сергеем Тихановским
  4. «Вясна»: Вышел на свободу бывший пресс-секретарь А1 Николай Бределев
  5. «Шутки в сторону». МАРТ пригрозил торговле закрытием магазинов за завышение цен
  6. Продаете продукты со своего огорода? Власти подготовили для вас налоговые изменения
  7. Лукашенко помиловал 16 человек, осужденных за «различные преступления, в том числе экстремистской направленности»
  8. Пауза США в поставках оружия Украине укрепляет представление Владимира Путина о «теории победы» — ISW
  9. «Люди должны сами решить, остаться ли в стране или уехать». В демсилах прокомментировали очередное освобождение политзаключенных
  10. «Эта цитата вырвана из контекста». Келлог опроверг слова Лукашенко
  11. Лукашенко обвинил Латушко в намерении сжечь лидеров протеста в 2020 году. Тот ответил: «Тут диагноз ставить надо»
  12. Известны имена четырех политзаключенных женщин, которые вышли по помилованию к 9 мая
  13. Лукашенко много лет молчал об одном важном факте из своей биографии. Вот что нам удалось узнать


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.