Технологии

Автор: Анна Мигинеишвили
OpenAI прошла «Последний экзамен человечества»
Менее двух недель назад был представлен сложный тест Humanity’s Last Exam для оценки нейросетей. Лидерами стали два проекта OpenAI: o3-mini и Deep Research. Об этом сообщает «TechRadar».
Первое место заняла модель DeepSeek R1 с 9,4% правильных ответов, но её обогнали модели OpenAI: o3-mini — 10,5% и o3-mini-high — 13%. Самый выдающийся результат оказался у OpenAI Deep Research — 26,6%, что значительно превысило предыдущие достижения.
Сравнение непростое, так как Deep Research может искать информацию, а такой функции нет у других моделей. Это имеет критическое значение, учитывая уровень вопросов. Тем не менее, нейросеть постоянно улучшается, и вопрос о том, когда одна из них сдаст экзамен на «отлично», остаётся открытым.
Ранее ITinfo сообщало, что OlliOlliWorld и Rollerdrome удалили из продажи в Steam.