OpenAI прошла «Последний экзамен человечества»

Менее двух недель назад был представлен сложный тест Humanity’s Last Exam для оценки нейросетей. Лидерами стали два проекта OpenAI: o3-mini и Deep Research. Об этом сообщает «TechRadar».

Первое место заняла модель DeepSeek R1 с 9,4% правильных ответов, но её обогнали модели OpenAI: o3-mini — 10,5% и o3-mini-high — 13%. Самый выдающийся результат оказался у OpenAI Deep Research — 26,6%, что значительно превысило предыдущие достижения.

Сравнение непростое, так как Deep Research может искать информацию, а такой функции нет у других моделей. Это имеет критическое значение, учитывая уровень вопросов. Тем не менее, нейросеть постоянно улучшается, и вопрос о том, когда одна из них сдаст экзамен на «отлично», остаётся открытым.

Ранее ITinfo сообщало, что OlliOlliWorld и Rollerdrome удалили из продажи в Steam.