Лидер отрасли искусственного интеллекта OpenAI выпустил превью своей новой большой модели o1 Strawberry с продвинутыми способностями рассуждения. Она работает медленнее, но намного успешнее, чем GPT-4o, в аналитических областях, и проявляет зачатки исследователя.
В релизе утверждается, что результаты работы модели сравнимы по качеству с работой выпускника вуза на широком спектре задач в области физики, химии и биологии, а особенно хорошо ей удается математика и программирование. В непростом тесте на допуск к международной математической олимпиаде o1 набирает 83%, GPT-4o — только 13%. Модель способна учиться на ошибках и пробовать разные подходы к проблеме.
- Пока o1 ограничена в возможностях. По работе с текстами она не превосходит GPT-4o, не обрабатывает изображения и не подключена к интернету, так что является скорее исследовательским инструментом. Тем более что пока она доступна только премиальным пользователям.
- Первые независимые отзывы восторженные: o1 пишет сложный код по простым промтам («напиши „Тетрис“ на Python») и успешно преодолевает трудные для ИИ логические ловушки. Само название — Strawberry — это отсылка к одной из таких ловушек: «сколько r в Strawberry», на которую менее продвинутый ИИ может дать неправильный ответ.
- o1 — это развитие того самого проекта Q*, который изначально предполагался причиной раскола в OpenAI и решительным шагом на пути к общему ИИ (AGI). Накануне стало известно, что OpenAI подняла свою оценку до $150 млрд и намерена привлечь больше $10 млрд от инвесторов и банков.
- До AGI модель пока недотягивает.