Sputnik moment в ИИ. Почему весь мир заговорил о DeepSeek и чем он грозит американским бигтехам

27 января 2025

Источник:

The Bell

Фьючерсы на технологический индекс Nasdaq 100 в Азии в понедельник снизились уже почти на 4%, падение Nvidia на премаркете приближается к 10%, а в Европе более чем на 10% падает ее главная технологическая компания — производитель фотолитографического оборудования ASML. Суммарное снижение капитализации бигтехов приближается к $1 трлн, пишет Bloomberg.

Что случилось?

Рынок отыгрывает новость о том, что китайскому стартапу DeepSeek удалось создать модель искусственного интеллекта, не уступающую o1 от OpenAI, но при этом обойтись вдвое урезанными для китайского рынка и не самыми последними чипам Nvidia. Более того, модель (R1) имеет открытый исходный код и «щедрую» лицензию MIT на коммерческое использование производных продуктов.

Все это означает, что инвесторам придется переоценивать американские ИИ-компании как минимум по трем параметрам.

Во-первых, больше не очевидно, что эффективному ИИ-решению необходимо только самое дорогое «железо». Лидеров ИИ критиковали именно за несоразмерные инвестиции в основные фонды, однако в последние месяцы сложился консенсус, что это неизбежно. Теперь он разрушен. Во-вторых, под вопросом тезис о том, что жизнеспособной альтернативы чипам Nvidia не существует. Наконец, Китай, как выясняется, не так уж отстал от США в области искусственного интеллекта, а значит, его ИИ-компании заслуживают повышенной оценки.

«DeepSeek показал, что топ-модели ИИ можно создавать дешевле, — сказал Bloomberg Вейзерн Лин из швейцарского управляющего активами Union Bancaire Privee. — В потенциале это рушит инвестиционный кейс всей пищевой цепочки ИИ, существующей за счет огромных расходов горстки компаний».

Ведущие бизнес-СМИ воздерживаются от радикальных суждений, но техноблоги полны оценок от sputnik moment до «черного лебедя». Первое выглядит вернее: как первый спутник Земли, запущенный СССР в 1957 году, ознаменовал старт космической гонки, так запуск R1 символизирует гонку ИИ между США и Китаем.

Что известно о модели?

R1 доступна для пользователей уже неделю, но требует регистрации. Независимые тесты в целом подтверждают, что она вполне на уровне достижений OpenAI и особенно хорошо справляется с задачами в области программирования и математики. Как и о1, это модель с рассуждением — то есть она способна «разбирать» свои действия, строить логические цепочки, обучаться на запросе и тем самым избегать типичных для менее совершенных ИИ ошибок.

Кроме основной модели с 671 млрд параметров, доступна облегченная — R1-Zero, обученная вообще без «человеческого» файн-тюнинга (почему это важно, можно почитать здесь), и несколько дистиллированных мини-моделей. Самая младшая из них, с 1,5 млрд параметров, способна работать на локальном устройстве типа мощного десктопа с хорошей видеокартой.

«Большая» R1, хотя она и выложена в свободный доступ, требует мощных распределенных серверов и практически доступна пользователям и компаниям только в виде чат-бота или по API. Однако последний в 10–20 раз дешевле, чем у о1 от OpenAI, замечает TechCrunch. Правда, в соответствии с требованиями китайской цензуры ИИ не ответит ни на вопросы о площади Тяньаньмэнь, ни о независимости Тайваня.

Экономия при разработке R1 была достигнута за счет самостоятельного обучения. Качество выхода разработчики, начавшие именно с R1-Zero, улучшали не за счет разметки данных, а за счет эталонных логических цепочек, а также отбором правильных ответов (rejection sampling), которые потом поступали в обучающую выборку. При этом им удалось как-то избежать отравления данных.

«DeepSeek R1 — одно из самых удивительных и впечатляющих достижений, которые я когда-либо видел, а с открытым исходным кодом — это ценный дар миру», — написал глава Andreessen Horowitz Марк Андрессен у себя в X. По скачиваниям на AppStore приложение DeepSeek в моменте опережает ChatGPT от OpenAI.

Что за компания?

Успех стартапа стал неожиданностью даже в самом Китае, где до этого прорывов в ИИ ждали скорее от гигантов вроде ByteDance и Alibaba, пишет FT.

Его можно считать идеальным в современном контексте: DeepSeek основана китайцем, нанимает ученых из передовых китайских университетов и сосредоточена только на исследованиях, а не на коммерческой выгоде. «У нас не было людей, которые вернулись из-за границы. Все местные... Мы должны сами развивать лучшие таланты», — говорил основатель компании, владелец хедж-фонда Лян Вэньфэн, увлекшийся нейросетями в 2021 году.

Во время мирового финансового кризиса 2007–2008 годов Лян Вэньфэн совмещал учебу в Чжэцзянском университете с трейдингом, а в 2016 году основал успешный количественный хедж-фонд High-Flyer. В 2023 году — после экспортных ограничений США — фонд остался с 10 тысячами ИИ-чипов Nvidia H100, задействованных в суперкомпьютерах для алгоритмического анализа, — и внезапно «переобулся» в ИИ-стартап.

Сам предприниматель говорит, что им двигало чисто научное любопытство. Но все равно внезапный переворот выглядел странно, замечает Wired: «это как если бы бросить все силы на ИИ решил трейдер уровня Jane Street». Но каким-то образом он сработал. Не последнюю роль сыграла ориентация на молодых исследователей-энтузиастов без груза жизненных проблем, которых привлекали реальной ответственной работой и полным доступом к вычислительным мощностям.

Почему это важно?

Неделя началась неудачно для бигтехов, между тем на ней выходят отчеты серьезно вложившихся — или обслуживающих ИИ — компаний, включая Apple и Microsoft. Ожидания нельзя было назвать оптимистичными и до DeepSeek: падение темпов прибыли при росте инвестиций. Падать еще есть куда, напоминает Bloomberg: индекс Nasdaq 100 торгуется в среднем по 27 к прогнозируемой прибыли (P/E) против среднего за последние три года 24. А Nvidia — даже по 33.

Вряд ли можно считать случайностью и то, что DeepSeek выложила модель 20 января — в день инаугурации Дональда Трампа, прямо пообещавшего США абсолютное лидерство в области ИИ. Фактически Китай принял вызов — по крайней мере, свои чипы от санкционной Huawei, сопоставимые с H100, находятся как минимум в высокой степени готовности.

Подобные R1 модели в разработке как минимум у Alibaba и Kimi. Судя по всему, абсолютное лидерство США придется отстаивать дальнейшими крупными инвестициями — вместе с запретами и санкциями.

#искусственный интеллект #технологии

Скопировать ссылку

Sputnik moment в ИИ. Почему весь мир заговорил о DeepSeek и чем он грозит американским бигтехам

Что случилось?

Что известно о модели?

Что за компания?

Почему это важно?

Сторонский увеличил долю в Revolut до 29%. Такой пакет стоит почти $25 млрд

Уведомления от банков предложили перевести в Max

Цена российской нефти опустилась до минимума с начала войны

Цены на нефть упали на надеждах на мир в Украине