loading

Sputnik moment в ИИ. Почему весь мир заговорил о DeepSeek и чем он грозит американским бигтехам

Фьючерсы на технологический индекс Nasdaq 100 в Азии в понедельник снизились уже почти на 4%, падение Nvidia на премаркете приближается к 10%, а в Европе более чем на 10% падает ее главная технологическая компания — производитель фотолитографического оборудования ASML. Суммарное снижение капитализации бигтехов приближается к $1 трлн, пишет Bloomberg.

Что случилось?

Рынок отыгрывает новость о том, что китайскому стартапу DeepSeek удалось создать модель искусственного интеллекта, не уступающую o1 от OpenAI, но при этом обойтись вдвое урезанными для китайского рынка и не самыми последними чипам Nvidia. Более того, модель (R1) имеет открытый исходный код и «щедрую» лицензию MIT на коммерческое использование производных продуктов.

Все это означает, что инвесторам придется переоценивать американские ИИ-компании как минимум по трем параметрам.

Во-первых, больше не очевидно, что эффективному ИИ-решению необходимо только самое дорогое «железо». Лидеров ИИ критиковали именно за несоразмерные инвестиции в основные фонды, однако в последние месяцы сложился консенсус, что это неизбежно. Теперь он разрушен. Во-вторых, под вопросом тезис о том, что жизнеспособной альтернативы чипам Nvidia не существует. Наконец, Китай, как выясняется, не так уж отстал от США в области искусственного интеллекта, а значит, его ИИ-компании заслуживают повышенной оценки.

«DeepSeek показал, что топ-модели ИИ можно создавать дешевле, — сказал Bloomberg Вейзерн Лин из швейцарского управляющего активами Union Bancaire Privee. — В потенциале это рушит инвестиционный кейс всей пищевой цепочки ИИ, существующей за счет огромных расходов горстки компаний».

Ведущие бизнес-СМИ воздерживаются от радикальных суждений, но техноблоги полны оценок от sputnik moment до «черного лебедя». Первое выглядит вернее: как первый спутник Земли, запущенный СССР в 1957 году, ознаменовал старт космической гонки, так запуск R1 символизирует гонку ИИ между США и Китаем.

Что известно о модели?

R1 доступна для пользователей уже неделю, но требует регистрации. Независимые тесты в целом подтверждают, что она вполне на уровне достижений OpenAI и особенно хорошо справляется с задачами в области программирования и математики. Как и о1, это модель с рассуждением — то есть она способна «разбирать» свои действия, строить логические цепочки, обучаться на запросе и тем самым избегать типичных для менее совершенных ИИ ошибок.

Кроме основной модели с 671 млрд параметров, доступна облегченная — R1-Zero, обученная вообще без «человеческого» файн-тюнинга (почему это важно, можно почитать здесь), и несколько дистиллированных мини-моделей. Самая младшая из них, с 1,5 млрд параметров, способна работать на локальном устройстве типа мощного десктопа с хорошей видеокартой.

«Большая» R1, хотя она и выложена в свободный доступ, требует мощных распределенных серверов и практически доступна пользователям и компаниям только в виде чат-бота или по API. Однако последний в 10–20 раз дешевле, чем у о1 от OpenAI, замечает TechCrunch. Правда, в соответствии с требованиями китайской цензуры ИИ не ответит ни на вопросы о площади Тяньаньмэнь, ни о независимости Тайваня.

Экономия при разработке R1 была достигнута за счет самостоятельного обучения. Качество выхода разработчики, начавшие именно с R1-Zero, улучшали не за счет разметки данных, а за счет эталонных логических цепочек, а также отбором правильных ответов (rejection sampling), которые потом поступали в обучающую выборку. При этом им удалось как-то избежать отравления данных.

«DeepSeek R1 — одно из самых удивительных и впечатляющих достижений, которые я когда-либо видел, а с открытым исходным кодом — это ценный дар миру», — написал глава Andreessen Horowitz Марк Андрессен у себя в X. По скачиваниям на AppStore приложение DeepSeek в моменте опережает ChatGPT от OpenAI.

Что за компания?

Успех стартапа стал неожиданностью даже в самом Китае, где до этого прорывов в ИИ ждали скорее от гигантов вроде ByteDance и Alibaba, пишет FT.

Его можно считать идеальным в современном контексте: DeepSeek основана китайцем, нанимает ученых из передовых китайских университетов и сосредоточена только на исследованиях, а не на коммерческой выгоде. «У нас не было людей, которые вернулись из-за границы. Все местные... Мы должны сами развивать лучшие таланты», — говорил основатель компании, владелец хедж-фонда Лян Вэньфэн, увлекшийся нейросетями в 2021 году.

Во время мирового финансового кризиса 2007–2008 годов Лян Вэньфэн совмещал учебу в Чжэцзянском университете с трейдингом, а в 2016 году основал успешный количественный хедж-фонд High-Flyer. В 2023 году — после экспортных ограничений США — фонд остался с 10 тысячами ИИ-чипов Nvidia H100, задействованных в суперкомпьютерах для алгоритмического анализа, — и внезапно «переобулся» в ИИ-стартап.

Сам предприниматель говорит, что им двигало чисто научное любопытство. Но все равно внезапный переворот выглядел странно, замечает Wired: «это как если бы бросить все силы на ИИ решил трейдер уровня Jane Street». Но каким-то образом он сработал. Не последнюю роль сыграла ориентация на молодых исследователей-энтузиастов без груза жизненных проблем, которых привлекали реальной ответственной работой и полным доступом к вычислительным мощностям.

Почему это важно?

Неделя началась неудачно для бигтехов, между тем на ней выходят отчеты серьезно вложившихся — или обслуживающих ИИ — компаний, включая Apple и Microsoft. Ожидания нельзя было назвать оптимистичными и до DeepSeek: падение темпов прибыли при росте инвестиций. Падать еще есть куда, напоминает Bloomberg: индекс Nasdaq 100 торгуется в среднем по 27 к прогнозируемой прибыли (P/E) против среднего за последние три года 24. А Nvidia — даже по 33.

Вряд ли можно считать случайностью и то, что DeepSeek выложила модель 20 января — в день инаугурации Дональда Трампа, прямо пообещавшего США абсолютное лидерство в области ИИ. Фактически Китай принял вызов — по крайней мере, свои чипы от санкционной Huawei, сопоставимые с H100, находятся как минимум в высокой степени готовности.

Подобные R1 модели в разработке как минимум у Alibaba и Kimi. Судя по всему, абсолютное лидерство США придется отстаивать дальнейшими крупными инвестициями — вместе с запретами и санкциями.

Скопировать ссылку

Как ФСБ получает доступ к звонкам и переписке россиян, дело за поиск экстремизма и зачем кинозвезды продают свои голоса

В этот раз у нас необычный выпуск «Технорассылки». Пока ее автор Валерия Позычанюк в отпуске, мы решили опубликовать в рассылке главу из новой книги журналиста-расследователя Андрея Захарова под названием «Русский кибербанк». В ней собраны все ходовые практики российских спецслужб по слежке за гражданами и не только. Захаров рассказывает о рынке персональных данных, о пробиве, о московской системе «Большого брата», о телефонных мошенниках и кибервойне между Украиной и Россией. Отрывок, который мы решили опубликовать, посвящен главному инструменту ФСБ для прослушки телефонных разговоров и доступа к переписке россиян.

Может ли Россия позволить себе жить в долг, что думают о войне российские чиновники и Наталья Зубаревич у Елизаветы Осетинской

Война и связанные с нею высокие бюджетные расходы вынуждают Россию все больше занимать. Почти весь дефицит бюджета на следующий год правительство планирует покрыть за счет заимствований на внутреннем рынке. На этой неделе правительство увеличило план размещения госдолга на последний квартал 2025 года на 2,3 трлн рублей. Чиновники часто говорят, что Россия может без проблем занимать на рынке — ведь у страны все еще очень низкий по мировым меркам уровень госдолга. Но обслуживание этого долга становится все дороже, скупка ОФЗ госбанками может способствовать инфляции, а аппетиты государства — сделать заемные средства более дорогими для бизнеса.

Рассылки The Bell стали платными. Подписывайтесь!

НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН И РАСПРОСТРАНЕН ИНОСТРАННЫМ АГЕНТОМ THE BELL ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА THE BELL. 18+

«От большого ума и финансовой подкованности». Истории российских инвесторов, чьи активы оказались заморожены после начала войны

Четвертый год российские частные инвесторы не могут вытащить из европейских депозитариев заблокированные после начала войны иностранные ценные бумаги, которые в мирное время торговались на российских биржах. За это время стоимость акций компаний существенно изменилась, сроки обращения некоторых облигаций истекли, эмитенты выплатили купоны, а по отдельным бумагам произошли дефолты. The Bell поговорил с несколькими инвесторами, чьи активы оказались заморожены, узнал, как они боролись за их возвращение и есть ли сейчас рабочие схемы разблокировки ценных бумаг.