Технорассылка

Как Китай воюет за искусственный интеллект, рекорды Nvidia и сколько стоит взломать вас через даркнет

27 августа 2023

v.pozychanyuk@thebell.io

Тема выпуска — как Китай борется за лидерство в развитии нейросетей

Генеративные нейросети — самый горячий технотренд 2023 года. Пока что главным драйвером развития технологии остаются США. Но Китай не жалеет ни денег, ни сил на то, чтобы их обогнать. В этом выпуске рассылки вместе с аналитиком по международным технологическим компаниям БКС, автором телеграм-канала «Знай свои инвестиции» Денисом Буйволовым разбираемся, какие шансы у Китая побороться за лидерство в глобальной гонке за ИИ.

Не ChatGPT единым

Китайские нейросети не пользуются большой популярностью у западных СМИ. С начала 2023 года только Baidu достаточно часто мелькала в заголовках со своим чат-ботом Ernie. Но это не единственная большая языковая модель (LLM) в стране: с 2020 года в Китае их было выпущено не меньше 79 — и это даже больше, чем в США. Вместе на эти две страны приходится больше 80% от всех LLM, выпущенных в мире.

Правда, пока это не помогло Китаю возглавить гонку за генеративный ИИ. Страна, лидирующая по числу связанных с ИИ патентов, не смогла выпустить собственный ChatGPT раньше американских конкурентов. Да и сейчас самые продвинутые китайские языковые модели отстают — и, судя по всему, это китайских разработчиков довольно сильно расстраивает.

Кроме того, США все еще сильно опережает Китай и по объему инвестиций в ИИ: $26,6 млрд против $4 млрд за первую половину 2023 года. Но в Китае решили серьезно взяться за дело: в гонку за ИИ, чтобы помочь стране побороть главного геополитического противника, за последние месяцы вступили китайские техномиллиардеры, ветераны IT-индустрии, ведущие инженеры, а также компании и фонды, готовые инвестировать в развитие технологии.

В пример Bloomberg приводит интернет-магната Ван Сяочуаня, который основал второй по популярности поисковик Sogou, купленный два года назад за $3,5 млрд Tencent. В апреле он основал стартап со стартовыми инвестициями $50 млн, убедил присоединиться к проекту некоторых своих бывших сотрудников из Sogou, а в июне компания уже запустила свою LLM с открытым кодом, и теперь ее используют исследователи сразу двух ведущих китайских университетов. «Мы все слышали выстрел на старте этой гонке, — заявил предприниматель агентству. — Технологические компании, и большие, и маленькие, готовятся начать этот забег. Китай отстает от США примерно на три года, но нам может не потребоваться столько времени, чтобы догнать».

В общей сложности, по данным Bloomberg, китайский бизнес может вложить в развитие технологий искусственного интеллекта в этом году около $15 млрд. По числу венчурных сделок в этой отрасли разрыв уже стремительно сокращается — с начала 2023 года до середины июня их число в Китае приблизилось к 300 против 447 в США.

Вот лишь несколько проектов, которые могут побороться за лидерство в развитии новой технологии:

Ernie от Baidu — главный китайский конкурент ChatGPT. Его Baidu впервые показала в марте, правда, сама презентация пользователей разочаровала: на ней не было живых демонстраций, только записанные видео, кроме того, бот не сразу появился в общем доступе. У такого подхода была понятная причина: компании пришлось выпускать сервис раньше, чем планировалось, из-за ИИ-бума, случившегося после появления ChatGPT (примерно в той же ситуации оказался и Google со своим чат-ботом Bard).

Появился чат-бот не внезапно. Первую LLM — Ernie 1.0 – Baidu выпустила еще в 2019 году. Обновленная модель, по словам менеджмента компании, в 10 раз эффективнее первого поколения чат-бота. А главное — последняя версия чат-бота под названием Ernie 3.5 превосходит ChatGPT, утверждает сама Baidu со ссылкой на китайских же исследователей. Правда, не во всем, а только в нескольких аспектах: например, в тестах на китайском языке. Однако в других областях обойти конкурента китайскому аналогу пока не удается. Да и на китайском языке у чат-бота от Baidu есть свои ограничения: например, он, в отличие от ChatGPT, не отвечает на вопросы о том, что случилось на площади Тяньаньмэнь в 1989-м и дает вполне предсказуемые ответы о ситуации на Тайване.

Tonqyi Qianwen от Alibaba. Компания Джека Ма — второй основной игрок на ИИ-рынке Китая. Первую LLM она выпустила еще в 2021 году. А в апреле этого года Alibaba запустила своего чат-бота Tonqyi Qianwen. Сейчас он интегрирован в аналог Slack, мессенджер компании DingTalk и помощника для проведения встреч и совещаний Tingwu.

Alibaba не планирует ограничиваться только чат-ботом. 1 июня компания выпустила ИИ-помощника, который за первый месяц, по собственным данным компании, использовали 360 тысяч пользователей. 7 июля компания запустила генеративную модель Tongyi WanXiang, которая в ответ на текстовое описание генерирует картинки (аналог Midjourney). А еще в ноябре прошлого года у Alibaba появилась платформа ModelScope, которая дает доступ корпоративным клиентам к разным языковым моделям.

Кроме того, Alibaba пошла по пути Meta (признана в России экстремистской организацией и запрещена) — и на этой неделе выпустила модель с открытым исходным кодом. Она доступна в двух версиях: Qwen-VL и Qwen-VL-Chat — и основана на той же Tongyi Qianwen. По словам разработчиков, она умеет распознавать изображения и вести более сложные диалоги, чем предыдущие продукты компании. А благодаря открытому исходному коду разработчики из разных стран смогут свободно использовать ее для создания собственных ИИ-сервисов.

HunyuanAide от Tencent. Компания вступила в гонку за ИИ позже своих китайских конкурентов — в мае 2022 года Tencent выпустила первую языковую модель под названием HunYuan. А в феврале 2023-го стало известно, что компания собирает команду для разработки собственного аналога ChatGPT на ее основе. Проект получил название HunyuanAide. Пока что результатов их усилий в открытом доступе нет, но в августе Tencent начала внутренние тесты будущего сервиса, а в июне запустила свою платформу, которая дает доступ к разным языковым моделям — MaaS (model-as-a-service).

Кто еще

SenseTime, крупный китайский разработчик систем распознавания лиц, в апреле представил собственного бота SenseChat на базе LLM SenseNova. Был шанс, что он будет интегрирован с продуктами Alibaba, крупного инвестора компании, но китайский бигтех избавился от акций SenseTime. Да и в целом бумаги компании, которая в декабре провела IPO в Гонконге, продолжают дешеветь вопреки AI-буму.
Bytedance, владелец TikTok, тоже тестирует своего чат-бота Grace на базе корпоративной платформы Feishu. Но проект в зачаточном состоянии и пока предназначен только для внутреннего пользования (в этом Bytedance похожа на Apple).
JD.com, еще один китайский e-commerce гигант, в июле представил собственную LLM под названием ChatRhino. Эта нейросеть, по данным компании, на 70% обучена на общих данных, а еще на 30% — на данных собственной цепочки поставок JD.com и нацелена не на общее применение, а на конкретные отрасли. Например, на базе той же модели компания выпустила и отдельную нейросеть для врачей Jingyi Qianxun.
Huawei тоже претендует на место в гонке за Gen AI. В июле компания представила третью версию своей модели Pangu 3.0, но она тоже будет сфокусирована на промышленном применении, а своего чат-бота в Huawei делать не планируют.

Проблемы

Китайские компании в стремлении победить в глобальной гонке за ИИ поддерживают и китайские власти. И хотя технологический отрыв от лидеров рынка оценивается в два-три года, китайские ИИ-энтузиасты надеются преодолеть его быстрее. Получится?

Не факт. Кроме большого энтузиазма, у Китая в этой гонке сохраняется целый набор довольно серьезных проблем. Главная — это доступ к передовым графическим чипам. Для понимания масштабов проблемы: из 20 китайских LLM 17 работают на чипах Nvidia и всего 3 — на китайских аналогах. При этом еще прошлой осенью США ограничили поставки в Китай передовых чипов для искусственного интеллекта и оборудования для их производства — вне зависимости от страны их производства. А в ближайшем будущем эти ограничения могут стать еще строже.

Правда, в Nvidia нашли способ обойти ограничения, выпустив модифицированную версию своих чипов с производительностью на 30% меньше, чем у флагманских моделей A100 и H100. И такой «альтруизм» неудивителен: на Китай у Nvidia в последнем квартале пришлось порядка 17% выручки, терять которую компания явно не хочет. Однако риски дальнейших ограничений со стороны США на ввоз чипов в Китай сохраняются, а это может существенно осложнить развитие языковых моделей в будущем.

Также большой проблемой для китайских нейросетей может стать регулирование. Китай первым в мире утвердил правила регулирования ИИ, они вступили в силу с 15 августа. В правилах 24 пункта, которые касаются систем, доступных пользователям, но не затрагивают исследовательские проекты. По новым нормам весь сгенерированный нейросетями контент должен будет маркироваться. Кроме того, генеративным нейросетям нужно будет получать лицензии, при этом решения регулятор будет принимать по каждой модели в отдельности. А обучаться нейросети должны будут на «законных данных», которые придется раскрывать регуляторам. И, наконец, все ИИ-сервисы должны будут «соответствовать социалистическим ценностям Китая».

Исходя из общей логики этого регулирования, за чат-ботами на базе генеративных нейросетей власти будут следить особенно пристально, ведь именно они ориентированы на конечных пользователей и генерируют бесконечное количество контента по неограниченному кругу запросов.

Еще одна проблема для китайских нейросетей — меньшее количество данных для обучения. Суть в том, что количество текстов, которые доступны нейросетям для обучения, на китайском языке в 6,5–7 раз меньше, чем на английском. Отдельное препятствие — недоверие к китайским компаниям на Западе, из-за которого им будет трудно строить глобальные сервисы.

Несмотря на все проблемы, не стоит забывать, что игра в догонялки хорошо знакома китайским IT-компаниям, напоминает Bloomberg. В эпоху мобильных технологий целое поколение стартапов во главе с Tencent, Alibaba и владельцем TikTok ByteDance создало индустрию, которая могла конкурировать с Кремниевой долиной. С учетом того, что Facebook, YouTube и WhatsApp были отрезаны от китайского рынка с его 1,4 млрд пользователей, китайские компании могли развиваться, не страдая от конкурентов. В итоге в 2018 году по объему венчурного финансирования Китай едва не превзошел США. Нельзя исключать, что эта история не повторится на рынке искусственного интеллекта.

КОМПАНИИ

Рекорды Nvidia

Вот уж кто действительно в выигрыше от глобальной гонки за ИИ, в которую ввязались США и Китай (да и другие страны), так это Nvidia. Такого звездного отчета, какой показала компания за последний квартал, рынок не видел давно. Производитель видеокарт и чипов для ИИ удвоил бизнес за год, намного превзойдя и свои прогнозы, и прогнозы рынка по всем параметрам. Выручка Nvidia за квартал составила рекордные $13,51 млрд по сравнению с $6,7 млрд год к году. Чистая прибыль в годовом сравнении выросла почти в 10 раз, до $6,19 млрд. В итоге в четверг акции компании побили свой исторический рекорд, а всего с начала года котировки компании выросли больше чем в три раза. Возможно, главное, на что стоит обратить внимание инвесторам, — это успех не одного дня, а результат многолетних усилий, которые очень пригодились в изменившемся мире, пишет The Wall Street Journal. Большая часть выручки компании пришлась на чипы для дата-центров генеративного ИИ, а гиганты уровня Microsoft, Amazon и Alphabet даже не думают сокращать закупки. Как Nvidia удалось заработать на искусственном интеллекте и кто может бросить ей вызов, мы рассказывали здесь.

OnlyFans закрепил успех

Другой рекордсмен этой недели — порносервис OnlyFans. Компания показала рекордные результаты по итогам прошлого отчетного года: рост численности создателей контента в полтора раза, до 3,2 млн, потребителей — на четверть, до 239 млн, выручки — на 17%, до $1,09 млрд, а прибыли — на 24%, до $404 млн. На донаты в сервисе пользователи потратили больше $5 млрд, комиссия OnlyFans составила 20%. Теперь компания выплатит $338 млн дивидендов, которые получит живущий в Великобритании единственный владелец — «иммигрант из Украины в первом поколении» Леонид Радвинский. Как его сервис изменил лицо всей порноиндустрии, The Bell рассказывал здесь.

ОНЛАЙН-РАССЛЕДОВАНИЕ

Как в даркнете торгуют взломами частной переписки

Взломом переписки политиков, активистов и селебрити давно никого не удивишь. Только этим летом китайские хакеры взломали министерство торговли США, украинское «Киберсопротивление» хакнуло почту полковника Росгвардии, а в России мошенники взломали соцсети нескольких банков и попытались с помощью вредоносной ссылки получить данные о картах клиентов. В этом выпуске нашей регулярной рубрики «Онлайн-расследование» спецкор The Bell Ирина Панкратова рассказывает, как работает российский черный рынок взлома частной переписки в интернете.

READ LATER

Главный лонгрид недели — история The New York Times про Илона Маска. В ней несколько десятков людей, связанных с миллиардером, рассказывают, как ему удалось стать настолько влиятельным бизнесменом сразу в нескольких отраслях и во что это влияние выливается на практике (например, когда Маск решает отключить Starlink в Украине). Здесь можно почитать на русском перевод от ChatGPT и Deepl.
История CoreWeave, стартапа из Нью-Джерси, который предоставляет облачный доступ к графическим процессорам Nvidia и конкурирует с гигантами Кремниевой долины. И, кажется, является еще одним главным бенефициаром бума Gen AI.
Зачем исследователи создали виртуальную деревню, населенную чат-ботами, и что все это может рассказать нам о человеческом взаимодействии.

ОСТАВАЙТЕСЬ С НАМИ

Дорогие читатели!

Нам очень нужна ваша помощь. Независимые медиа в России преследуются государством и практически лишены возможностей зарабатывать самостоятельно. Они не смогут выжить без поддержки своих читателей. И мы — не исключение. Сегодня мы очень просим вас подписаться на регулярные донаты The Bell.

#технологии