Технорассылка

Убьет ли ChatGPT Google, разоблачение аудиофейков и отчеты бигтехов

5 февраля 2023

v.pozychanyuk@thebell.io

Тема выпуска — убьют ли чат-боты поисковики

Такого хайпа, как вокруг ChatGPT, технорынок не видел уже давно. Чат-бот от OpenAI уже успели провозгласить «убийцей Google», сам Google объявил внутри компании «красный код» и вернул к работе Сергея Брина, а о разработке собственных конкурирующих чат-ботов объявили, кажется, все уважающие себя IT-компании. Разбираемся, насколько на самом деле велика угроза поисковикам, почему сами разработчики ChatGPT не ждали от своего детища особого успеха и чем на главный вызов времени готовится ответить российский «Яндекс».

100 млн за два месяца

30 ноября калифорнийская лаборатория искусственного интеллекта OpenAI (в числе основателей и инвесторов которой был Илон Маск) запустила чат-бот ChatGPT, основанный на нейросетевой языковой модели GPT-3.5. Это искусственный интеллект генеративного типа — то есть способный создавать новую информацию на базе изученных данных (что это такое и как примерно работает, можно прочитать, например, здесь).

Сразу после релиза чат-бот от OpenAI вызвал настоящий фурор: за неделю сервис собрал первый миллион пользователей. К началу февраля месячная аудитория ChatGPT достигла 100 млн юзеров. Это рекорд по скорости роста для потребительских интернет-сервисов за всю историю, пишет Reuters. Для сравнения: TikTok на то, чтобы собрать свои первые 100 млн MAU, потребовалось около девяти месяцев, а Instagram — 2,5 года.

Главная причина такой популярности — простота в использовании. OpenAI сделали чат-бот бесплатным, и для того, чтобы им воспользоваться, не нужно никаких специальных знаний или навыков. Благодаря этому пользователи по всему миру сразу же нашли для ChatGPT много разных применений. Мы уже рассказывали о том, как спустя несколько дней после релиза с помощью чат-бота люди без навыков в программировании начали писать простые игры и сервисы, студенческие рефераты, которые удавалось успешно сдать, книги, статьи и даже создавать искусственные языки.

Спустя два месяца набор найденных для ChatGPT применений продолжает расти. Так, в Университете Миннесоты нейросеть успела сдать экзамены по праву. Чат-бот ответил на 95 вопросов теста и написал 12 эссе, затем его ответы «причесали» и смешали с обезличенными работами студентов. В итоге экзамены ChatGPT сдал, хотя и не на «отлично». Кроме того, чат-боту даже без специального дообучения практически удалось получить медицинскую лицензию. А в России с помощью сервиса уже успели написать и защитить целый диплом: на то, чтобы закончить работу, студенту РГГУ понадобилось 23 часа, из которых 8 ушло на редактирование текстов, написанных ИИ.

За 10 недель, прошедших с релиза, с чат-ботом OpenAI успел посоветоваться судья в Колумбии: ответы ИИ он добавил в заключение по делу (судились страховая компания против родителей ребенка с аутизмом). Кроме того, способность ChatGPT писать код протестировали хакеры. С помощью чат-бота уже составляют программы тренировок, создают персональных ассистентов для переписок и пишут детские книги.

Из всего этого стало понятно, что генеративные ИИ потенциально способны сильно повлиять на множество разных сфер и рынков. Но одной из самых горячих тем для обсуждений в этой связи стал многомиллиардный бизнес поиска.

Битва за поиск

Уже в декабре, почти сразу после релиза, ChatGPT провозгласили потенциальным «убийцей Google». С помощью таких чат-ботов уже в ближайшем будущем вполне может измениться сама парадигма поиска, посчитали специалисты. Вместо списка ресурсов, где можно найти ответ, будет появляться сам ответ даже на самый сложный вопрос. «Смерть Google» через один-два года предсказал создатель Gmail Пол Букхайт: «ИИ заместит привычную страницу поисковой выдачи, на которой они (Google) делают больше всего денег. Даже если они догонят в области ИИ, это все равно разрушит самую прибыльную часть их бизнеса».

Сам Google всерьез задумался о такой перспективе. По данным The New York Times, после того как бот конкурентов начал быстро набирать популярность, в компании объявили «красный код», что означает, что компания столкнулась с серьезной проблемой и все должны быть готовы заниматься ее решением. Руководство техногиганта провело серию встреч, где обсуждалась новая стратегия развития ИИ-подразделения. Наконец, глава Google Сундар Пичаи попросил включиться в обсуждение отошедших от дел основателей Google Сергея Брина и Ларри Пейджа. На этой неделе Брин отправил первый за несколько лет запрос на доступ к коду Google, пишет Forbes. Сооснователь компании изучает LaMDA — конкурирующую с ChatGPT разговорную нейронную языковую модель, которую разрабатывает техногигант.

Информации о разработке Google в открытом доступе не так много. LaMDA — «революционную технологию общения» — в компании представили еще весной 2021 года, но общедоступного сервиса из него пока так и не сделали. Тем не менее Google уже открыла предварительную запись для желающих протестировать чат-бот. Компания также попросила своих сотрудников протестировать сделанный на LaMDA чат-бот Apprentice Bard, а также начала тестировать несколько вариантов дизайна поисковой страницы с возможностью вести диалог с ИИ.

Под натиском конкурента Google решил заметно ускориться со всеми релизами и презентациями результатов работы ИИ-подразделения. На звонке с инвесторами в четверг Пичаи заверил, что техногигант покажет собственный чат-бот уже в ближайшие недели. Кроме того, 8 февраля компания проведет внезапный ивент, посвященный тому, как Google использует возможности ИИ, чтобы сделать поиск более «естественным и интуитивно понятным, чем когда-либо прежде» (посмотреть презентацию можно будет здесь в 16:30 по мск).

Еще одна важная новость, сигнализирующая о внимании Google к теме ИИ, — $300 млн инвестиций в стартап выходцев из OpenAI Anthropic, говорят эксперты. Компания разрабатывает собственный чат-бот Claude, который пока не был представлен широкой публике (раньше главным инвестором Anthropic был фонд Alameda основателя FTX Сэма Бэнкмана-Фрида). В этом раунде Anthropic получит оценку в $5 млрд.

Сама Open AI выбрала для разработки ChatGPT другого стратегического партнера: в январе Microsoft подтвердила «многомиллиардные инвестиции» в проект. Впервые техногигант вложился в разработчика ИИ еще в 2019 году, инвестировав сразу $1 млрд. В январе 2023 года журналисты выяснили, что Microsoft готовится инвестировать в OpenAI еще $10 млрд и интегрировать новую, еще не выпущенную версию нейросети GPT-4 в свои офисные программы. А вскоре стало известно, что c помощью GPT-4 Microsoft собирается сделать новую версию поисковика Bing, который будет использовать чат-бот для ответа на запросы. Произойти это может уже в марте.

О накале страстей в этой гонке довольно наглядно свидетельствует и тот факт, что сам ChatGPT появился практически случайно. OpenAI очень «боялась проиграть конкурентам», выяснил NYT. О планах запуска чат-бота ее собственные сотрудники узнали только за две недели до релиза — и оказались в замешательстве, ведь весь год команда работала не над ним, а над новым поколением языковой модели GPT-4, которая должна превзойти предыдущую по всем показателям. Эта модель могла появиться уже в начале 2023 года, но топ-менеджмент OpenAI решил не рисковать и не ждать, пока конкуренты запустят свои чат-боты.

Успех ChatGPT стал для команды полной неожиданностью. Разработчики OpenAI до последнего опасались, что бот на языковой модели двухлетней давности мог показаться пользователям «скучным». Кроме того, из-за наплыва пользователей оказались перегружены вычислительные мощности и начались сбои. А еще руководство компании стало опасаться, что излишнее внимание и разные злоупотребления (вроде все тех же сгенерированных рефератов и дипломов) привлекут к технологии ненужное внимание регуляторов.

Гонка вооружений

Как бы то ни было, начало «гонке вооружений» в ИИ положено. Вслед за крупнейшими игроками планы на запуск похожих продуктов стали строить и другие IT-компании. Например, китайская Baidu готовит к релизу свой аналог чат-бота, который также может встраивать в поисковик. Свои разработки в 2023 году планируют представить британская «дочка» Alphabet — компания DeepMind. Ее чат-бот должен будет давать ответы, подкрепленные конкретными источниками (чего нет у ChatGPT), чтобы минимизировать число «небезопасных и неуместных» ответов.

О собственных планах запустить похожий продукт на этой неделе заявил и «Яндекс». Речь про чат-бот на модели YaLM 2.0, которую разрабатывают в компании. Первые такие сервисы могут появиться уже до конца 2023 года, писали «Известия».

Дело не просто в удачном релизе конкурента. Подобные нейросети разрабатывают многие компании, говорит руководитель отдела компьютерного зрения и ML-приложений «Яндекса» Константин Лахман. Сейчас в мире уже накоплена большая база публикаций по исследованиям в этом направлении, на которую опираются все крупные игроки — и OpenAI, и Google, и «Яндекс». «И мы, и все остальные компании находим там интересные идеи, которые потом используем у себя и на их основе пытаемся улучшить качество собственных алгоритмов», — говорит он. Говорить о том, что у OpenAI не было и нет конкурентов, было бы абсурдно.

«В этом [ChatGPT] нет ничего революционного, хотя именно так это воспринимается публикой», — заявил на этой неделе вице-президент Meta (запрещена в России) и ведущий ИИ-специалист компании Ян Лекун. Такие системы есть и у других компаний, просто они не получили популярность ChatGPT, добавил он.

Более того, нейросети и технологии машинного обучения используются в поиске уже давно. «Практически вся информация, которую мы потребляем на разных платформах, рекомендована нам алгоритмами», — объясняет Лахман. Генеративные текстовые нейросети используются для формирования коротких ответов, коллажей и карточек. Поэтому все громкие заголовки про «убийцу Google» и смерть поисковиков кажутся надуманными: нейросети не убьют поиск, а сделают его лучше, считает эксперт. И поисковики тоже не убьют, ведь поисковики — это просто инструмент, который и так постоянно меняется.

Сам механизм поиска документов в интернете критически важен — генеративные нейросети могут использовать найденные источники в качестве основы для формирования своего ответа. «Одна конкретная нейросеть не сможет вобрать в себя все знания мира. Гораздо легче научить ее использовать найденную информацию», — объясняет Лахман.

ChatGPT — это эволюция более ранних моделей, при этом у новых моделей появляются новые технологические и продуктовые свойства, говорит эксперт. И в этом смысле релиз GPT-3 двухлетней давности был не менее удивительным, чем появление ChatGPT, говорит Лахман: «Просто для человека до того, как модель превзойдет какой-то определенный порог, она будет казаться глупой. А после — станет умной. Но на самом деле процесс эволюции, который проходят нейросети, — непрерывный, хотя нам и может казаться, что до этого прорыва ничего не было».

У российских компаний действительно есть наработки в этой сфере, говорит сооснователь Intento и специалист по ИИ и анализу данных Григорий Сапунов. У «Яндекса» — довольно серьезная YaLM, у «Сбера» — ruGPT. Есть у компаний и свои суперкомпьютеры. «Но из-за отсутствия поставок нового современного железа в страну разрыв с лидерами будет увеличиваться», — считает эксперт. «Ресурсов никогда не бывает достаточно, потому что идей всегда будет больше. Мы находимся в ситуации, когда нам нужно творчески подходить к тому, какое железо мы используем. Да, мы не можем просто взять железо, которое все используют, и сделать все на нем. Но мы что-то придумываем», — говорит Лахман.

Не такой уж «убийца»

Предвосхищать разгром Google и других поисковиков после релиза ChatGPT действительно не стоит, считают и в Morgan Stanley. Хотя новые сервисы несут для Google угрозу, компания обладает большим преимуществом в виде миллиардов пользователей, пишет аналитик банка Брайан Новак. По данным Similarweb, в конце 2022 года поисковая доля Google в мире составляла более 90%, тогда как доля Bing, потенциального партнера OpenAI, не достигала и 3%. Более того, сам Google инвестирует миллиарды долларов в искусственный интеллект — только за последние три года компания потратила на исследования и разработки более $100 млрд, и ее расходы на это направление в ближайшие годы будут только расти.

Говорить о победе чат-ботов над поисковиками рано и по другой причине — пока что генеративные модели допускают слишком много серьезных ошибок. Эксперты, которых опросил Insider, сошлись во мнении, что ChatGPT часто не отличает факты от фейков, а в некоторых случаях может вообще придумывать ответы (исследователи ИИ это явление называют «галлюцинациями»).

В Nature уже предупредили, что использование генеративного ИИ для исследований может привести к неточностям и плагиату. Например, когда авторы текста задали ChatGPT вопрос: «Сколько пациентов с депрессией переживают рецидив после лечения?», они получили слишком общий ответ, утверждающий, что эффект от лечения, как правило, долговременен. «Тем не менее многочисленные высококачественные исследования показывают, что эффект лечения ослабевает, а риск рецидива колеблется от 29% до 51% в течение первого года после завершения лечения», — пишут исследователи. Даже глава самой OpenAI Сэм Альтман писал, что «было бы ошибкой полагаться на [ChatGPT] в чем-то важном прямо сейчас».

Другая немаловажная проблема чат-ботов, подобных ChatGPT, — использовать их очень дорого. Для того чтобы ответить на один вопрос, чат-боту требуется гораздо больше вычислительных мощностей, чем Google для выдачи ответа в поисковике. В декабре Альтман написал, что один чат с ботом стоит несколько центов (в Morgan Stanley оценили его в 2 цента — это примерно в семь раз дороже запроса в Google). На первый взгляд может показаться не дорого, но если представить, что чат-бот будут использовать в том же объеме, что и поиск Google, то общение с ним будет стоить по крайней мере $100 млн в день.

Наконец, собирать огромные объемы данных и дообучать модели также очень дорого — расходы исчисляются сотнями миллионов долларов даже без учета затрат на специализированных инженеров, говорят эксперты (тот же ChatGPT пока что обучен на данных лишь до середины 2021 года). При этом чем сложнее модель и чем больше в ней параметров, тем это будет дороже.

Например, у ChatGPT сейчас 175 млрд параметров — это делает модель такой универсальной, но одновременно и крайне энергоемкой. Даже с учетом того, что партнерство с Microsoft открывает для OpenAI доступ к инфраструктуре Azure, полностью заменить поиск чат-ботом пока что кажется недостижимой утопией.

Скорее всего, будущее поиска — в гибриде нынешней модели и чат-бота, рассуждает Сапунов. Как минимум в запросах, которые не подразумевают один правильный ответ, хороший чат-бот был бы гораздо полезнее простой поисковой выдачи страниц из интернета. Так что можно ожидать, что-либо использование чат-ботов в поиске будет ограничено какими-то конкретными классами запросов, либо чат-бот будет доступен по отдельной подписке. Кроме того, важно помнить, что поиск — далеко не единственная сфера, где чат-боты окажут огромное влияние, напоминает эксперт. Также важно и то, что большой прорыв одновременно происходит и в генерации изображений (а в будущем его стоит ждать и в видео), и в написании кода. «На стыке всего этого произойдет еще много интересного», — резюмирует он.

Хорошая новость заключается в том, что интерес к ChatGPT привлечет больше денег в ИИ, пишет Новак из Morgan Stanley. Искусственный интеллект, похоже, становится «новой большой идеей» на Уолл-стрит: объем торгов акциями компаний C3.ai, SoundHound AI, BigBear.ai и других компаний, использующих ИИ и машинное обучение, резко вырос. К примеру, акции производителя ПО на основе ИИ и ML BigBear.ai на этой неделе подорожали на 65%, а объем торгов превысил средний за последние три месяца в 22 раза, писал автор нашей инвестрассылки Вячеслав Дворников (подписаться на нее можно здесь).

СДЕЛКИ

«Яндекс» выкупает долю Uber в СП

«Яндекс» все-таки решился на выкуп у Uber 29% доли в совместном предприятии MLU B.V., которое управляет «Яндекс.Такси», Yango и Uber в России. Это СП появилось в 2018 году, и сначала у компаний были большие планы на совместное будущее.

Но к 2021 году ситуация изменилась, и «Яндекс» принялся увеличивать свою долю, а затем и вовсе получил право выкупить акции Uber целиком. Цена тогда была определена в диапазоне $1,8–2 млрд, срок — два года. Но 2022-й внес коррективы: стоимость активов после начала войны сильно просела. Изменились и сроки: Uber еще в марте начал искать возможность побыстрее избавиться от оставшихся российских активов.

В итоге за долю Uber «Яндекс» предложил $925 млн. Ровно столько, сколько в конце декабря американской компании, по информации «Агентства», предлагал основатель Kismet Capital Group и экс-глава «Мегафона» Иван Таврин. Эта цена оказалась гораздо выше той, что изначально собирался заплатить «Яндекс», говорили собеседники The Bell, знакомые с ситуацией. А источник Forbes отметил, что вмешательство Таврина сыграло на руку Uber, который хотел продать актив подороже, и «Яндекс» в итоге пришлось предложить цену даже с «небольшой премией» к предложению Таврина. Правда, чтобы сделка состоялась, ее еще должна одобрить правительственная комиссия по контролю за иностранными инвестициями. А она обычно не разрешает российским компаниям выкупать иностранцев, решивших уйти из России после начала войны, без существенного дисконта.

ОНЛАЙН-РАССЛЕДОВАНИЕ

Что можно узнать из аудиозаписи и как сохранять телефонные разговоры

Проверка аудио — одно из самых слабо разработанных направлений работы с открытыми данными. Зачастую звук наложен на видео, и для его проверки используют инструменты верификации видеофайлов. Но, чтобы убедиться в том, что попавшая к вам аудиозапись — не фейк, лучше пользоваться специальными программами для анализа аудио. О них мы и расскажем в новом материале нашей регулярной рубрики «Онлайн-расследование».

🔎 Большая часть журналистских расследований основывается на открытых данных. По воскресеньям в рубрике «Онлайн-расследование» специальный корреспондент The Bell Ирина Панкратова рассказывает о методах расследования в сети, доступных каждому. С их помощью вы можете проверить любую сомнительную информацию — это не только интересно, но и полезно.

БИГТЕХИ

Взлеты и провалы бигтехов

На прошлой неделе отчитывался Microsoft, на этой — остальные бигтехи, на которые все еще приходится значительная доля рыночной капитализации. Их акции показывают уверенный рост с начала года благодаря снижению опасений по поводу роста ставок, но отчет за прошлый квартал и — что более важно — прогнозы на будущее должны были стать серьезным испытанием. На ключевые бизнесы компаний ожидаемо негативно повлияло замедление спроса. В свежем выпуске нашей инвестрассылки рассказываем, как они отчитались и на что обратили внимание рынки в прогнозах на будущее (подписаться на рассылку можно здесь).

#ChatGPT #технологии