Anthropic выпустила публичную версию Mythos с заблокированными возможностями в сфере кибербезопасности
The Bell
Anthropic объявила о релизе Claude Fable 5 — это версия для широкой аудитории модели Mythos, которую ранее компания отказалась выпускать широко из-за рисков в сфере кибербезопасности.
Fable 5 построена на той же архитектуре, что и Mythos, но оснащена встроенными классификаторами, которые перехватывают запросы в трех категориях: кибербезопасность, биология и химия, а также попытки «перегнать» модель для обучения конкурирующих систем. При срабатывании блокировки запрос автоматически переходит к Claude Opus 4.8. По данным Anthropic, такое переключение происходит менее чем в 5% сессий.
Надежность этих ограничений — открытый вопрос. Внешние исследователи неоднократно показывали, что защитные барьеры ИИ-моделей поддаются обходу, указывает NYT.
Одновременно для около 200 организаций, включая структуры американского правительства, вышел Claude Mythos 5 — та же модель, что и Fable 5, но с частично снятыми ограничениями.
Цена моделей одинакова: $10 за млн входных токенов и $50 за млн выходных — вдвое дороже Claude Opus 4.8. По словам главы продуктового управления Anthropic Дайанн Пенн, более высокая стоимость компенсируется эффективностью: более умная модель решает задачи с меньшим числом токенов.
Релиз Fable 5 пришелся на горячий момент для рынка ИИ. На прошлой неделе Anthropic конфиденциально подала проспект IPO в SEC при оценке $965 млрд — выше, чем у OpenAI ($852 млрд), OpenAI подала свой проспект в понедельник. В пятницу на биржу выходит SpaceX.