Компания Anthropic представила ИИ Claude 3, набор моделей искусственного интеллекта, которые, по ее словам, являются самыми быстрыми и мощными на сегодняшний день. Новые инструменты называются Claude 3 Opus, Sonnet и Haiku.
Компания заявила, что самая способная из новых моделей, Claude 3 Opus, превзошла GPT-4 от OpenAI и Gemini Ultra от Google в отраслевых тестах, таких как знания на уровне бакалавриата, рассуждения на уровне выпускника и основы математики.
Мультимодальная поддрежка
Впервые Anthropic предлагает мультимодальную поддержку. Пользователи могут загружать фотографии, диаграммы, документы и другие типы неструктурированных данных для анализа и получения ответов.
Другие модели, Sonnet и Haiku, более компактны и дешевле Opus. Sonnet и Opus уже доступны в 159 странах , в то время как Haiku появится в ближайшее время. Компания отказалась уточнить, сколько времени потребовалось на обучение Claude 3 или сколько это стоило, но сообщила, что такие компании, как Airtable и Asana, помогли протестировать модели.
Взлет стартапа
В прошлом году Anthropic рассматривался как многообещающий стартап с генеративным ИИ, основанный бывшими руководителями OpenAI research. Он завершил раунды финансирования серий A и B, но выпустил только первую версию своего чат-бота без какого-либо доступа потребителей или большой шумихи.
Через год чат-бот стал одним из самых популярных стартапов в области искусственного интеллекта, поддерживаемый Google, Salesforce и Amazon. Продукт напрямую конкурирует с ChatGPT корпоративном и в потребительском секторе. За прошедший год стартап заключил пять различных сделок по финансированию на общую сумму около 7,3 миллиарда долларов.
Рынок ИИ
За прошедший год сфера генеративного искусственного интеллекта стремительно развивалась: в 2023 году было инвестировано рекордных 29,1 миллиарда долларов в почти 700 сделок, что более чем на 260% больше, чем годом ранее, согласно PitchBook. Квартал за кварталом эта фраза становится самой популярной в корпоративных отчетах о доходах. Ученые и специалисты по этике высказывают серьезные опасения по поводу развития технологии (to propagate bias). В итоге она быстро проникла в школы, онлайн-путешествия, медицинскую индустрию, онлайн-рекламу и многое другое.
История создания ИИ Claude 3
Над базовой моделью искусственного интеллекта работало от 60 до 80 человек. Над ее техническими аспектами работало от 120 до 150 человек, рассказала в интервью соучредительница Anthropic Даниэла Амодей. В последней итерации модели искусственного интеллекта непосредственно над ней работала команда из 30-35 человек, а всего ее поддерживали около 150 человек, сообщил Амодей в июле.
В Антропике сказали, что ИИ Claude 3 может обобщить примерно 150 000 слов или большую книгу (размер “Моби Дика” или “Гарри Поттера и даров смерти”). Его предыдущая версия могла суммировать только 75 000 слов. Пользователи могут вводить большие наборы данных и запрашивать резюме в виде памятки, письма или истории. ChatGPT может обрабатывать около 3000 слов.
Амодей также сказала, что ИИ Claude 3 лучше понимает риски при “реагировании”, чем его предыдущая версия.
“В стремлении создать в высшей степени безвредную модель Claude 2 проявлял консервативность в ответах на эти вопросы”.
Согласно Anthropic, Claude 3 обладает более тонким пониманием подсказок.
Про мультимодальность
Мультимодальность, или добавление таких опций, как возможности фото и видео в генеративный искусственный интеллект, независимо от того, загружаете ли вы их самостоятельно или создаете с использованием модели искусственного интеллекта, быстро стала одним из самых популярных вариантов использования в отрасли.
“Мир мультимодален”, – сказал в ноябре исполнительный директор OpenAI Брэд Лайткэп. “Если вы подумаете о том, как мы, люди, воспринимаем мир и взаимодействуем с ним. Мы видим вещи, мы слышим вещи, мы говорим вещи — мир намного больше, чем текст. Поэтому нам всегда казалось неполноценным, чтобы текст и код были едиными модальностями, едиными интерфейсами. Которые мы могли бы использовать для определения того, насколько мощны эти модели и что они могут делать”.
Риски создания ИИ
Но мультимодальность и все более сложные модели ИИ также приводят к увеличению потенциальных рисков. Недавно Google отключил свой генератор изображений ИИ, являющийся частью чат-бота Gemini, после того, как пользователи обнаружили исторические неточности и сомнительные ответы, которые широко распространились в социальных сетях.
Claude 3 от Anthropic не генерирует изображения; вместо этого он позволяет пользователям только загружать изображения и другие документы для анализа.
“Конечно, ни одна модель не идеальна, и я думаю, что это очень важно знать заранее”, – сказала Амодей. “Мы очень “старательно старались” сделать эти модели максимально функциональными и безопасными. Конечно, будут места, где модель все еще время от времени что-то придумывает”.