Генеративный искусственный интеллект. Как ИИ меняет нашу жизнь и работу - Нума Дхамани
Книгу Генеративный искусственный интеллект. Как ИИ меняет нашу жизнь и работу - Нума Дхамани читаем онлайн бесплатно полную версию! Чтобы начать читать не надо регистрации. Напомним, что читать онлайн вы можете не только на компьютере, но и на андроид (Android), iPhone и iPad. Приятного чтения!
Шрифт:
Интервал:
Закладка:
«Одна из самых блестящих возможностей – то, что ИИ может углублять наше понимание информации и более эффективно преобразовывает ее в полезное знание, облегчая людям доступ к сути того, что они ищут, и помогая выполнить задачу»4.
Другими словами, если обычно люди обращаются к Google или другой поисковой системе за рекомендацией или информацией, то сейчас или в будущем смогут использовать ИИ, чтобы получить более краткий и быстрый ответ, а не просматривать все результаты поиска. Хотя поиск может показаться просто еще одним применением LLM, он способен привести к огромным изменениям, поскольку является отправной точкой для многих ситуаций использования сети. Если LLM смогут успешно заменить даже часть поискового трафика, это вызовет значительный скачок в осведомленности и использовании генеративного ИИ среди широкой публики. Но тогда возникнут вопросы по бизнес-модели этих LLM, поскольку большинство современных поисковых систем зарабатывают деньги, предлагая платное размещение в результатах поиска. LLM еще не нашли широкого рынка для монетизации (в настоящий момент монетизация ограничивается платными подписками на расширенные услуги), поэтому в ближайшее время, несомненно, этот вопрос будет в центре внимания их владельцев.
Все вышеупомянутые интеграции являются примерами того, как меняется интерфейс: от запросов или кнопок к естественному языку. В самом амбициозном случае предполагается, что LLM станет основным интерфейсом для взаимодействия человека и компьютера по умолчанию. Люди уже знают и используют язык, а если компьютеры начнут понимать тот же самый язык, то нам не понадобится так много меню и элементов управления – язык станет интерфейсом, и тогда люди смогут задавать вопросы и давать обратную связь модели подобно тому, как это происходит в общении с другим человеком. Следующее поколение моделей (начиная с GPT‐4) также будет все более мультимодальным [94] и сможет обрабатывать изображения, а вскоре и другие виды медиа [95].
8.1.2. LLM-агенты открывают новые возможности
Как упоминалось в главе 6, мы думаем, что LLM будут все больше наделяться качествами агентов и они смогут взаимодействовать со средой для совершения покупок и других действий на основании разговора с пользователями. На рис. 8.1 показаны основные функциональные возможности LLM-агента, который пытается выполнить задачу с помощью внешнего инструмента или набора инструментов. В этом примере пользователь вводит промпт «Найди мне рубашку стоимостью менее 15 долларов», который модель преобразует в поисковый запрос для торгового API. API выполняет запрос, и среда – в данном случае интернет-магазин или торговая площадка – выдает результаты, которые LLM показывает пользователю. В других версиях LLM может по-настоящему совершать покупку от имени пользователя.
Рис. 8.1. Общая схема работы LLM-агента
Первые исследования показали, что в некоторых случаях LLM может довольно эффективно использовать внешние инструменты. В феврале 2023 года группа исследователей из Meta [96] опубликовала статью под заголовком «Toolformer: языковые модели могут самостоятельно научиться пользоваться инструментами» (Toolformer: Language Models Can Teach Themselves to Use Tools)5. Они показали, как LLM под названием Toolformer – хотя ей было сложно решать определенные задачи, например по арифметике, – смогла научиться, в каких ситуациях для выполнения задачи необходимо вызывать внешние API, при этом ей было показано лишь несколько примеров. Модель Toolformer использовала такие инструменты, как поисковая система, калькулятор, API календаря и две другие LLM: переводчик и модель, прошедшую тонкую настройку для ответов на вопросы. В главе 5 мы рассмотрели механизм поиска внешней информации в интернете как инструмент, который помогает снизить частоту галлюцинаций, поскольку после поиска неизвестной для модели информации уже не нужно генерировать догадки. С помощью внешних инструментов можно устранить и другие недостатки LLM.
Кроме того, если LLM могут всего по нескольким примерам научиться вызывать API, возможности системы в целом значительно расширятся. Например, LLM может не только генерировать код, но и выполнять его. В документации к агенту LLM, созданному на LangChain для работы с датафреймами Pandas [97], сказано, что на вопрос типа «Каков средний возраст?», агент может написать необходимый код на языке Python, запустить его на датафрейме и выдать ответ пользователю. LLM-агенты необходимы для полной автоматизации задач, в которых выполняются разные операции помимо генерации текста. Однако у таких моделей есть обратная сторона: если LLM допустит ошибку, это повлечет за собой реальные последствия, а не просто генерацию небезопасного или некорректного текста. На главной странице агента по работе с данными Pandas жирным шрифтом написано предупреждение на этот счет:
«ПРИМЕЧАНИЕ. „За кадром“ этот агент вызывает Python-агента, который выполняет код, сгенерированный LLM, – это может привести к плохим последствиям, если LLM сгенерировала опасный код на Python. Используйте с осторожностью»6.
В настоящее время основным препятствием для внедрения LLM-агентов является отсутствие гарантии, что не будут допущены опасные ошибки, поскольку генерации модели носят вероятностный характер.
Как отмечалось в главе 6, наиболее креативные LLM-агенты создаются сообществом разработчиков свободного ПО. Всплеск активности – Андрей Карпаты в мае 2023 года назвал его «первыми признаками кембрийского взрыва»7 – отчасти стал возможен благодаря нескольким достижениям, которые сделали LLM более эффективными, а следовательно, более быстрыми и дешевыми для тонкой настройки и обслуживания. LLM также использовались для обучения языковых моделей меньшего размера, которые смогут добиться производительности в решении определенных задач, сравнимой с большими моделями, при этом снижая затраты и барьеры для входа8. Общий эффект от этого заключается в том, что теперь еще больше людей могут создавать новые приложения, используя языковые модели, а это означает, что мы можем увидеть новые области применения этих агентов. Более подробно о трендах в сообществе разработчиков свободного ПО мы поговорим в главе 9.
8.1.3. Волна персонализации
Эра персонализации наступит неминуемо. Существует популярный образ робота вроде R2-D2 [98]: всезнающий помощник, который служит одному человеку, изучает его предпочтения, чтобы их опыт общения стал приятным и персонализированным. Продукты LLM, включая ChatGPT, уже позволяют указывать в профиле ту информацию о пользователях, которую, по их мнению, модель должна запомнить. Например, если кто-то часто использует чат-бот для обсуждения планов на неделю, то этот человек может захотеть добавить информацию о своем местоположении, роде занятий и интересах. LLM затем будет опираться на эту информацию, что повысит вероятность полезных пользователю ответов.
Наряду с текущими исследованиями, направленными на повышение эффективности LLM, частные компании, научные круги и сообщество разработчиков
Прочитали книгу? Предлагаем вам поделится своим отзывом от прочитанного(прослушанного)! Ваш отзыв будет полезен читателям, которые еще только собираются познакомиться с произведением.
Уважаемые читатели, слушатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.
- 1. Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации.
- 2. Просьба отказаться от оскорблений, угроз и запугиваний.
- 3. Просьба отказаться от нецензурной лексики.
- 4. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.
Надеемся на Ваше понимание и благоразумие. С уважением, администратор knigkindom.ru.
Оставить комментарий
-
Гость Читатель23 март 22:10
Адмну, модератору....мне понравился ваш сайт у вас очень порядочные книги про попаданцев....... спасибо...
Маринка, хозяйка корчмы - Ульяна Гринь
-
Гость Читатель23 март 20:10
Книга понравилась, хотя я не любитель зоологии...... но в книге все вполне прилично и порядочно, не то что в других противно...
Кухарка для дракона - Ада Нэрис
-
Гость Галина22 март 07:37
Очень интересная книга, тема затронута актуальная для нашего времени. ...
Перекресток трех дорог - Татьяна Степанова
