Генеративный искусственный интеллект. Как ИИ меняет нашу жизнь и работу - Нума Дхамани
Книгу Генеративный искусственный интеллект. Как ИИ меняет нашу жизнь и работу - Нума Дхамани читаем онлайн бесплатно полную версию! Чтобы начать читать не надо регистрации. Напомним, что читать онлайн вы можете не только на компьютере, но и на андроид (Android), iPhone и iPad. Приятного чтения!
Шрифт:
Интервал:
Закладка:
Поскольку Microsoft хотела стать первой крупной технологической компанией, создавшей свой разговорный искусственный интеллект, она поспешно выпустила новый Bing, из-за чего на нее обрушилась волна критики. По данным новостного сайта The Verge, Microsoft изначально планировала запустить продукт в конце февраля 2023 года, но ускорила на пару недель, чтобы опередить Bard от Google51. Похоже, что для Microsoft победа над другими крупными игроками в гонке по запуску разговорного искусственного интеллекта далась за счет отказа от ответсвенного внедрения. Технологическая корпорация быстро отреагировала на безумные ответы чат-бота, установив ограничения на взаимодействия. На многие вопросы при таких ограничениях бот мог отвечать: «Извините, я предпочитаю не продолжать этот разговор. Я все еще учусь, поэтому ценю ваше понимание и терпение.». Кроме того, был установлен лимит на количество последовательных вопросов по одной теме, но вскоре Microsoft сняла ограничения и начала экспериментировать с новыми функциями.
1.6.4. LLaMa и Alpaca
В августе 2022 года транснациональный технологический конгломерат Meta [25], ранее известный как Facebook Inc.*, выпустил в США чат-бота BlenderBot52. Чат-бот был создан на основе модели Meta* OPT‐175B (Open Pretrained Transformer) и прошел масштабное исследование для создания механизма предотвращения генерации оскорбительных или опасных комментариев. Вскоре пользователи по всей стране стали критиковать BlenderBot за нападки на Facebook [26] (см. http://mng.bz/dd7v), распространение антисемитских теорий заговора (см. http://mng.bz/rjGe), за то, что он выдавал себя за Чингисхана или талибов (см. http://mng.bz/VRwW), и так далее.
В ноябре 2022 года была предпринята еще одна попытка: выпустили разговорный ИИ для научной работы под названием Galactica, который был обучен на 48 миллионах примеров из учебников, научных статей, веб-сайтов, конспектов лекций и энциклопедий (см. https://galactica.org/). Meta* попросила ученых опробовать эту публичную демоверсию, но уже через несколько часов люди стали публиковать галлюцинирующие или предвзятые ответы бота. Через три дня Meta* закрыла публичный доступ к боту, но для исследователей, которые хотели бы узнать больше о работе моделей, доступ остался открытым.
В следующий раз Meta* выбрала другой подход. Вместо того, чтобы запускать диалоговую систему в качестве готового продукта, компания выпустила несколько больших языковых моделей, чтобы другие исследователи могли заняться поиском решения таких проблем, как токсичность, предвзятость и галлюцинации, которыми страдают LLM. 24 февраля 2023 года Meta* публично представила серию больших языковых моделей Meta* AI, также известную как LLaMa53. Эти базовые модели были выпущены в конфигурациях с 7 миллиардами (7B), 13 миллиардами, 33 миллиардами и 65 миллиардами обучаемых параметров и снабжены подробным описанием того, как они были созданы. В своей исследовательской статье Meta* утверждает, что модель 13В, вторая наименьшая по размеру, превосходит GPT-3 по большинству критериев сравнения, а самая крупная модель с 65 миллиардами параметров конкурирует с лучшими большими языковыми моделями, такими как PaLM‐540 от Google54.
За выпуском LLaMa стояла цель – демократизировать доступ к большим языковым моделям, в частности путем выпуска компактных эффективных моделей, требующих небольших вычислительных ресурсов, поскольку тогда исследователи получат возможность изучать новые подходы и смогут найти решение для проблем, связанных с технологией. LLaMa была выпущена по некоммерческой лицензии для использования в исследовательских целях, и доступ к ней предоставлялся по запросу. Однако уже через неделю вся модель просочилась на веб-сайт 4chan и стала доступна для скачивания любому желающему55. Некоторые люди критиковали Meta [27] за чрезмерную «открытость» модели перед возможным ненадлежащим использованием, а другие утверждали, что свободный доступ к моделям – это важный шаг в создании более эффективных средств защиты. Для технологического конгломерата это стало началом скандала вокруг LLaMa.
Вскоре после этого, в марте 2023 года, исследователи из Стэнфордского университета представили чат-бота с искусственным интеллектом Alpaca, разработанного на основе модели LLaMa 7B (см. http://mng.bz/xjBg). Они выпустили веб-демонстрацию и заявили, что для тонкой настройки модели, обученной на 52 тысячах инструкций, потратили лишь 600 долларов. Всего неделю спустя исследователи из Стэнфорда удалили демонстрацию Alpaca, дополнив историю недолговечных чат-ботов Meta*. Несмотря на скромные затраты на создание демонстрации, ее хостинг обошелся недешево. У исследователей также возникли опасения по поводу галлюцинаций, безопасности, дезинформации и риска распространения вредного или токсичного контента. Их исследования и программный код доступны онлайн, что полезно для понимания вычислительных процессов и ресурсов, необходимых для разработки этой модели.
Компания Meta* выпустила 18 июля 2023 года Llama 2 – следующее поколение своей модели с открытым исходным кодом, сделав ее бесплатной для исследований и коммерческого использования. Они написали: «Мы верим, что современные большие языковые модели с открытым доступом будут также способствовать разработке полезного и более безопасного генеративного ИИ. Мы с нетерпением ждем возможности увидеть, что создаст мир с Llama 2»56.
1.7. Итоги
История технологии обработки естественного языка так же стара, как и сами компьютеры. Первым применением NLP, вызвавшим интерес еще в 1950‐х годах, был машинный перевод. И именно в области машинного перевода компанией Google в 2006 году был запущен первый коммерческий продукт.
Модели с архитектурой трансформера и изобретение механизма внимания стали крупнейшим прорывом в NLP за десятилетие. Механизм внимания пытается имитировать работу мозга человека, придавая «важность» наиболее релевантным фрагментам информации.
Недавний бум в области NLP был вызван растущей доступностью текстовых данных из интернета и развитием мощных вычислительных ресурсов. Это сделало возможным построение больших языковых моделей.
Современные LLM в основном обучаются самостоятельно на больших объемах текста из интернета, а затем проходят тонкую настройку с помощью обучения с подкреплением.
Модель GPT от OpenAI была одной из первых LLM общего назначения, предназначенных для решения широкого круга разнообразных задач на естественном языке. Подобные модели особенно хорошо справляются с генерацией текста и идеальны в роли чат-ботов. Кроме того, их можно тонко настроить под определенные задачи.
LLM универсальны и могут применяться в различных областях и сценариях использования, включая генерацию текста, вопросы и ответы, программирование, логические рассуждения, генерацию контента и прочее. С другой стороны, они подвержены рискам, например появлению скрытой предвзятости и галлюцинациям, кроме того, они оставляют значительный углеродный след.
Наиболее значимые большие языковые модели, предназначенные для ведения диалога, были выпущены OpenAI, Microsoft, Google и Meta [28]. Модель ChatGPT
Прочитали книгу? Предлагаем вам поделится своим отзывом от прочитанного(прослушанного)! Ваш отзыв будет полезен читателям, которые еще только собираются познакомиться с произведением.
Уважаемые читатели, слушатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.
- 1. Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации.
- 2. Просьба отказаться от оскорблений, угроз и запугиваний.
- 3. Просьба отказаться от нецензурной лексики.
- 4. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.
Надеемся на Ваше понимание и благоразумие. С уважением, администратор knigkindom.ru.
Оставить комментарий
-
Гость Читатель23 март 22:10
Адмну, модератору....мне понравился ваш сайт у вас очень порядочные книги про попаданцев....... спасибо...
Маринка, хозяйка корчмы - Ульяна Гринь
-
Гость Читатель23 март 20:10
Книга понравилась, хотя я не любитель зоологии...... но в книге все вполне прилично и порядочно, не то что в других противно...
Кухарка для дракона - Ада Нэрис
-
Гость Галина22 март 07:37
Очень интересная книга, тема затронута актуальная для нашего времени. ...
Перекресток трех дорог - Татьяна Степанова
