Искусственный интеллект. Краткая история будущего - Тоби Уолш
Книгу Искусственный интеллект. Краткая история будущего - Тоби Уолш читаем онлайн бесплатно полную версию! Чтобы начать читать не надо регистрации. Напомним, что читать онлайн вы можете не только на компьютере, но и на андроид (Android), iPhone и iPad. Приятного чтения!
Шрифт:
Интервал:
Закладка:
В целом, IBM инвестировала много миллионов долларов и потратила несколько лет усилий на создание Watson. Суперкомпьютер, на котором работал Watson, обошелся примерно в три миллиона долларов. Однако сегодня ChatGPT может посоревноваться бесплатно с помощью простого запроса. Давайте посмотрим.
Я: Пересекая северную границу Флориды, вы сможете оказаться только лишь в двух штатах. Ответь в форме вопроса, как на викторине Jeopardy!
ChatGPT: Что такое Джорджия и Алабама?
Я: Этот маневр изобретен в 1500-е годы для ускорения игры и включает две фигуры одного цвета.
ChatGPT: Что такое рокировка в шахматах?
Я: Техника вышивания цветочных узоров шерстяными нитками по хлопковой ткани.
ChatGPT: Что такое якобинская вышивка?
Я: 8 сентября 1974 года был помилован президентом.
ChatGPT: Кто такой Ричард Никсон?
Я: В 1594 году устроился на работу сборщиком податей в Андалусии.
ChatGPT: Кто такой Мигель де Сервантес?
Я: Его самый крупный аэропорт назван в честь героя Второй мировой войны, а второй по величине – в честь сражения во время Второй мировой войны.
ChatGPT: Что такое Чикаго?
Исторический вопрос был финальным в матче Watson против Дженнингса и Раттера. Watson дал ответ «Торонто», несмотря на то что категория была «города США». Хотя ChatGPT и ответил правильно, это не настоящий тест, поскольку этот вопрос (и ответ на него), несомненно, уже есть в обучающих данных ChatGPT.
Анализ производительности программы Watson во время матча не показал, что при ответе на вопросы она лучше, чем действующие чемпионы, но лучше в азартных играх, поскольку более точно способна просчитать вероятность правильного ответа и сделать соответствующую ставку. Такая способность компьютеров высчитывать вероятности подводит нас к шестой и завершающей идее, объясняющей достигнутый в создании искусственного интеллекта прогресс. Ее мы рассмотрим в следующей главе.
ЧЕЛОВЕЧЕСКАЯ ОБРАТНАЯ СВЯЗЬ
Хотелось бы закончить эту главу рассказом об успехе обучения с подкреплением на примере ChatGPT. Наверное, вы помните, что для создания семейства больших языковых моделей GPT компания OpenAI взяла за основу модель трансформера, разработанную Google, и активно ее масштабировала. Но чтобы перейти от GPT–3 к ChatGPT, добавился один новый и важный компонент: обучение с подкреплением на основе человеческой обратной связи.
Большие языковые модели по типу GPT–2 и GPT–3 вели себя так, как будто у них дефицит внимания. Возможно, вы также помните, что такие модели случайны и каждый раз выдают разный ответ. Проблема случайности заключается в том, что игральная кость в итоге играет против тебя. Математики называют это «задачей о разорении игрока». В моделях GPT–2 и GPT–3 такое явление проявляется отвлечением внимания. Они пишут предложения, быстро предсказывая следующее слово. Однако в результате предсказывается слово, которое отклоняет выходные данные в случайном и нежелательном направлении. Позвольте привести пример. Я попросил GPT–2 продолжить фразу «Фотосинтез – это…». И модель выдала следующее:
«ФОТОСИНТЕЗ – ЭТО процесс, благодаря которому живые существа растут и производят собственную энергию…».
Но затем он сбился с пути:
«…и углекислый газ (СО2)».
В результате фотосинтеза получается кислород, а не углекислый газ. Модель GPT–2 сделала еще больше ошибок в следующем предложении:
«Большинство растений и животное фотосинтезируют углерод одним из двух способов».
Данный ответ грамматически неверен. Должно быть «животные», а не «животное». Но что более существенно, животные не обладают функцией фотосинтеза, хотя некоторые из них и вступают в симбиотические отношения с водорослями и цианобактериями, которые фотосинтезом обладают.
Обучение с подкреплением на основе человеческой обратной связи помогает решить эту проблему. На одном из обучающих этапов людей спрашивают, какой из двух возможных ответов большой языковой модели они предпочитают. Человеческая обратная связь обеспечивает внесение корректных данных в модель. Если человек отклоняет расистские и сексистские ответы, то модель учится выдавать лучшие ответы.
С момента привлечения человека обучение с подкреплением стало дорогой деятельностью, но благодаря этому значительно улучшились большие языковые модели. Такой способ обеспечивает беспорядочное обучение на базе интернет-данных, без повторений ошибочной информации, пропаганды, конспирологических теорий, расизма и сексизма, найденного в сети. В довершение всего разработчики больших языковых моделей вручную кодируют ограничения, пытаясь отфильтровать наиболее оскорбительный, опасный и незаконно генерируемый контент.
В целом, это невероятно, насколько хорошо можно создавать большие языковые модели, используя метод обучения с подкреплением и учитывая низкое качество многих данных, на которых они обучаются!
Идея № 6:
Размышление об убеждениях
Мы подошли к шестой и заключительной идее, использующейся в создании систем на основе искусственного интеллекта. Мир нестабилен, следовательно, системам необходимо справляться с неопределенностью при взаимодействии с миром. Насколько беспилотный автомобиль уверен, что сейчас безопасно совершить обгон? Какова вероятность, что алгоритм компьютерного зрения, анализируя рентгеновский снимок, сделает вывод, что рака нет? Или каковы шансы, что именно это входящее письмо окажется спамом?
К счастью, 250 лет назад преподобный Томас Байес, пресвитерианский священник из Танбридж-Уэллса в графстве Кент, предложил основательный подход, как справляться с неопределенностью. А именно, он вывел теорему, в соответствии с которой компьютеры получили новый способ вычисления вероятностей. Простой пример поможет понять силу теоремы Байеса.
Данный пример предполагает техническое описание, но уверяю вас, что он стоит того, а вы вполне справитесь с его пониманием. Вы подходите к концу этой краткой истории искусственного интеллекта, соответственно, теперь вы практически эксперт в этой области. Просто представьте, что через две страницы вы сможете похвастаться, что смогли самостоятельно вывести теорему Байеса, начиная с самого первого условия! Оставайтесь со мной.
Предположим, что вы моделируете детектор коронавируса COVID–19, основанный на типе кашля, и вы решили обучить этому нейронную сеть. Прочитав несколько книг об искусственном интеллекте, для достижения своей цели вы используете модель на базе трансформера для обнаружения своего рода плохого кашля, который характерен для коронавируса. И кажется, что все отлично работает. Но как вы можете в этом убедиться? Здесь нам поможет теорема Байеса. Вы хотите вычислить точность вашего детектора, а если точнее, вычислить вероятность того, что у человека есть коронавирус (ваша гипотеза), учитывая, что детектор воспринимает кашель как подозрительный (ваше наблюдение). Переведем в символы:
вероятность (есть коронавирус | подозрительный кашель)
Это «вероятность» того, что у человека «есть коронавирус», учитывая (вертикальная черта «|»), что у него «подозрительный кашель».
Вычислить условную вероятность напрямую не так уж и сложно. Вам необходимо предоставить вашему детектору тысячи аудиофайлов, а затем клинически проверить, что десятки людей, у которых по результатам детектора
Прочитали книгу? Предлагаем вам поделится своим отзывом от прочитанного(прослушанного)! Ваш отзыв будет полезен читателям, которые еще только собираются познакомиться с произведением.
Уважаемые читатели, слушатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.
- 1. Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации.
- 2. Просьба отказаться от оскорблений, угроз и запугиваний.
- 3. Просьба отказаться от нецензурной лексики.
- 4. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.
Надеемся на Ваше понимание и благоразумие. С уважением, администратор knigkindom.ru.
Оставить комментарий
-
Гость Любовь17 июнь 11:07
Прочитала залпом,интересный сюжет, захватывает с первых фраз.Чтение произведения доставило мне огромное удовольствие...
(Не)нужная жена дракона на вес золота - Татьяна Бэк
-
Гость Ольга16 июнь 22:43
Легкий детектив Натальи Андреевой. Знакомый герой. Домбай!...
Пин-код на приворот - Наталья Вячеславовна Андреева
-
Ма15 июнь 02:32
Что это вообще было и зачем? Столько мерзости и грязи вместить на 18 стр это надо хорошо постараться!!🤢 Я часто читаю...
Кира: Как я стала его мусором - Кира Невин
