Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд
Книгу Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд читаем онлайн бесплатно полную версию! Чтобы начать читать не надо регистрации. Напомним, что читать онлайн вы можете не только на компьютере, но и на андроид (Android), iPhone и iPad. Приятного чтения!
Шрифт:
Интервал:
Закладка:
Однако, прежде чем мы слишком увлечемся, важно помнить: когда речь заходит о программировании, написание элегантных решений для четко сформулированных задач лишь немногим сложнее, чем поиск мелких багов в своем скрипте. По-настоящему сложная часть программирования — самая абстрактная: четко сформулировать задачу, которую вы пытаетесь решить, разбить ее на логические шаги, написать модульные тесты для проверки правильности каждого промежуточного вычисления и понять, в какой момент программу следует остановить. Иными словами, написание кода для достижения реальных целей трудно по тем же причинам, по которым трудно любое планирование в реальном мире: оно требует размышлений над открытой, неопределенной и протяженной во времени задачей, а справиться с ней можно, лишь перебирая огромный список возможных решений, выделяя подцели, отслеживая ошибки и контролируя прогресс на пути к завершению. В решении хорошо структурированных задач написание кода языковыми моделями быстро догоняет лучших экспертов-людей. Но когда дело доходит до вызовов реального мира, LLM еще не готовы к выходу на большую сцену. Так что появление LLM, способной самостоятельно торговать активами на фондовом рынке, взламывать серверы NHS, чтобы украсть данные пациентов, или создавать собственную миниатюрную копию, нам пока не грозит — и, пожалуй, это к лучшему.
Пропустить примечания
*1 Gao et al., 2023.
*2 https://colab.research.google.com/.
*3 Оригинальную статью см. в Li et al., 2022, а технический отчет по AlphaCode 2 — на https://storage.googleapis.com/deepmind-media/AlphaCode2/AlphaCode2_Tech_Report.pdf.
37. Веб-серфинг.
Летом 2022 года произошло много событий. Кровопролитная война между Россией и Украиной мучительно затягивалась, принося тяжелые потери обеим сторонам, и начали всплывать свидетельства ужасных бесчинств, совершенных в городах, занятых российскими войсками. В Пакистане наводнения библейских масштабов затопили более трети территории страны, вынудив покинуть свои дома или лишив крова более тридцати миллионов человек. Из более радостных новостей: начали поступать первые снимки с космического телескопа «Джеймс Уэбб», чье массивное безупречное двадцатифутовое зеркало было успешно развернуто в космосе, что позволило астрономам заглянуть в самые глубины Вселенной. Но когда в ноябре 2022 года был запущен ChatGPT, он ничего не знал об этих событиях. Если бы вы спросили его о важнейших событиях того года, он начинал юлить, уклоняться от ответов и заявлял, будто ему неизвестно ничего из произошедшего после сентября 2021 года.
В своей первоначальной ипостаси ChatGPT страдал от фиксированной даты отсечки знаний.[*1] Это объяснялось тем, что лежащая в его основе модель, GPT-3.5, проходила предварительное обучение на текстовых корпусах, созданных исключительно до этой даты, когда люди физически не могли знать о бедствиях и триумфах, которым предстояло захлестнуть 2022 год. Поскольку модель словно застыла во времени на той отметке, она не могла сказать вам, какие команды играли в хоккей в тот день, сообщить котировки акций или пересказать последние новости о политической отставке. Создавалось впечатление, будто БЯМ по непонятным причинам погрузили в кому в сентябре 2021-го и вывели из нее только для того, чтобы она ответила на ваш вопрос.[*2] Однако теперь всё изменилось. Когда пользователи версии ChatGPT по подписке задают вопрос о недавних событиях, модель просит немного подождать, пока она откроет Bing и заглянет в интернет. Собрав фрагменты релевантной информации, она использует их для составления актуального ответа (Gemini умеет делать то же самое — но, разумеется, с помощью Google). В обоих случаях БЯМ ссылается на просмотренные веб-страницы, так что вы можете проверить их самостоятельно. Так, когда я спросил, какие акции сегодня растут, а какие падают, ChatGPT обратился к Bing и выдал новости о бирже NASDAQ в режиме реального времени. (Он посоветовал мне вложиться в популярную компанию по продаже одежды для йоги и активного отдыха и избавиться от акций производителя оружия Smith and Wesson — что звучит как разумный инвестиционный совет, независимо от ежедневных колебаний рынка).
Одна из первых систем, способных выходить в интернет, созданная OpenAI, называлась WebGPT.[*3] WebGPT обучалась, имитируя краудворкеров, которые использовали Bing для поиска ответов на заковыристые вопросы обо всякой всячине вроде «Почему плесень на сыре есть можно, а на других продуктах нельзя?» и «Зачем люди начали бриться?». Эти запросы брались из сабреддита под названием ELI5, где пользователи задают вопросы об окружающем мире и отвечают на них, получая одобрительные голоса («апвоуты»), если их ответы предельно понятны (аббревиатура ELI5 расшифровывается как «explain like I’m five» — «объясни мне, будто мне пять лет»). В процессе сбора информации история поиска, прокрутки страниц и кликов краудворкеров (а также выделение ими ключевых фрагментов текста) фиксировалась, формируя базу данных для подражания WebGPT. В итоге после обучения WebGPT смогла перенять манеру человеческого веб-серфинга для извлечения релевантного текста, помогающего отвечать на вопросы. Так, если бы вы спросили ее о погоде в Глазго, она могла бы сделать запрос в Bing, перейти на сайт Метеорологической службы Великобритании (Met Office) и извлечь фрагмент текста с предупреждением о штормовом ветре и ливнях, чтобы составить свежий прогноз.
Разумеется, сбор аннотаций, сделанных вручную людьми, обходится дорого и требует много времени. Поэтому в более поздних работах исследователи попытались научить большие языковые модели самостоятельно использовать различные инструменты. В одной научной статье авторы добиваются этого, побуждая модель с открытым исходным кодом (GPT-J) генерировать собственные симулированные базы данных, заполненные вызовами API к внешним инструментам для вычислений, перевода и ответов на вопросы (например, к поисковому движку Википедии).[*4] Это хорошая стратегия, поскольку, в отличие от самого человеческого языка, API работают исключительно по строгим правилам, а потому вызываются по фиксированным шаблонам токенов, которые моделям на базе трансформеров относительно легко усвоить всего по нескольким примерам (еще один пример контекстного обучения — in-context learning). После некоторого отсева этот самогенерируемый набор данных был использован для тонкой настройки
Прочитали книгу? Предлагаем вам поделится своим отзывом от прочитанного(прослушанного)! Ваш отзыв будет полезен читателям, которые еще только собираются познакомиться с произведением.
Уважаемые читатели, слушатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.
- 1. Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации.
- 2. Просьба отказаться от оскорблений, угроз и запугиваний.
- 3. Просьба отказаться от нецензурной лексики.
- 4. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.
Надеемся на Ваше понимание и благоразумие. С уважением, администратор knigkindom.ru.
Оставить комментарий
-
Гость ghonius85805 июнь 00:47
Помощь в оформлении водительских прав любой категории. Работаем быстро, конфиденциально и с индивидуальным подходом к каждому....
Игры современников. Записки пинчраннера - Кэндзабуро Оэ
-
Гость ghonius85804 июнь 17:48
Помощь в оформлении водительских прав любой категории. Работаем быстро, конфиденциально и с индивидуальным подходом к каждому....
Бутаров Алекс – Большая Рыба
-
Гость Любовь03 июнь 16:19
Книга мне очень понравилась.Интересная,много юмора.Читайте с удовольствием....
Отдам дракона в хорошие руки - Марина Ефиминюк
