Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд
Книгу Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд читаем онлайн бесплатно полную версию! Чтобы начать читать не надо регистрации. Напомним, что читать онлайн вы можете не только на компьютере, но и на андроид (Android), iPhone и iPad. Приятного чтения!
Шрифт:
Интервал:
Закладка:
Но теперь давайте рассмотрим обучение сети на корпусе, состоящем из задач той же формы, что и оба запроса выше, но теперь города и ориентиры отличаются в каждом конкретном примере. Таким образом, каждый запрос описывает отношения между различными ориентирами в совершенно иной городской сетке (широкий режим обучения). В широком режиме у сети нет возможности узнать что-то конкретное о Нью-Йорке или Барселоне. Вместо этого единственный способ предсказать пропущенный финальный токен — разобраться в структуре самой задачи, абстрагируясь от того, какие именно города или ориентиры в ней упоминаются. Здесь структура задачи задается пространственными отношениями между ориентирами (A, B, C), направлениями (С, Ю, В, З) и расстояниями (количеством кварталов) на сетке. Вооружившись базовыми геометрическими знаниями, вы, конечно, могли бы решить любую задачу такого типа, даже если бы ориентиры принадлежали научно-фантастическому городу, который я только что придумал. На самом деле было бы несложно написать символьную компьютерную программу, способную решить любую подобную задачу: для этого достаточно закодировать местоположение каждого ориентира относительными значениями x и y и с помощью простой арифметики вычислить их взаимное расположение в декартовых координатах. Но наша человеческая способность написать такую программу опирается на понимание значения таких слов, как «север» и «пять кварталов». Для нейросети это кажется невозможным, ведь, если рассуждать наивно, соответствующие токены, кодирующие эти понятия, — всего лишь длинные числовые векторы, допускающие бесконечное множество интерпретаций. И тем не менее на практике трансформеры отлично справляются с подобными задачами. Как же они понимают, что эти слова обозначают направления или расстояния, и используют их для решения головоломки?
Ответ заключается в том, что сама структура языка отражает структуру внешнего мира. Например, в нашей задаче с ориентирами синтаксис предложений вида «A находится в x кварталах к западу и в y кварталах к северу от B» определяет относительное положение токенов A, B, x и y в предложении. В то же время правильный ответ (предсказание следующего токена) определяется базовыми геометрическими фактами о том, как устроено пространство в реальном мире — или, в данном случае, на двумерной решетке с симметрией четвертого порядка (что является замысловатым названием для сетки, состоящей из квадратов). Язык, используемый для описания задачи, внутренне непротиворечив по отношению к реальному миру. Например, если верно, что «A находится в двух кварталах к северу от B, а B — в двух кварталах к северу от C», то должно быть верно и то, что «A находится в четырех кварталах к северу от C». Если оказывается, что «A находится в трех кварталах к востоку от B», то должно выполняться и то, что «B находится в трех кварталах к западу от A». Таким образом, структура языка соответствует тому, как работают пространство и расстояние на карте в условиях евклидовой геометрии.
По мере оптимизации трансформера его бесчисленные параметры постепенно адаптируются, чтобы найти такую конфигурацию, которая минимизирует перплексию — то есть обеспечит правильное предсказание того, где каждый ориентир расположен относительно всех остальных. Разумеется, при наличии миллиардов параметров существует огромное множество их возможных конфигураций, способных привести сеть к такому результату. Однако в широком режиме обучения, когда каждая задача совершенно уникальна, единственной конфигурацией, обеспечивающей эффективное прогнозирование, будет та, которая правильно проецирует структуру предложения на структуру мира — то есть кодирует осмысленную взаимосвязь между токенами, соответствующими A, B, x и y. На самом деле трансформер устроен для этого идеальным образом, поскольку механизм самовнимания — это, по сути, инструмент для определения того, что с чем связано, позволяющий напрямую усваивать отношения между токенами в промпте.
Другой важнейшей особенностью трансформера является использование позиционных эмбеддингов (position embeddings). Позиционные эмбеддинги представляют собой дополнительные входные данные, передаваемые сети; они объединяются с эмбеддингами токенов и явно указывают на то, какое место каждый токен занимал в последовательности. Так, в промпте «Пекин находится к северу от Шанхая» относительные позиционные эмбеддинги для этих двух китайских городов помогают сети отличить эту фразу от ее географически ошибочного перевертыша «Шанхай находится к северу от Пекина» (любопытно, что человеческий мозг, по-видимому, также обрабатывает входящую информацию о «что» и «где» в раздельных потоках, и это вполне может вносить важный вклад в нашу собственную способность к рассуждению). Благодаря этим инновациям в нейросети возникает своего рода программа, эквивалентная той символьной программе, которую программист-человек написал бы вручную. Именно так глубокие нейросети, которые обучаются методом проб и ошибок, подобно Советнику 1, могут быть обучены приближенно воспроизводить точные символьные вычисления, обычно ассоциирующиеся с Советником 2. Таким образом, трансформеры способны осваивать ментальные программы, которые принимают язык в качестве входных данных и обрабатывают его в соответствии с реальной структурой мира, выраженной формальными математическими или логическими системами — такими как геометрия положений на сетке в нашей задаче с ориентирами.
На самом деле, когда GPT-4 решает эту задачу, она объясняет свою логику как последовательность операций, аналогичных тем, которые использовал бы символьный алгоритм для барселонской версии задачи:
1. Определить координаты Жироны: мы примем Жирону за точку отсчета (0, 0):
Жирона = (0, 0)
2. Найти Пасео-де-Грасия:
Пасео-де-Грасия находится в 4 кварталах к западу и в 1 квартале к югу от Жироны.
Пасео-де-Грасия = (−4, −1)
3. Найти Вердагер:
Вердагер находится в 1 квартале к востоку и в 4 кварталах к северу от Жироны.
Вердагер = (1, 4)
4. Найти Диагональ:
Диагональ находится в 6 кварталах к северу от Пасео-де-Грасия.
Диагональ = (−4, −1 + 6) = (−4, 5)
5. Найти искомую станцию:
Нам нужно найти станцию, которая находится в 5 кварталах к востоку и в 1 квартале к югу от Диагонали.
Искомая станция = (−4 + 5, 5 − 1) = (1, 4)
6. Определить станцию с координатами (1, 4):
Это координаты Вердагера.
Задача с ориентирами сильно схематизирована. Каждый промпт имеет однородный синтаксис, и всегда существует единственный верный ответ, поэтому трансформеру было бы легко усвоить эквивалентность между лингвистической и геометрической структурой. В реальных условиях, однако, естественный язык ведет себя далеко не так послушно. Гигантские корпуса текстов, на которых обучались LLM, обсуждают всё на свете на множестве языков, смешивая сленг и высоколобую прозу, книги, полные сложного формализма, и компьютерный код, кулинарные рецепты и спортивные альманахи, бульварное чтиво и крикливую желтую прессу. Тем не менее внутренние структурные взаимосвязи в
Прочитали книгу? Предлагаем вам поделится своим отзывом от прочитанного(прослушанного)! Ваш отзыв будет полезен читателям, которые еще только собираются познакомиться с произведением.
Уважаемые читатели, слушатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.
- 1. Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации.
- 2. Просьба отказаться от оскорблений, угроз и запугиваний.
- 3. Просьба отказаться от нецензурной лексики.
- 4. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.
Надеемся на Ваше понимание и благоразумие. С уважением, администратор knigkindom.ru.
Оставить комментарий
-
Гость ghonius85805 июнь 00:47
Помощь в оформлении водительских прав любой категории. Работаем быстро, конфиденциально и с индивидуальным подходом к каждому....
Игры современников. Записки пинчраннера - Кэндзабуро Оэ
-
Гость ghonius85804 июнь 17:48
Помощь в оформлении водительских прав любой категории. Работаем быстро, конфиденциально и с индивидуальным подходом к каждому....
Бутаров Алекс – Большая Рыба
-
Гость Любовь03 июнь 16:19
Книга мне очень понравилась.Интересная,много юмора.Читайте с удовольствием....
Отдам дракона в хорошие руки - Марина Ефиминюк
