Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд
Книгу Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд читаем онлайн бесплатно полную версию! Чтобы начать читать не надо регистрации. Напомним, что читать онлайн вы можете не только на компьютере, но и на андроид (Android), iPhone и iPad. Приятного чтения!
Шрифт:
Интервал:
Закладка:
Нейронные сети принимают на вход числа, поэтому, чтобы глубокая сеть могла обрабатывать язык, нам нужно преобразовать языковые единицы (такие как слова) в числовые коды. Один из простых способов сделать это называется one-hot кодированием. One-hot код представляет собой вектор длины n, где n — это количество возможных входных данных (например, уникальных слов), в котором одна-единственная позиция кодируется единицей, а все остальные — нулями. Например, если не учитывать пунктуацию, one-hot код для нашего языка L4 выглядел бы так:
florbix: 1 0 0 0
quibbly: 0 1 0 0
zandoodle: 0 0 1 0
blibberish: 0 0 0 1
Это гарантирует, что такие числовые коды одинаково не похожи друг на друга, что верно отражает тот факт, что слова (по большей части) являются произвольными символами и их физическая форма никак не связана со смыслом. Разумеется, в естественном языке объем словаря гораздо больше. В исследовании 2003 года использовалось 7000 уникальных входов, а в современных LLM это число приближается к 50 000, из-за чего one-hot векторы могут быть чрезвычайно длинными. Более того, поскольку каждое отдельное слово встречается довольно редко, нейросети очень трудно понять, в каком окружении оно обычно появляется, а следовательно — делать точные предсказания.
В статье 2003 года был предложен изящный трюк, решивший эту проблему. Авторы предложили представлять числовой код каждого слова в виде вектора признаков, состоящего примерно из пятидесяти значений, причем каждый такой вектор должен был настраиваться непосредственно в процессе обучения. Мы можем представить вектор признаков как координаты понятия на семантической карте с d измерениями, где d — это длина вектора. Так, например, если d = 2, то входные данные для таких слов, как «скрипка» и «виолончель», сжимаются всего до двух значений, которые можно рассматривать как координаты x и y соответствующих им понятий на двумерной семантической карте (совсем как в автомобильном атласе дорог). Если d = 3, то каждое слово превращается в точку внутри трехмерного пространства (куба), задаваемую координатами x, y и z (для описания таких похожих на карты репрезентаций в «мозге» сети исследователи ИИ используют термин «эмбеддинги» (embeddings)). Тот же самый принцип действует и при d = 50, с той лишь разницей, что пространство эмбеддингов гораздо труднее визуализировать (пионер в области ИИ Джефф Хинтон советовал своим студентам: чтобы представить 13-мерное пространство, нужно вообразить трехмерное и просто повторять про себя: «тринадцать, тринадцать, тринадцать»).
Когда нейросеть обучили использовать эти представления на основе векторов признаков для предсказания следующего слова, она справлялась с этим с гораздо меньшей перплексией (то есть более точно), чем эквивалентные n-граммные модели, что стало огромным шагом вперед для языковых моделей на базе нейронных сетей. Однако самым примечательным оказалось то, что обученные таким образом сети усваивали семантически осмысленные эмбеддинги — то есть приобретали примитивную форму семантической памяти. Например, сеть усваивала более схожие векторы признаков для семантически близких понятий, тем самым помещая скрипку и виолончель рядом на семантической карте. Это было поразительным открытием, ведь сеть, разумеется, никогда не бывала на концертах классической музыки и никто не говорил ей, что оба эти инструмента — струнные, с изящными деревянными корпусами.
Более того, оказывается, что усвоенные ею эмбеддинги похожи на те, что обнаруживаются в человеческом мозге. Для заданного набора словарных единиц можно измерить расстояния между векторами признаков каждого слова и всех остальных, что для n слов дает матрицу n × n с нулями на диагонали (поскольку каждое слово идентично самому себе, а это соответствует нулевому расстоянию). Если повторить ту же процедуру с паттернами активности человеческого мозга, измеренными с помощью методов нейровизуализации, то обнаружится, что матрицы сходства для «мозга» нейросетей и мозга человека в значительной степени совпадают. Просто обучаясь предсказывать слова, нейронные сети способны приобретать семантические знания, в общих чертах сходные с человеческими.
Но это еще не все. У людей семантическое знание лежит глубже, чем простые ассоциативные паттерны. То, как мы используем слова, отражает наше понимание структуры мира. Один из примеров этого виден в том, как мы используем метафоры и аналогии. Возьмем следующую загадку: «скрипка относится к струнным, как труба — к ______». Вы наверняка знаете, что в классическом оркестре скрипки входят в группу струнных инструментов вместе с виолончелями и альтами, тогда как трубы относятся к медным духовым, поэтому медные духовые — наиболее вероятный вариант завершения аналогии (и GPT-4 с этим согласна). Кроме того, структура смысла раскрывается и через синтаксис предложений, о чем нам ворчливо напоминает Ноам Хомский. Так, простая загадка «car относится к cars, как dog — к _____» обыгрывает тот факт, что стандартная форма множественного числа английских существительных образуется путем добавления окончания –s. Вы можете подумать (мысленно настраиваясь на волну Ноама Хомского), что эти паттерны выводятся из жестких грамматических правил, к усвоению которых мы предрасположены от рождения, или из знаний, укорененных в реальном жизненном опыте (например, если вы своими глазами видели, как музыканты сидят в оркестровой яме). Если это так, то у нейросетей не было бы ни единого шанса усвоить знания, структурированные подобным образом.
Но, как ни удивительно, было доказано, что они на это способны.[*2] Если мы внимательно изучим репрезентации в нейронных сетях, то обнаружим, что они представляют значения слов в виде легко интерпретируемой геометрии. Например, две точки в пространстве эмбеддингов, соответствующие словам мужчина и женщина, разделены вектором, имеющим тот же угол, что и вектор, связывающий слова король и королева, но смещенным в перпендикулярном направлении. Проще говоря, это выглядит так, будто сеть усваивает для этих понятий следующие эмбеддинги (хотя, разумеется, реальные векторы имели десятки измерений, а не два, но сам паттерн был точно таким же):
v(Королева) = [4,5]
v(Король) = [1,5]
v(Женщина) = [4,2]
v(Мужчина) = [1,2]
Сеть выделила смысловое измерение, соответствующее гендеру (женский пол против мужского), и еще одно, соответствующее королевскому статусу (монарх против подданного), хотя это весьма абстрактные понятия, неявно скрытые в самом языке. Иными словами, сеть усвоила репрезентации, полезные для решения задач на поиск аналогий (вроде тех, что описаны выше) путем простых арифметических операций над этими векторами признаков. Если v(x) обозначает вектор признаков для слова x, то мы можем, например, вывести, что v(Женщина) = v(Мужчина) + v(Королева) − v(Король) (попробуйте посчитать сами). То же самое работает и для синтаксиса. Например, v(cars) = v(car) + v(dogs) − v(dog). Интуитивно вы можете представить выражение v(dogs) − v(dog) как улавливающее «чистый» показатель множественного числа — окончание «-s», — который затем добавляется к v(car), чтобы получилось v(cars). Это работает даже для перевода, например с английского на испанский: v(caballo) = v(vaca) − v(cow) + v(horse).
Прочитали книгу? Предлагаем вам поделится своим отзывом от прочитанного(прослушанного)! Ваш отзыв будет полезен читателям, которые еще только собираются познакомиться с произведением.
Уважаемые читатели, слушатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.
- 1. Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации.
- 2. Просьба отказаться от оскорблений, угроз и запугиваний.
- 3. Просьба отказаться от нецензурной лексики.
- 4. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.
Надеемся на Ваше понимание и благоразумие. С уважением, администратор knigkindom.ru.
Оставить комментарий
-
Гость ghonius85805 июнь 00:47
Помощь в оформлении водительских прав любой категории. Работаем быстро, конфиденциально и с индивидуальным подходом к каждому....
Игры современников. Записки пинчраннера - Кэндзабуро Оэ
-
Гость ghonius85804 июнь 17:48
Помощь в оформлении водительских прав любой категории. Работаем быстро, конфиденциально и с индивидуальным подходом к каждому....
Бутаров Алекс – Большая Рыба
-
Гость Любовь03 июнь 16:19
Книга мне очень понравилась.Интересная,много юмора.Читайте с удовольствием....
Отдам дракона в хорошие руки - Марина Ефиминюк
