KnigkinDom.org»Книги » Разная литература»📕 Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд

Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд

Name: Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд
Rating: 5 (1000 reviews)
Author: Кристофер Саммерфилд
ISBN: 00000000

Книгу Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд читаем онлайн бесплатно полную версию! Чтобы начать читать не надо регистрации. Напомним, что читать онлайн вы можете не только на компьютере, но и на андроид (Android), iPhone и iPad. Приятного чтения!

1 ... 31 32 33 34 35 36 37 38 39 ... 111

Перейти на страницу:

Шрифт:

Интервал:

Закладка:

Сделать

принципы просты — например, понять, что конь всегда ходит буквой «Г», но другие ставят в тупик — например, почему пешки в основном ходят только вперед, но иногда им разрешается ходить по диагонали (взятие на проходе). Именно так Ноам Хомский и видел дело всей своей жизни: как выявление правил, управляющих конкретными ходами в игре по построению предложений (синтаксисе), и того, как они связаны с глубинными принципами, определяющими эти ходы. Эти принципы (как он полагал) стоят выше всех 7000 языков, существующих на Земле, подобно тому как правила шахмат объединяют различные варианты этой игры, возникшие в разных культурах (такие как сёги или чатуранга — шахматоподобные игры, зародившиеся соответственно в Японии и Индии). Но этот проект строится на допущении, что язык подчиняется набору универсальных правил, жестко встроенных в мозг младенца, которые можно обнаружить путем терпеливого лингвистического анализа. Если же язык формируется под влиянием специфических факторов, меняющихся в зависимости от контекста и культуры, то никакого простого набора незыблемых правил, готовых к открытию, не существует. Единственный способ смоделировать язык в таком случае — использовать большую и выразительную нейронную сеть, подобную БЯМ, которая способна зафиксировать в своих весах (числовых параметрах, составляющих ее память) как базовые принципы, так и исключения из них. И, как оказалось, именно так дело и обстоит.

Пропустить примечания

*1 Vaswani et al., 2017.

*2 Ravuri et al., 2021.

*3 Варианты этой идеи восходят как минимум к 1980-м годам (Hintzman and Ludlam, 1980).

*4 Kocijan et al., 2023.

*5 Linzen, Dupoux, and Goldberg, 2016.

*6 Цит. по: Baroni, 2021.

*7 Piantadosi, 2023.

14. Модели LLM как лингвистические теории.

Ноам Хомский ошибался насчет природы вычислений, необходимых для освоения языка. Но в других отношениях он был прав. Во-первых, он утверждал, что языковое моделирование требует весьма специфических алгоритмических операций. Здесь он высказывает эту мысль в своем неподражаемом стиле, критикуя LLM за то, что они представляют собой универсальные инструменты статистического моделирования: «Нельзя прийти на физическую конференцию и сказать: "У меня есть отличная теория. Она объясняет всё и настолько проста, что укладывается в два слова: "Всё сойдет""»[*1].

Ноам Хомский высмеивает то, что кажется ему банальностью машинного обучения. Алгоритмы, лежащие в основе современного NLP, утверждает он, интеллектуально неинтересны в качестве языковых теорий — это просто массивные инструменты «грубой силы», которые бездумно перемалывают данные, что ни в коей мере не напоминает работу человеческого мозга. Вместо этого, по его мнению, нам нужны более тонко проработанные алгоритмические инструменты, адаптированные под конкретную задачу.

Независимо от того, справедлива ли его критика глубокого обучения, Ноам Хомский абсолютно прав в том, что далеко не все статистические модели, какими бы большими и мощными они ни были, способны порождать грамматически правильные предложения. История исследований в области NLP пестрит ложными стартами, и ученые лишь постепенно совершенствовали набор канонических вычислений, необходимых для корректного генерирования предложений. При переходе от n-граммных моделей (которые заучивали пары или тройки слов) к глубоким сетям исследователи отказались от линейных преобразований в пользу нелинейных. Важнейшую роль играет снижение размерности, о чем свидетельствует успех моделей с плотными векторами признаков (где скрипка и виолончель более похожи друг на друга), а не разреженных one-hot кодов размерностью 50 000. За последнее десятилетие модели seq2seq и трансформеры научили нас тому, что внимание жизненно необходимо для учета относительной важности предшествующего контекста предложения. Генерация естественного языка, подобного человеческому, судя по всему, возможна лишь с помощью весьма специфических вычислений. Вероятно, именно поэтому исследователям ИИ потребовалась большая часть семи десятилетий — от самых ранних символьных моделей 1950-х годов до гигантских моделей GPT 2020-х годов, — чтобы понять, как его генерировать.

Во-вторых, Ноам Хомский утверждал, что человеческие младенцы рождаются с врожденной способностью к освоению языка, которой их наделяет легендарное «устройство усвоения языка». Хотя он никогда подробно не описывал, как именно работает это устройство, Ноам Хомский приводит веские аргументы в пользу врожденного характера усвоения языка у людей. С одной стороны, только люди способны выучить язык, в то время как Коко и Ним так и не продвинулись дальше стадии «дай апельсин». С другой стороны, наше стремление говорить предложениями невероятно сильно, и оно побуждает каждого ребенка осваивать структурированные формы общения, даже если (как те близнецы в Уэльсе) они сами придумывают синтаксис.

К этому Ноам Хомский добавляет третий аргумент, который особенно актуален при сравнении человеческого обучения языку с обучением LLM: человеческие дети осваивают язык с непревзойденной эффективностью. Он называет это аргументом о «бедности стимула».

Человеческие дети действительно, по всей видимости, усваивают родной язык с минимальными усилиями. Что еще более примечательно, скорость их обучения практически не зависит от объема воспринимаемой ими речи[*2]. Например, американцев из среднего класса всячески побуждают обеспечивать своим детям хороший старт в жизни, постоянно разговаривая с ними, даже если те в ответ лишь гулят, кричат или срыгивают, и поэтому дети специалистов со Среднего Запада слышат в среднем более 2000 слов в час. Напротив, индейцы чимане — доиндустриальное общество охотников-собирателей и земледельцев в низменностях Боливии — вообще редко утруждают себя разговорами с детьми, в результате чего те слышат лишь несколько минут речи в час, и почти ни одно слово не обращено непосредственно к ним. Тем не менее дети со Среднего Запада и дети чимане осваивают язык примерно с одинаковой скоростью и через несколько лет достигают сопоставимого уровня владения им. Таким образом, развитием речи у человека, похоже, движет что-то иное, нежели просто объем услышанного.

Можно ли сравнить объем языкового опыта, получаемого человеческими детьми и моделями LLM? К десяти годам средний ребенок успевает услышать несколько миллионов слов — а те, кто растет рядом с настоящими болтунами, могут услышать до 100 миллионов. В этом возрасте они допускают очень мало ошибок в своем родном языке (за исключением, судя по всему, датского, который настолько труден для изучения, что даже коренные датчане с трудом им овладевают[*3]). Цифра может показаться огромной, но это как минимум в 2000 раз меньше объема слов, на котором обучалась GPT-3. Фактически, сегодняшние LLM получили такой языковой опыт, какой человек приобрел бы, если бы непрерывно жил в течение 25 000 лет — с пика последнего ледникового периода до наших дней, — и услышал обсуждение любой темы на свете на множестве разных языков. Даже GPT-2, устаревшая языковая модель, склонная к вопиющим синтаксическим ошибкам, «услышала» на порядок больше слов, чем средний

1 ... 31 32 33 34 35 36 37 38 39 ... 111

Перейти на страницу:

Жалоба

Прочитали книгу? Предлагаем вам поделится своим отзывом от прочитанного(прослушанного)! Ваш отзыв будет полезен читателям, которые еще только собираются познакомиться с произведением.

Уважаемые читатели, слушатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.

1. Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации.
2. Просьба отказаться от оскорблений, угроз и запугиваний.
3. Просьба отказаться от нецензурной лексики.
4. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.

Надеемся на Ваше понимание и благоразумие. С уважением, администратор knigkindom.ru.

Оставить комментарий

Гость Светлана26 июль 11:47 Большущее Вам спасибо за роман!!!! Столько эмоций и чувств при его прочтении!!!! А какие эмоциональные качели🙏👍👍👍 особенно в... Моё сердце в тебе бьётся - Даша Коэн
Гость Елена24 июль 13:03 В целом неплохо, но автору надо запомнить, что помимо слова "приёмник" в русском языке есть слово "преемник", и именно оно... В болезни и здравии, Дракон - Хель Сорго
Semmi22 июль 17:17 Не знаю, кто выложил эту книгу здесь без разрешения и без указания чтецов, но хочу чтобы слушатели знали: Над начиткой этой книги... Priest - В башне над мостом