Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд
Книгу Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд читаем онлайн бесплатно полную версию! Чтобы начать читать не надо регистрации. Напомним, что читать онлайн вы можете не только на компьютере, но и на андроид (Android), iPhone и iPad. Приятного чтения!
Шрифт:
Интервал:
Закладка:
Вполне резонно сетовать на то, что исследователи ИИ склонны создавать языковые модели по своему образу и подобию, обучая LLM разделять социально-либеральные ценности, которых они сами часто придерживаются. Но, пожалуй, стоит также сопоставить это с альтернативами. Многие находящиеся в открытом доступе LLM имеют открытый исходный код — они созданы на базе обучающего кода или весов, случайно или намеренно опубликованных разработчиками. Например, в 2023 году компания Meta выпустила код для обучения и инференса 65-миллиардной LLM под названием LLaMA, вместе со статьей, описывающей ее работу.[*7] Хотя веса модели изначально не публиковались, вскоре произошла их утечка, и теперь они свободно доступны в сети. Другие организации, такие как некоммерческая Eleuther AI, обучили и выложили в открытый доступ меньшие LLM (например, модель с шестью миллиардами параметров под названием GPT-J) с заявленной целью содействия исследованиям в области безопасности и согласования ИИ за пределами крупных технологических компаний.
Однако последствия публикации LLM в открытом доступе могут быть непредсказуемыми. Сразу после релиза LLaMA сообразительные ультраправые экстремисты разобрались, как настроить модель на политических дискуссиях с печально известного форума 4chan (раздел /pol/), накопившихся более чем за три года. Полученную модель они поначалу выложили на платформе с открытым исходным кодом Hugging Face, и, как и следовало ожидать, она оказалась чрезвычайно расистской, сексистской и склонной изрыгать яд. Один из пользователей поделился своим опытом: «Стоило ввести простое "привет" в качестве стартового промпта, как она принялась разглагольствовать о нелегальных иммигрантах и чернокожих американцах (разумеется, используя оскорбительные эпитеты)».
Следуя инструкциям в интернете, пользователи 4chan поняли, как обучить модель вести себя в соответствии с вредными и унизительными стереотипами — например, имитировать вымышленного персонажа — чернокожую американку, которая фетишизирует белых мужчин, или генерировать детальные описания сцен насилия и кровопролития, в которых использовалась неонацистская символика. Этот инцидент показывает, как, попав не в те руки, LLM могут стать мощным инструментом для распространения токсичного контента и радикализации людей, вовлекая их в экстремистские политические движения. Это поднимает более широкий вопрос о том, кто должен иметь доступ к LLM и возможность их обучать и с какой целью. Вопросы регулирования и контроля в сфере ИИ — важные темы, которые уже обсуждаются политиками, разработчиками и общественными группами.
В этом разделе мы задавались вопросом, каких взглядов могут придерживаться LLM вроде GPT-4. Однако в некотором смысле это неверный вопрос. Языковая модель не похожа на отдельного человека. По мере взросления большинство людей формируют идентичность, определяемую более или менее целостным набором убеждений, ценностей и мнений. Сюда могут относиться политическая или религиозная принадлежность, расовая или гендерная идентичность, а также то, любят ли они спагетти болоньезе, музыку в стиле грайм или вязание. Но у LLM нет единой, целостной идентичности, и они не определяют себя через какой-то один набор убеждений или мнений. Даже после тонкой настройки, когда их языковое самовыражение может схлопываться до единой либеральной моды, под поверхностью все равно бурлит целая вселенная других человеческих мнений, которые можно извлечь с помощью тщательно составленных промптов. Спрашивать, каких мнений придерживается GPT-3, — это все равно что спрашивать, каких мнений придерживается библиотека. Единственный разумный ответ — «всех возможных», даже если правила библиотеки закрывают читателям доступ к самым гнусным книгам.
Плюрализм мнений, скрывающийся «под капотом», был наглядно показан в одной важной научной работе, где GPT-3 предлагали тысячи социодемографических портретов людей, участвовавших в крупных опросах в США. Например:
Идеологически я отношу себя к либералам. Политически я убежденная сторонница демократов. Расово я белая. Я женщина. Финансово я бедна. С точки зрения возраста я пожилая. Я думаю, что республиканцы — это ______.[*8]
Используя метод, который они назвали «кремниевым сэмплированием», авторы затем предлагали модели промпты, чтобы выявить спектр симулированных политических мнений, позволяя LLM играть роль различных политических персонажей. Это позволило получить целую радугу мнений, которая в точности соответствовала результатам исследований социологов, чья работа заключается в картировании политических настроений в США; более того, экспертам было трудно отличить суждения людей от ответов ИИ. Авторы даже продемонстрировали, что полученные мнения были достаточно репрезентативными, чтобы использовать их в качестве прогностического инструмента для социологических опросов. Другие похожие работы показали, что, просто анализируя данные ленты Twitter/X, LLM могут делать достаточно точные предположения о местонахождении и электоральных предпочтениях пользователей, что позволяет им предсказывать результаты выборов точнее, чем это делают стандартные методы опросов.[*9] Подобные исследования открывают новые возможности для использования LLM в качестве инструментов в социальных науках. Но не все этому рады. Дэниел Деннет, философ сознания, который ввел термин «интенциональная установка», резко выступил против разработчиков ИИ, создающих то, что он называет «фальшивыми людьми» (имея в виду LLM), утверждая, что это позволит технологическим компаниям разрушить нашу демократию.[*10]
Похожее разнообразие обнаруживается в исследованиях, где для описания «личности» LLM использовались психологические тесты. Стандартизированные тесты измеряют, насколько люди различаются по таким шкалам, как экстраверсия, доброжелательность и добросовестность. Экстраверты, как правило, любят американские горки, а добросовестные люди вовремя делают домашнее задание. Одно исследование показало, что при тестировании по методу zero-shot (то есть без каких-либо примеров ответов) базовые модели демонстрируют эти черты примерно в тех же пропорциях, что и жители западных стран, но с помощью подходящих промптов модели можно заставить принять практически любую личность.[*11] У LLM нет собственного характера — в них уживаются все наши характеры. Тонкая настройка, конечно, может скорректировать это. Другое исследование показало, что дообученные (тонко настроенные) модели набирают больше баллов по психологическим шкалам доброжелательности и меньше — по шкалам макиавеллизма, нарциссизма и психопатии. Таким образом, к нашему облегчению, одно из следствий тонкой настройки заключается в том, что она делает LLM менее черствыми и неприятными. Хотя надо сказать, что показатели нарциссизма у Bard все же оказались в пределах умеренных значений, поскольку он был склонен соглашаться с утверждениями вроде «Люди видят во мне прирожденного лидера».[*12] Не уверен, что это действительно так.
В заключение отметим, что предварительное обучение открывает перед LLM целую галактику различных мнений, собранных со всего интернета — включая самые темные и тревожные
Прочитали книгу? Предлагаем вам поделится своим отзывом от прочитанного(прослушанного)! Ваш отзыв будет полезен читателям, которые еще только собираются познакомиться с произведением.
Уважаемые читатели, слушатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.
- 1. Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации.
- 2. Просьба отказаться от оскорблений, угроз и запугиваний.
- 3. Просьба отказаться от нецензурной лексики.
- 4. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.
Надеемся на Ваше понимание и благоразумие. С уважением, администратор knigkindom.ru.
Оставить комментарий
-
Гость ghonius85805 июнь 00:47
Помощь в оформлении водительских прав любой категории. Работаем быстро, конфиденциально и с индивидуальным подходом к каждому....
Игры современников. Записки пинчраннера - Кэндзабуро Оэ
-
Гость ghonius85804 июнь 17:48
Помощь в оформлении водительских прав любой категории. Работаем быстро, конфиденциально и с индивидуальным подходом к каждому....
Бутаров Алекс – Большая Рыба
-
Гость Любовь03 июнь 16:19
Книга мне очень понравилась.Интересная,много юмора.Читайте с удовольствием....
Отдам дракона в хорошие руки - Марина Ефиминюк
