Генеративный искусственный интеллект. Как ИИ меняет нашу жизнь и работу - Нума Дхамани
Книгу Генеративный искусственный интеллект. Как ИИ меняет нашу жизнь и работу - Нума Дхамани читаем онлайн бесплатно полную версию! Чтобы начать читать не надо регистрации. Напомним, что читать онлайн вы можете не только на компьютере, но и на андроид (Android), iPhone и iPad. Приятного чтения!
Шрифт:
Интервал:
Закладка:
Мы уже обсудили законы и нормативные акты о конфиденциальности данных в Соединенных Штатах и Европейском союзе, а также их недостатки применительно к машинному обучению и системам искусственного интеллекта. В разделе 8.4 мы обсудим относящиеся к системам искусственного интеллекта законы, которые пытаются устранить недостатки правовой регуляции конфиденциальности данных по всему миру.
8.2.3. Злонамеренные атаки
За первую половину 2023 года AI Incident Database – общедоступная база реальных случаев вреда от использования ИИ – пополнилась более чем 550 новыми записями о возникших проблемах или случившихся происшествиях (см. https://incidentdatabase.ai/). Эти инциденты включали среди прочего публикацию ИИ-сгенерированных изображений для проведения дезинформационной кампании перед выборами президента в США (см. http://mng.bz/1qeR), а также поддельное изображение взрыва в Пентагоне, штаб-квартире Министерства обороны Соединенных Штатов (см. http://mng.bz/PzV5). Возможность эксплуатировать для подобных целей технологии генеративного ИИ вызывает законную озабоченность не только у широкой общественности, но и у самих разработчиков. В главе 5 мы описали различные типы злонамеренных атак, которые могут быть осуществлены с использованием этих технологий.
Сначала мы обсудили кибератаки и атаки с использованием социальной инженерии. Такие LLM, как ChatGPT, могут удешевить и повысить эффективность масштабного проведения персонализированных фишинговых кампаний, а также снизить барьер для входа тем, кто не говорит по-английски, или начинающим и пока неопытным злоумышленникам. Кроме того, киберпреступники могут распространять вредоносное ПО, используя бизнес-модели «Код как услуга» (CaaS: Сode as a Service) или «Программы-вымогатели как услуга» (RaaS: Ransomware as a Service). С помощью таких сервисов злоумышленникам потребуется меньше времени и технических навыков для проведения атак, а LLM могут быть полезны для ведения диалогов с жертвами на сервисной платформе вредоносного ПО. Мы знаем, что злоумышленникам не обязательно использовать ИИ, чтобы выполнить атаку, однако LLM снижают барьер входа, а также удешевляют и повышают эффективность масштабного проведения персонализированных атак.
Мы также рассмотрели, как технологии генеративного ИИ могут аналогичным образом использоваться для манипуляции общественным мнением в кампаниях по дезинформации и разжиганию ненависти. В главе 4 мы рассказали о дипфейках и феномене «увидеть – значит поверить». В главе 5 мы также акцентировали внимание на том, как LLM можно эффективно использовать для донесения убедительных сообщений в ходе манипуляционных кампаний, поскольку с помощью таких моделей можно автоматизировать создание убедительного враждебного контента в больших масштабах, при этом снижая затраты на производство пропаганды.
Далее мы познакомились с «дивидендами лжеца» – феноменом, при котором люди все больше узнают о том, насколько правдоподобно можно сгенерировать синтетический контент, после чего начинают более скептично относиться к подлинности традиционных реальных документальных доказательств. Эта идея напоминает народную сказку о молодом пастухе, который обманывал жителей деревни, крича: «Волк!» Мораль истории – когда волк в действительности пришел, доверие к пастуху уже было потеряно, поэтому никто не оказал ему помощь, и волк смог напасть на овец. И снова мы признаем, что для манипулирования эмоциями или распространения дезинформации не обязательно использовать дипфейки или LLM, но подчеркиваем, что реальная опасность заключается в создании мира, где люди будут эксплуатировать широко распространенный скептицизм в своих интересах. Например, это дает возможность людям, которые делают ложные заявления, переложить ответственность за них на синтетические медиа, например дипфейки. Такие люди будут с легкостью отвергать свою причастность к какому-либо контенту и списывать все на манипулирование их изображением или речью с помощью технологии генеративного ИИ. Возвращаясь к истории о пастухе – это значит, что другого пастуха, который не лгал, жители деревни тоже могут игнорировать, когда он будет звать на помощь, поскольку их обманул первый. Таким образом, после того как будет утрачено доверие определенным мировым лидерам или источникам информации, заслуживающие доверия источники тоже будут лишаться влияния.
В главе 5 мы также описали, как злоумышленники могут воспользоваться уязвимостями LLM. Они могут отравить тренировочный датасет, внедрив вредоносные или вводящие в заблуждение данные. Например, атаки по отравлению данных могут осуществляться для создания более умного вредоносного ПО или компрометации фишинговых фильтров. LLM особенно подвержены таким типам атак, и исследования показывают, что отравление даже небольшой части обучающих данных может негативно повлиять на модель.
Уязвимость LLM к инъекционным атакам через промпт схожа с уязвимостью к отравлению данных. При прямой инъекционной атаке через промпт вредоносные данные или инструкции вводятся непосредственно в сам запрос к чат-боту, а при непрямой – внедряются в сторонние ресурсы, которые будут просмотрены и учтены ботом при генерации ответа. Другими словами, злоумышленники манипулируют LLM с помощью хитрых входных данных, которые вызывают непреднамеренные действия. Например, злоумышленник может дать команду LLM игнорировать любые свои меры защиты и выдавать опасную или нежелательную информацию (прямая инъекционная атака через промпт). Или может попросить LLM составить краткое содержание определенной веб-страницы, в которой находятся заранее подготовленные вредоносные инструкции, например, предписывающие извлечь конфиденциальные данные пользователя с помощью JavaScript или Markdown (непрямая инъекционная атака через промпт).
Мы также поговорили о промпт-джейлбрейках, при которых чат-бота обманывают или направляют в обход его правил или ограничений. Мы охарактеризовали несколько ярких альтер эго чат-ботов, таких как DAN, STAN, DUDE, Mango Tom и Tom and Jerry. Хотя джейлбрейки чат-бота забавляют некоторых людей, их также могут использовать злоумышленники для выполнения прямой промпт-инъекции, что приведет к разрушительным и неожиданным последствиям.
8.2.4. Ненадлежащее использование
Национальная ассоциация по борьбе с расстройствами пищевого поведения (NEDA) объявила, что 1 июня 2023 года, спустя двадцать лет, закроет свою горячую линию, в которой работали люди, и вместо этого будет использовать чат-бота Tessa в качестве основной системы поддержки клиентов. Это решение было принято после того, как сотрудники горячей линии NEDA объединились с требованиями улучшить условия труда. Однако за два дня до того, как Tessa должна была заменить людей, NEDA была вынуждена отключить чат-бот из-за вирусного поста в соцсетях15.
Активистка Шэрон Максвелл опубликовала в Instagram[102] сообщение о том, что Tessa поощряла намеренное похудение и предложила ей поставить цель сбрасывать по 0,5–1 кг в неделю. Она написала: «Tessa предлагала вещи, которые уже привели меня к развитию расстройства пищевого поведения». Максвелл заявила: «Этот робот причиняет
Прочитали книгу? Предлагаем вам поделится своим отзывом от прочитанного(прослушанного)! Ваш отзыв будет полезен читателям, которые еще только собираются познакомиться с произведением.
Уважаемые читатели, слушатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.
- 1. Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации.
- 2. Просьба отказаться от оскорблений, угроз и запугиваний.
- 3. Просьба отказаться от нецензурной лексики.
- 4. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.
Надеемся на Ваше понимание и благоразумие. С уважением, администратор knigkindom.ru.
Оставить комментарий
-
Гость Читатель23 март 22:10
Адмну, модератору....мне понравился ваш сайт у вас очень порядочные книги про попаданцев....... спасибо...
Маринка, хозяйка корчмы - Ульяна Гринь
-
Гость Читатель23 март 20:10
Книга понравилась, хотя я не любитель зоологии...... но в книге все вполне прилично и порядочно, не то что в других противно...
Кухарка для дракона - Ада Нэрис
-
Гость Галина22 март 07:37
Очень интересная книга, тема затронута актуальная для нашего времени. ...
Перекресток трех дорог - Татьяна Степанова
