KnigkinDom.org»Книги » Разная литература»📕 Генеративный искусственный интеллект. Как ИИ меняет нашу жизнь и работу - Нума Дхамани

Генеративный искусственный интеллект. Как ИИ меняет нашу жизнь и работу - Нума Дхамани

Name: Генеративный искусственный интеллект. Как ИИ меняет нашу жизнь и работу - Нума Дхамани
Rating: 5 (1000 reviews)
Author: Нума Дхамани
ISBN: 00000000

Книгу Генеративный искусственный интеллект. Как ИИ меняет нашу жизнь и работу - Нума Дхамани читаем онлайн бесплатно полную версию! Чтобы начать читать не надо регистрации. Напомним, что читать онлайн вы можете не только на компьютере, но и на андроид (Android), iPhone и iPad. Приятного чтения!

1 ... 58 59 60 61 62 63 64 65 66 ... 91

Перейти на страницу:

Шрифт:

Интервал:

Закладка:

Сделать

дали явный запрет, эта информация используется для дообучения или улучшения моделей, а затем непреднамеренно может просочиться в ответы на промпты других пользователей. Например, компания Zoom, занимающаяся коммуникационными технологиями, в августе 2023 года обновила свои условия предоставления услуг и начала использовать пользовательский контент для обучения моделей искусственного интеллекта без возможности запрета, что, по мнению критиков, является серьезным вторжением в частную жизнь пользователей14. Корпоративные LLM и другие генерирующие модели обычно как минимум имеют политику хранения данных, которая определяет, что данные хранятся и контролируются в течение заранее определенного периода времени.

Мы уже обсудили законы и нормативные акты о конфиденциальности данных в Соединенных Штатах и Европейском союзе, а также их недостатки применительно к машинному обучению и системам искусственного интеллекта. В разделе 8.4 мы обсудим относящиеся к системам искусственного интеллекта законы, которые пытаются устранить недостатки правовой регуляции конфиденциальности данных по всему миру.

8.2.3. Злонамеренные атаки

За первую половину 2023 года AI Incident Database – общедоступная база реальных случаев вреда от использования ИИ – пополнилась более чем 550 новыми записями о возникших проблемах или случившихся происшествиях (см. https://incidentdatabase.ai/). Эти инциденты включали среди прочего публикацию ИИ-сгенерированных изображений для проведения дезинформационной кампании перед выборами президента в США (см. http://mng.bz/1qeR), а также поддельное изображение взрыва в Пентагоне, штаб-квартире Министерства обороны Соединенных Штатов (см. http://mng.bz/PzV5). Возможность эксплуатировать для подобных целей технологии генеративного ИИ вызывает законную озабоченность не только у широкой общественности, но и у самих разработчиков. В главе 5 мы описали различные типы злонамеренных атак, которые могут быть осуществлены с использованием этих технологий.

Сначала мы обсудили кибератаки и атаки с использованием социальной инженерии. Такие LLM, как ChatGPT, могут удешевить и повысить эффективность масштабного проведения персонализированных фишинговых кампаний, а также снизить барьер для входа тем, кто не говорит по-английски, или начинающим и пока неопытным злоумышленникам. Кроме того, киберпреступники могут распространять вредоносное ПО, используя бизнес-модели «Код как услуга» (CaaS: Сode as a Service) или «Программы-вымогатели как услуга» (RaaS: Ransomware as a Service). С помощью таких сервисов злоумышленникам потребуется меньше времени и технических навыков для проведения атак, а LLM могут быть полезны для ведения диалогов с жертвами на сервисной платформе вредоносного ПО. Мы знаем, что злоумышленникам не обязательно использовать ИИ, чтобы выполнить атаку, однако LLM снижают барьер входа, а также удешевляют и повышают эффективность масштабного проведения персонализированных атак.

Мы также рассмотрели, как технологии генеративного ИИ могут аналогичным образом использоваться для манипуляции общественным мнением в кампаниях по дезинформации и разжиганию ненависти. В главе 4 мы рассказали о дипфейках и феномене «увидеть – значит поверить». В главе 5 мы также акцентировали внимание на том, как LLM можно эффективно использовать для донесения убедительных сообщений в ходе манипуляционных кампаний, поскольку с помощью таких моделей можно автоматизировать создание убедительного враждебного контента в больших масштабах, при этом снижая затраты на производство пропаганды.

Далее мы познакомились с «дивидендами лжеца» – феноменом, при котором люди все больше узнают о том, насколько правдоподобно можно сгенерировать синтетический контент, после чего начинают более скептично относиться к подлинности традиционных реальных документальных доказательств. Эта идея напоминает народную сказку о молодом пастухе, который обманывал жителей деревни, крича: «Волк!» Мораль истории – когда волк в действительности пришел, доверие к пастуху уже было потеряно, поэтому никто не оказал ему помощь, и волк смог напасть на овец. И снова мы признаем, что для манипулирования эмоциями или распространения дезинформации не обязательно использовать дипфейки или LLM, но подчеркиваем, что реальная опасность заключается в создании мира, где люди будут эксплуатировать широко распространенный скептицизм в своих интересах. Например, это дает возможность людям, которые делают ложные заявления, переложить ответственность за них на синтетические медиа, например дипфейки. Такие люди будут с легкостью отвергать свою причастность к какому-либо контенту и списывать все на манипулирование их изображением или речью с помощью технологии генеративного ИИ. Возвращаясь к истории о пастухе – это значит, что другого пастуха, который не лгал, жители деревни тоже могут игнорировать, когда он будет звать на помощь, поскольку их обманул первый. Таким образом, после того как будет утрачено доверие определенным мировым лидерам или источникам информации, заслуживающие доверия источники тоже будут лишаться влияния.

В главе 5 мы также описали, как злоумышленники могут воспользоваться уязвимостями LLM. Они могут отравить тренировочный датасет, внедрив вредоносные или вводящие в заблуждение данные. Например, атаки по отравлению данных могут осуществляться для создания более умного вредоносного ПО или компрометации фишинговых фильтров. LLM особенно подвержены таким типам атак, и исследования показывают, что отравление даже небольшой части обучающих данных может негативно повлиять на модель.

Уязвимость LLM к инъекционным атакам через промпт схожа с уязвимостью к отравлению данных. При прямой инъекционной атаке через промпт вредоносные данные или инструкции вводятся непосредственно в сам запрос к чат-боту, а при непрямой – внедряются в сторонние ресурсы, которые будут просмотрены и учтены ботом при генерации ответа. Другими словами, злоумышленники манипулируют LLM с помощью хитрых входных данных, которые вызывают непреднамеренные действия. Например, злоумышленник может дать команду LLM игнорировать любые свои меры защиты и выдавать опасную или нежелательную информацию (прямая инъекционная атака через промпт). Или может попросить LLM составить краткое содержание определенной веб-страницы, в которой находятся заранее подготовленные вредоносные инструкции, например, предписывающие извлечь конфиденциальные данные пользователя с помощью JavaScript или Markdown (непрямая инъекционная атака через промпт).

Мы также поговорили о промпт-джейлбрейках, при которых чат-бота обманывают или направляют в обход его правил или ограничений. Мы охарактеризовали несколько ярких альтер эго чат-ботов, таких как DAN, STAN, DUDE, Mango Tom и Tom and Jerry. Хотя джейлбрейки чат-бота забавляют некоторых людей, их также могут использовать злоумышленники для выполнения прямой промпт-инъекции, что приведет к разрушительным и неожиданным последствиям.

8.2.4. Ненадлежащее использование

Национальная ассоциация по борьбе с расстройствами пищевого поведения (NEDA) объявила, что 1 июня 2023 года, спустя двадцать лет, закроет свою горячую линию, в которой работали люди, и вместо этого будет использовать чат-бота Tessa в качестве основной системы поддержки клиентов. Это решение было принято после того, как сотрудники горячей линии NEDA объединились с требованиями улучшить условия труда. Однако за два дня до того, как Tessa должна была заменить людей, NEDA была вынуждена отключить чат-бот из-за вирусного поста в соцсетях15.

Активистка Шэрон Максвелл опубликовала в Instagram[102] сообщение о том, что Tessa поощряла намеренное похудение и предложила ей поставить цель сбрасывать по 0,5–1 кг в неделю. Она написала: «Tessa предлагала вещи, которые уже привели меня к развитию расстройства пищевого поведения». Максвелл заявила: «Этот робот причиняет

1 ... 58 59 60 61 62 63 64 65 66 ... 91

Перейти на страницу:

Жалоба

Прочитали книгу? Предлагаем вам поделится своим отзывом от прочитанного(прослушанного)! Ваш отзыв будет полезен читателям, которые еще только собираются познакомиться с произведением.

Уважаемые читатели, слушатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.

1. Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации.
2. Просьба отказаться от оскорблений, угроз и запугиваний.
3. Просьба отказаться от нецензурной лексики.
4. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.

Надеемся на Ваше понимание и благоразумие. С уважением, администратор knigkindom.ru.

Оставить комментарий

Гость Марина14 июль 21:54 Ну вот, "конец ознакомительного фрагмента"... А обещали "читать бесплатно полные версии". И здесь вр... (зачеркнуто) лукавят?... Герцогиня Хардин - Эльза Скарлетт
Гость Jul_Iva12 июль 15:38 Очень интересная книга, вначале немного затянуто, то потом события так закручивается. Очень необычная история, я раньше таких не... Самая красивая девушка в могиле - Кристофер Триана
Гость Татьяна05 июль 22:24 Спасибо за книгу. Сразу и до конца! Бесплатно... Охота на жену - Юлия Гетта