KnigkinDom.org»Книги » Разная литература»📕 Рациональность: от ИИ до зомби - Элиезер Шломо Юдковски

Рациональность: от ИИ до зомби - Элиезер Шломо Юдковски

Name: Рациональность: от ИИ до зомби - Элиезер Шломо Юдковски
Rating: 5 (1000 reviews)
Author: Элиезер Шломо Юдковски
ISBN: 00000000

Книгу Рациональность: от ИИ до зомби - Элиезер Шломо Юдковски читаем онлайн бесплатно полную версию! Чтобы начать читать не надо регистрации. Напомним, что читать онлайн вы можете не только на компьютере, но и на андроид (Android), iPhone и iPad. Приятного чтения!

1 ... 377 378 379 380 381 382 383 384 385 ... 457

Перейти на страницу:

Шрифт:

Интервал:

Закладка:

Сделать

захвата власти, даже когда это принесло бы племени чистую выгоду».

Пожалуй, действительно мудрее сформулировать это именно так. Если просто сказать «когда кажется, что это принесет племени чистую выгоду», то обязательно найдутся люди, которые возразят: «Но это не просто кажется — это действительно принесет племени чистую выгоду, если у руля встану я».

Идея ненадежного железа выглядит как нечто, находящееся полностью за пределами классической теории принятия решений. (Как она влияет на рефлексивную теорию принятия решений, я пока сказать не могу, но, судя по всему, решать эту проблему нужно именно на таком уровне.)

Но на человеческом уровне эта заплатка кажется простой. Как только вы узнаете об искажении, вы создаете правила, которые описывают искаженное поведение и ставят его вне закона. Правило, гласящее: «Ради блага племени не прибегай к обману ради захвата власти, даже ради блага племени». Или: «Ради блага племени не убивай, даже ради блага племени».

И тут приходит философ и предлагает свой «мысленный эксперимент», выстраивая сценарий, в котором по условию единственный возможный способ спасти пять невинных жизней — убить одного невиновного человека, и это убийство гарантированно спасет те пять жизней. «Поезд мчится на пятерых невинных людей, которых вы никак не можете предупредить, чтобы они успели отскочить в сторону, но вы можете толкнуть на рельсы перед поездом одного невиновного человека, и это остановит состав. Это ваши единственные варианты. Что вы сделаете?»

Альтруистичный человек, принявший определенные деонтологические запреты — которые кажутся вполне обоснованными, если взглянуть на историческую статистику результатов подобных рассуждений на ненадежном железе, — столкнувшись с этим мысленным экспериментом, может испытать некоторый душевный дискомфорт.

И вот ответ на этот философский сценарий, который мне еще ни разу не доводилось слышать от жертв философов:

«Вы утверждаете, что единственный возможный способ спасти пять невинных жизней — убить одного невиновного, и это убийство определенно спасет пять жизней, и что эти факты известны мне с абсолютной уверенностью. Но поскольку я работаю на испорченном железе, я не могу находиться в том эпистемическом состоянии, которое вы просите меня представить. Поэтому я отвечу так: в обществе Искусственных Интеллектов, заслуживающих статуса личности и лишенных врожденной склонности развращаться властью, для ИИ было бы правильным убить одного невиновного ради спасения пятерых, и более того, все его собратья с этим согласились бы. Однако я отказываюсь проецировать этот ответ на себя, поскольку эпистемическое состояние, которое вы просите меня представить, может существовать только у существ иного типа, нежели люди».

Как по мне, это выглядит как уловка. Я думаю, вселенная достаточно сурова, чтобы мы были вынуждены всерьез рассматривать подобные ситуации. Те, кто то и дело предлагают подобные мысленные эксперименты, вполне заслуживают такого ответа. Но любая человеческая правовая система так или иначе содержит в себе ответ на вопрос: «Сколько невиновных людей мы можем посадить в тюрьму, чтобы поймать виновных?», даже если это число нигде не записано.

Как человек, я стараюсь соблюдать деонтологические запреты, которые люди создали, чтобы жить в мире друг с другом. Но я не считаю, что наши деонтологические запреты буквально, по самой своей природе, внеконсеквенциально и терминально правильны. Я одобряю принцип «цель не оправдывает средства» как ориентир для людей, работающих на испорченном железе, но я бы не стал одобрять его как принцип для общества ИИ, которые строят хорошо откалиброванные прогнозы. (Если в человеческом обществе есть всего один ИИ, это добавляет другие соображения — например, будут ли люди брать с него пример.)

Поэтому я бы не сказал, что правильно спроектированный Дружественный ИИ непременно должен отказаться столкнуть того единственного человека с уступа, чтобы остановить поезд. Разумеется, я ожидал бы, что любой порядочный сверхинтеллект найдет лучшую третью альтернативу. Но если эти две альтернативы — единственные, и Дружественный ИИ сочтет, что разумнее столкнуть того человека с уступа — даже с учетом побочных эффектов для людей, которые увидят это и разнесут историю, и так далее, — то я не стану считать тревожным сигналом, если ИИ назовет правильным решением пожертвовать одним ради спасения пятерых. Опять же, я сам не хожу и не толкаю людей под поезда и не граблю банки ради финансирования своих альтруистических проектов. Так уж вышло, что я человек. Но если бы Дружественный ИИ развратился под влиянием власти, это было бы подобно тому, как если бы у него пошла красная кровь. Склонность развращаться под влиянием власти — это конкретная биологическая адаптация, поддерживаемая определенными когнитивными контурами, заложенная в нас генами по вполне понятной эволюционной причине. Она не появится в коде Дружественного ИИ спонтанно — точно так же, как его транзисторы не начнут кровоточить.

Я бы зашел еще дальше и сказал, что если бы существовали разумы с врожденным искажением, заставляющим их переоценивать внешний вред от действий, приносящих пользу им самим, то им понадобилось бы правило «цели не запрещают средства» — предписывающее делать то, что выгодно тебе самому, даже если это (как кажется) вредит племени. Гипотетически, если бы в их обществе не было такого правила, эти разумы отказывались бы дышать из страха израсходовать чужой кислород, и все они умерли бы. Для них случайные эксцессы, когда кто-то получает личную выгоду в чистый ущерб обществу, казались бы проявлением столь же осторожной добродетели — и действительно были бы им, — как и случаи, когда кто-то из нас, людей, проявляя осторожность, упускает возможность украсть буханку хлеба, которая действительно принесла бы ему самому больше пользы, чем убытка торговцу (с учетом всех побочных эффектов).

Принцип «цель не оправдывает средства» — это просто консеквенциалистское рассуждение на один метауровень выше. Если человек начинает думать на объектном уровне, что цель оправдывает средства, это приводит к ужасным последствиям из-за ненадежности нашего мозга; поэтому человеку не следует так думать. Но в конечном счете все это по-прежнему консеквенциализм. Просто это рефлексивный консеквенциализм для существ, которые знают, что их сиюминутные решения принимаются на ненадежном «железе».

288. Этические запреты.

Убили бы вы младенцев, если бы это было правильно? Если нет, то при каких обстоятельствах вы бы не стали поступать правильно? Если да, то насколько это должно быть правильно и ради какого количества младенцев?

— ужасный вопрос на собеседовании

На мгновение сменив роль, я профессионально заинтригован теорией решений в области «вещей, которые делать не следует, даже если кажется, что поступать так будет правильно».

Предположим, у нас есть рефлексивный ИИ, самомодифицирующийся и самосовершенствующийся,

1 ... 377 378 379 380 381 382 383 384 385 ... 457

Перейти на страницу:

Жалоба

Прочитали книгу? Предлагаем вам поделится своим отзывом от прочитанного(прослушанного)! Ваш отзыв будет полезен читателям, которые еще только собираются познакомиться с произведением.

Уважаемые читатели, слушатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.

1. Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации.
2. Просьба отказаться от оскорблений, угроз и запугиваний.
3. Просьба отказаться от нецензурной лексики.
4. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.

Надеемся на Ваше понимание и благоразумие. С уважением, администратор knigkindom.ru.

Оставить комментарий

Гость Татьяна17 июль 09:40 Начала читать эту книгу из-за предыдущего отзыва. Ну не ВАУ!, но интересно ... Неправильные - Катрин Корр
Гость Марина14 июль 21:54 Ну вот, "конец ознакомительного фрагмента"... А обещали "читать бесплатно полные версии". И здесь вр... (зачеркнуто) лукавят?... Герцогиня Хардин - Эльза Скарлетт
Гость Jul_Iva12 июль 15:38 Очень интересная книга, вначале немного затянуто, то потом события так закручивается. Очень необычная история, я раньше таких не... Самая красивая девушка в могиле - Кристофер Триана