KnigkinDom.org» » »📕 Генеративный искусственный интеллект. Как ИИ меняет нашу жизнь и работу - Нума Дхамани

Генеративный искусственный интеллект. Как ИИ меняет нашу жизнь и работу - Нума Дхамани

Книгу Генеративный искусственный интеллект. Как ИИ меняет нашу жизнь и работу - Нума Дхамани читаем онлайн бесплатно полную версию! Чтобы начать читать не надо регистрации. Напомним, что читать онлайн вы можете не только на компьютере, но и на андроид (Android), iPhone и iPad. Приятного чтения!

1 ... 26 27 28 29 30 31 32 33 34 ... 91
Перейти на страницу:

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
нашла там так много своих работ, что они заполнили весь экран моего рабочего стола», – заявила Андерсен и выразила беспокойство, что инструменты искусственного интеллекта снова будут использованы для искажения ее творений54.

Рис. 4.8. Изображение, созданное ИИ на базе генеративной модели с открытым исходным кодом с помощью промпта «Веб-комикс Сары Андерсен»

Андерсен является одним из трех истцов, наряду с Карлой Ортис и Келли Маккернан, подавших коллективный иск против Midjourney, Stability AI и DeviantArt. Как и Андерсен, Маккернан и Ортис обнаружили, что эти инструменты могут создавать изображения в их стилях, что им лично кажется нарушением персональных прав. «Они обучили эти модели на наших работах. Они отняли у нас право решать, хотим мы в этом участвовать или нет», – сказала Ортис54, 55.

Еще неизвестно, чем закончится дело Андерсен, Ортис и Маккернан [50], но люди по всему миру продолжают использовать эти инструменты для создания новых форм искусства и экспериментов с ними. Доктрина добросовестного использования недостаточно строга, и поэтому новые судебные прецеденты могут изменить текущий статус-кво в практиках разработки и использования ИИ-моделей. Но в то же время многие наборы данных и модели, о которых мы говорим, уже распространяются по принципам открытого исходного кода, а это означает, что любой желающий может либо обучить свою собственную модель, либо создать новую версию уже существующей. Независимо от того, будут ли определенные компании менять процедуру создания своего набора данных или они решат в конечном итоге оплатить ущерб или лицензионные сборы, художественные работы, сгенерированные с помощью ИИ, – от комиксов до музыки и поэзии – уже вошли в нашу жизнь.

4.3.2. Свободное программное обеспечение и лицензии

Как мы уже упоминали, из-за того, что для создания больших языковых моделей требуется огромный объем данных и вычислений, эта работа до сих пор в основном выполнялась несколькими крупными технологическими компаниями и хорошо финансируемыми стартапами. Но сейчас ситуация меняется благодаря сообществу свободного программного обеспечения (Open Source community). Свободное программное обеспечение подразумевает, что его исходный код является открытым и доступным для использования и модификации. Более того, Open Source – движение, сторонники которого верят, что программное обеспечение с открытым исходным кодом является общественным благом и ведет к улучшению программного обеспечения за счет расширения сотрудничества и вовлеченности, а также снижения входного барьера. Точно так же, сторонники движения за открытые данные считают, что при широком доступе к данным общественность будет более информирована, поэтому данные, собранные или подготовленные правительственными и некоммерческими организациями, научно-исследовательскими и другими сообществами, должны быть в свободном доступе для использования и развития.

СВОБОДНОЕ ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ подразумевает, что его исходный код является открытым и доступным для использования и модификации.

Интересно, что модели для генерации изображений обогнали LLM в плане доступности данных. После запуска проекта ImageNet профессора информатики Фей-Фей Ли из Стэндфордского университета ученые, интересуясь моделям компьютерного зрения, собрали большой набор данных изображений. В 2006 году Ли пришла в голову пророческая гипотеза о том, что наибольшие успехи в компьютерном зрении могут быть достигнуты не обязательно за счет новых, более совершенных алгоритмов, а за счет более качественных (и объемных) данных. Она начала создавать базу данных ImageNet, которая в конечном итоге разрослась до миллионов изображений по сотням видов объектов: животным, предметам домашнего обихода, ландшафту и многому другому. Вначале к ImageNet относились со скептицизмом, но потом эта сеть стала стандартом, по которому все модели компьютерного зрения оценивают свои результаты. Это дало не только толчок к решению проблемы обнаружения объектов (которая теперь считается «решенной» на датасете ImageNet, поскольку новейшие модели работают практически идеально), но и положило начало эре совместного использования эталонных наборов данных для обучения и тестирования моделей. О влиянии ImageNet Ли сказала: «Сейчас очень быстро растут и расцветают всевозможные наборы данных, от видео до записей речи, игр и всего остального». Конечно, это также послужило доказательством ее первоначальной гипотезы, которая затем подтвердилась успехом больших языковых моделей56.

Таким образом, во всех проблемных областях, от естественного языка до изображений и видео, полезно неустанно собирать данные. Как и более поздние наборы данных, ImageNet был сформирован фотографиями из интернета, которые затем были размечены сотрудниками краудсорсинговой платформы Amazon Mechanical Turk. С помощью минимального количества кода люди могут собирать текстовые и визуальные данные, подключаясь к веб-странице и копируя ее контент. Эта практика называется веб-скрейпингом (web scraping) и неоднократно признавалась законной57, если собираемые данные находились в открытом доступе, – практически это все, что вы можете увидеть в интернете. Например, если сайт индексируется поисковыми системами, это значит, что боты автоматически извлекают из него данные. Некоторые владельцы веб-сайтов – в частности, Reddit, X (Twitter) и Stack Overflow, – которые часто являются источниками данных для LLM, публично заявили о планах взимать плату с разработчиков искусственного интеллекта за использование этих данных, хотя неясно, как это будет выглядеть на практике. Скорее всего, они будут продавать наборы данных, из-за чего отпадет необходимость в веб-скрейпинге58. Люди, которые занимаются поддержкой веб-сайтов, могут добавить файл robots.txt – набор инструкций, указывающих боту, на каких страницах он может извлекать данные, а на каких нет. На практике файлы robots.txt – просто рекомендации, и вредоносные программы легко могут их игнорировать.

И хотя юридические ограничения для общедоступного контента минимальны, не стоит забывать что и код, и данные имеют лицензии. Некоторые из них являются лицензиями с открытым исходным кодом, которые в явном виде разрешают все производные виды использования. Например, лицензия MIT является разрешительной лицензией на программное обеспечение – и по факту самой популярной лицензией на GitHub, – которая позволяет многократное использование кода внутри проприетарного ПО59. Другие лицензии допускают использование только в некоммерческих целях, только с указанием авторства или при соблюдении множества других условий. Лицензии на код и данные имеют юридическую силу60.

В коллективном иске, поданном разработчиками ПО против Microsoft, GitHub и OpenAI из-за выпуска LLM-инструмента Copilot, вопрос нарушения лицензии на код является центральным. Copilot основан на версии модели GPT‐3 от OpenAI, специально настроенной для написания кода и обученной на тысячах репозиториев GitHub. Как и в случае с авторским правом, существует судебное разбирательство по поводу использования этого кода для обучения LLM; пока неясно, как в этом случае будут задействованы законы о лицензировании вместо доктрины добросовестного использования. Истцы по делу утверждают, что использование приравнивается к «компьютерному пиратству в беспрецедентных масштабах», в то время как ответчики заявляют, что истцы подрывают принципы открытого исходного кода, требуя «судебного запрета и многомиллиардной непредвиденной прибыли» за «программное обеспечение, которым они и так охотно делятся»61.

Между тем такие компании, как Hugging

1 ... 26 27 28 29 30 31 32 33 34 ... 91
Перейти на страницу:
Отзывы - 0

Прочитали книгу? Предлагаем вам поделится своим отзывом от прочитанного(прослушанного)! Ваш отзыв будет полезен читателям, которые еще только собираются познакомиться с произведением.


Уважаемые читатели, слушатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.

  • 1. Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации.
  • 2. Просьба отказаться от оскорблений, угроз и запугиваний.
  • 3. Просьба отказаться от нецензурной лексики.
  • 4. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.

Надеемся на Ваше понимание и благоразумие. С уважением, администратор knigkindom.ru.


Партнер

Новые отзывы

  1. Гость Екатерина Гость Екатерина24 март 10:12 Книга читается ужасно. Такого тяжелого слога ещё не встречала. С трудом дочитала до середины и с удовольствием бросила. ... Невеста напрокат, или Любовь и тортики - Анна Нест
  2. Гость Любовь Гость Любовь24 март 07:01 Книга понравилась) хотя главный герой, конечно, не фонтан, но достаточно интересно. Единственное, с середины книги очень... Мама для подкидышей, или Ненужная истинная дракона - Анна Солейн
  3. Гость Читатель Гость Читатель23 март 22:10 Адмну, модератору....мне понравился ваш сайт у вас очень порядочные книги про попаданцев....... спасибо... Маринка, хозяйка корчмы - Ульяна Гринь
Все комметарии
Новое в блоге