Данные решают. Как управлять данными, чтобы создавать ценность для бизнеса - Светлана Бова
Книгу Данные решают. Как управлять данными, чтобы создавать ценность для бизнеса - Светлана Бова читаем онлайн бесплатно полную версию! Чтобы начать читать не надо регистрации. Напомним, что читать онлайн вы можете не только на компьютере, но и на андроид (Android), iPhone и iPad. Приятного чтения!
Шрифт:
Интервал:
Закладка:
Такие иски множатся по всему миру. Авторы, художники, фотографы, издатели требуют либо компенсаций, либо удаления их данных из обучающих выборок. Пока крупным игрокам удается отбиваться — они ссылаются на доктрину «добросовестного использования» (fair use), которая в США довольно широка. Но в Европе, с ее жестким GDPR, и в Азии подход может быть совсем другим.
Представьте гипотетический сценарий. Суд в какой-то стране принимает решение, что обучать модели на публичных данных без явного согласия авторов незаконно. И постановляет: все модели, обученные с нарушением, должны быть заблокированы или удалены. Что произойдет? Индустрия, построенная на миллиардах долларов инвестиций, рухнет в одночасье.
Конечно, вероятность такого исхода невелика — слишком мощное лобби у технологических гигантов. Но риск не нулевой.
А есть еще и геополитический риск. Мы уже видели, как Visa и Mastercard ушли из России, как страну отключили от SWIFT, как закрыли доступ к западным технологиям. Представьте, что завтра правительство США, Китая или Евросоюза решит ограничить доступ к своим моделям для российских пользователей и компаний. Не нужно обладать богатой фантазией, чтобы понять, как быстро это приведет к коллапсу во многих сферах бизнеса, которые уже вовсю применяют иностранные LLM.
Поэтому вопрос о том, можно ли полагаться на иностранные модели, перестает быть абстрактным. Это вопрос технологической безопасности и суверенитета. Хорошо бы, чтобы мы как страна сохранили импортонезависимый статус и у нас к этому времени были свои микрочипы и модели, обученные на своих данных и работающие под своим контролем. И хорошо бы, чтобы именно они были внедрены в вашем бизнесе.
ПРОРЫВ ТАМ, ГДЕ ЛЕГАЛЬНО СОЕДИНЯТ РЕАЛЬНЫЕ ДАННЫЕ
Но вернемся к проблеме дефицита данных. Если количество общедоступных текстов и изображений исчерпано, где брать новые качественные данные для обучения?
У мирового сообщества есть еще один ответ, кроме синтетических данных или переобучения на отфильтрованной генеральной совокупности из более качественных данных. Он парадоксален: эти данные уже есть, но лежат под замком.
Это данные компаний, государственных учреждений, медицинских центров, промышленных предприятий. Реальные, незашумленные, отражающие настоящие процессы, а не интернет-дискуссии. Данные о транзакциях, логистике, производственных циклах, обращениях пациентов, перемещениях транспорта.
Но эти данные либо конфиденциальны, либо разрозненны, либо просто не готовы к использованию. Их нельзя просто скормить модели — нужно сначала решить вопросы приватности, безопасности, совместимости, юридической чистоты.
Тот, кто сможет легально объединить деперсонализированные реальные данные из множества источников — бизнесов, госорганов, исследовательских центров, — получит колоссальное преимущество в гонке ИИ[90]. Это как если бы в эпоху золотой лихорадки вы не просто нашли богатое месторождение, а построили единственную дорогу, по которой все золото доставляется на переработку.
Но объединение данных требует инфраструктуры. Нужны платформы, которые позволяют обмениваться информацией, не раскрывая ее в чистом виде. Необходимы стандарты описания данных, чтобы массивы из разных источников можно было сопоставлять. Требуются четкие правовые рамки, чтобы участники обмена не боялись судебных исков.
ДОВЕРЕННЫЙ ИИ
Недаром концепция Доверенного искусственного интеллекта закреплена в национальной стратегии развития ИИ России. За этими красивыми словами стоит конкретное содержание.
Доверенный ИИ — это модели, которые работают на легальных данных, чьи решения можно объяснить, которые не дискриминируют и не нарушают приватность. А еще — фундаментальные права человека.
Это не просто модный термин, а набор требований, которые постепенно станут обязательными. Сначала для государства, потом — для бизнеса, который хочет с государством работать. Логика простая: если вы поставляете что-то государству или используете госданные, вам придется соответствовать. В ближайшем будущем в России появится реестр доверенных технологий на базе искусственного интеллекта. И попадание в него станет не просто знаком качества, а пропуском на многие рынки.
А теперь честно ответьте себе на вопрос: можете ли вы доказать, что иностранные LLM — OpenAI, Anthropic, Google Gemini — соответствуют этим требованиям?
Нет. Не можете.
И не потому, что вы плохо искали. А потому, что вам никогда не дадут этой информации.
ПОЧЕМУ ИНОСТРАННЫЕ ВЕНДОРЫ НЕ РАСКРОЮТ КАРТЫ
Еще раз взглянем на ситуацию в целом. Гонка ИИ — это гонка вооружений XXI века. И в ней технологии — главный актив, который определяет национальную безопасность и конкурентоспособность. Ни одна страна не станет раскрывать детали своих военных разработок. Ни одна компания, работающая в тесной связке с правительством (а все крупные игроки так или иначе с ним связаны), не расскажет вам, на каких данных обучалась модель, не покажет внутреннюю архитектуру и не даст гарантий, что завтра доступ к модели не закроют по решению регулятора.
Возьмем OpenAI. Формально это независимая организация, но по факту — ключевой игрок в американской технологической экосистеме. Когда встанет выбор между бизнесом и национальными интересами, вы знаете, что победит.
Далее — DeepSeek. Китайская модель, которая в 2025 году наделала много шума. Да, она показывает впечатляющие результаты. Но задайте себе простой вопрос: если вы загрузите в нее данные о своем бизнесе, где они окажутся? Кто будет иметь к ним доступ? Не появится ли завтра постановление, обязывающее передавать эти данные китайским госорганам? Мы не знаем. И не узнаем, пока не станет слишком поздно.
Проблема даже не в злом умысле, а в непрозрачности. Вы не можете провести аудит иностранной модели. Вы не знаете, какие данные в ней лежат, как они обрабатываются, кому передаются. Вы просто верите на слово.
А если завтра всё действительно перейдет на ИИ — если модели начнут управлять цепочками поставок, принимать решения в суде, диагностировать болезни, — готовы ли вы к риску, что этот ИИ будет намеренно ухудшен для иностранных пользователей? Что в код добавят функцию, которая при определенных геополитических условиях начнет работать против ваших интересов?
История последних десяти лет учит нас, что это не паранойя, а трезвый расчет рисков. Мы видели, как закрывают границы, блокируют доступ к софту и облакам. Почему с ИИ должно быть по-другому?
Уже сейчас мы знаем, что закон об искусственном интеллекте появится в России в ближайшие годы[91]. Наиболее вероятно, модели там разделят на следующие категории:
• суверенные — разработанные, обученные и эксплуатируемые на российских данных, российскими гражданами, на территории РФ;
• национальные — допускающие использование иностранных решений на базе открытого исходного кода;
• доверенные — модели, предназначенные для работы в особо значимых отраслях, включая государственное управление. По ним будет требование проверки ФСТЭК и ФСБ.
Прочитали книгу? Предлагаем вам поделится своим отзывом от прочитанного(прослушанного)! Ваш отзыв будет полезен читателям, которые еще только собираются познакомиться с произведением.
Уважаемые читатели, слушатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.
- 1. Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации.
- 2. Просьба отказаться от оскорблений, угроз и запугиваний.
- 3. Просьба отказаться от нецензурной лексики.
- 4. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.
Надеемся на Ваше понимание и благоразумие. С уважением, администратор knigkindom.ru.
Оставить комментарий
-
Неважно26 июнь 15:53
Не понравился роман от слова совсем. Ни главные герои, ни их родители, в наибольшей степени - женькина мамашка- ..кашка. Если она...
Брак по залёту - Натаэль Зика
-
Гость Мария24 июнь 16:51
Очень интересный роман, насыщенный сюжет и сильные герои! Понравилось очень! Надеюсь, есть продолжение, концовка прямо кричит об...
Разведенка для дракона, или Личный лекарь генерала - Лана Ларсон
-
Nisa23 июнь 10:38
очень тяжело ориентироваться без оглавления. искала Фитцека Последний пассажир -152 страница. если кому надо. Аэрофобия-82стр. ...
Современный зарубежный детектив-14. Книги 1-22 - Себастьян Фитцек
