Искусственный интеллект придет за вашими данными в социальных сетях: можете ли вы что-нибудь с этим поделать?

4
компьютеры и технологии 31.webp.webp

Последнее обновление 14.03.2024 — Иван Катанаев

Одним из новейших способов монетизации пользовательских данных являются сделки с компаниями, занимающимися искусственным интеллектом. Но могут ли обычные пользователи что-нибудь сделать для защиты своих данных и контента?

Платформы социальных сетей заключили сделки с компаниями, занимающимися искусственным интеллектом

Использование данных социальных сетей для обучения генеративных моделей искусственного интеллекта было спорным шагом, но, похоже, это не мешает компаниям социальных сетей раздавать пользовательские данные.

Meta уже использует данные социальных сетей для обучения генеративным функциям ИИ, анонсированным на Meta Connect в 2023 году. Сюда входят Meta AI и такие функции, как создание сгенерированных ИИ стикеров в WhatsApp.

Как заявил Майк Кларк, директор по управлению продуктами Meta, в сообщении Meta Newsroom:

«Общедоступные сообщения из Instagram и Facebook, включая фотографии и текст, были частью данных, используемых для обучения генеративных моделей искусственного интеллекта, лежащих в основе функций, которые мы анонсировали на Connect».

Эта тенденция, похоже, не замедлится в 2024 году. По данным Reuters, Reddit заключил соглашение с Google, чтобы сделать контент платформы социальных сетей доступным для обучения моделей ИИ.

По теме:  Прокси против VPN: в чем разница и что лучше использовать?

Заявка Reddit S-1 на IPO, поданная 22 февраля 2024 года, подтверждает, что компания изучает лицензионные сделки. В заявке указано:

«Данные Reddit являются основополагающим элементом для создания современных технологий искусственного интеллекта и многих программ LLM. Мы считаем, что огромный массив диалоговых данных и знаний Reddit будет продолжать играть роль в обучении и совершенствовании LLM».

В нем уточняется, что Reddit «находится на ранних стадиях разрешения третьим сторонам лицензировать доступ к поиску, анализу и отображению исторических данных и данных в реальном времени с нашей платформы» для обучения LLM.

И хотя Meta и Reddit — одни из самых громких имен в социальных сетях, они не единственные платформы, использующие данные социальных сетей для обучения ИИ. Согласно отчету 404 Media, Tumblr и WordPress.com готовятся продавать пользовательские данные Midjourney и OpenAI.

Можете ли вы запретить платформам продавать ваши данные в социальных сетях для обучения ИИ?

Скорее всего, если вы используете Facebook, Instagram, Reddit, Tumblr или WordPress.com, ваш общедоступный контент уже использовался при обучении LLM.

Например, если вы воспользуетесь инструментом поиска Washington Post, чтобы узнать, какие сайты были включены в набор данных Google C4, который использовался в рамках обучения Барда, вы увидите, что на Reddit.com приходится 7,9 миллиона токенов.

На Tumblr.com приходится 1,6 миллиона токенов. Мой собственный небольшой веб-сайт, использующий WordPress.com, содержал 14 000 токенов, поэтому в набор данных могли быть включены небольшие личные блоги.

Учитывая продолжающиеся сделки между компаниями, занимающимися искусственным интеллектом, и компаниями, занимающимися социальными сетями, лицензионные соглашения будут означать, что эти данные будут активно продаваться, а не просто удаляться из Интернета.

Но когда дело доходит до будущей обработки, что вы можете с этим поделать? Meta представила форму прав субъектов данных генеративного ИИ, которая позволяет вам возражать или ограничивать обработку ваших личных данных третьими лицами для обучения моделям генеративного ИИ Meta.

Примечательно, что эта опция не позволяет вам возражать против собственной обработки ваших данных компанией Meta для обучения генеративному ИИ. Более того, когда я отправил заявку на возражение против использования моих личных данных с помощью формы, в службе поддержки требовалось доказать, что моя личная информация уже появляется в результатах генеративного ИИ Meta.

Tumblr также представил возможность отказаться от обмена контентом ваших общедоступных блогов с третьими лицами с помощью настроек вашего блога. Вы можете найти его в своих настройках, нажав на свой блог и прокрутив вниз до настроек видимости. Затем выберите «Запретить доступ третьих лиц к вашему блогу».

Когда дело доходит до такой платформы, как Instagram, вы можете попытаться переключить свою учетную запись Instagram на частную, чтобы предотвратить использование ваших данных. Это не гарантирует, что ваши данные не будут использованы, но поскольку сбор данных для LLM, похоже, сосредоточен на общедоступных данных, это может быть потенциальной защитой.

Вы также можете сделать свою учетную запись X (Twitter) конфиденциальной, но, опять же, это всего лишь потенциальная мера безопасности, которая не гарантирует конфиденциальность ваших данных.

В совместном заявлении различных национальных комиссаров по информации и экспертов по всему миру также предлагаются некоторые действия для людей, стремящихся минимизировать риск конфиденциальности, связанный со сбором данных компаниями, занимающимися искусственным интеллектом. Совет включает в себя:

  • Прочтите условия и политику конфиденциальности веб-сайта, чтобы узнать, как он передает вашу личную информацию.
  • Ограничьте информацию, которую вы публикуете в Интернете, особенно конфиденциальную информацию.
  • Управляйте настройками конфиденциальности.
  • Думайте о долгосрочной перспективе об информации, которой вы делитесь в Интернете.
  • Свяжитесь с компанией социальной сети или с веб-сайтом, если вы считаете, что ваши данные были удалены ненадлежащим образом. Если вы недовольны их ответом, подайте жалобу в соответствующий орган по защите данных.

Вы также можете удалить определенную информацию в Интернете, если вас не устраивает доступ к ней третьих лиц, хотя общедоступная информация в ваших профилях, возможно, уже была удалена.

К сожалению, мы, обычные пользователи, можем сделать очень мало, чтобы защитить наши данные от компаний, занимающихся искусственным интеллектом. Реальный контроль над этой информацией, скорее всего, будет возможен только с помощью регулирующих органов.

Предыдущая статьяКак использовать виджет ChatGPT на Android
Следующая статьяИнструмент sudo появится в Windows: как и зачем его использовать
Иван Катанаев
Иван - штатный писатель и любитель слов. После окончания бакалавриата он решил продолжить свое увлечение техникой, развлечениями и игровой сферой. Он надеется достучаться до других, просветить их и обсудить с ними вопросы с помощью письменного слова. С ним вы узнаете, как обеспечить безопасность в интернете с помощью лучших брандмауэров и антивирусных программ, как управлять своими паролями и как распознавать мошенников и риски безопасности.