poniedziałek, 01 lipiec 2024 22:01

Wykorzystywanie treści w internecie przez AI - wypowiedź CEO ds. AI w Microsoft

Znaczenie wolnego dostępu AI do treści w internecie Znaczenie wolnego dostępu AI do treści w internecie fot: unsplash

W dobie sztucznej inteligencji, każdy powinien przemyśleć, co publikuje online, ponieważ AI prawdopodobnie wykorzysta to do swojego treningu. Mustafa Suleyman, współzałożyciel jednostki DeepMind AI w Google i obecny CEO ds. AI w Microsoft, podzielił się swoim zdaniem na temat wykorzystywania treści dostępnych w internecie.

  1. Co Mustafa Suleyman uważa o publikowaniu treści online w kontekście treningu AI?
  2. Jak Suleyman definiuje zasady fair use w kontekście AI?
  3. Jakie etyczne i prawne wyzwania związane z dostępem AI do treści online podkreśla Suleyman?
  4. Co Suleyman mówi o oznaczaniu treści w internecie, aby były niewidoczne dla AI?
  5. Jakie działania podejmują firmy w związku z pozyskiwaniem danych dla AI?

Treści w otwartym internecie

Mustafa Suleyman na Festiwalu Idei w Aspen, w rozmowie z CNBC, podkreślił, że dla firm zajmujących się AI jest w porządku przeszukiwać każdą część otwartego internetu - co oznacza wszelkie strony, które nie są chronione za pomocą paywalla lub logowania. W erze szybkiego rozwoju usług generatywnej sztucznej inteligencji, jest to mocne przypomnienie, że publikowanie czegokolwiek online, co ma być prywatne, może okazać się dostępne publicznie.

Suleyman powołał się na powszechnie akceptowaną zasadę, że treści dostępne w otwartym internecie są dostępne do wykorzystania na zasadach "fair use". Oznacza to, że można je cytować, recenzować, przerabiać czy remixować. Jego słowa wzbudziły kontrowersje, ponieważ fair use nie jest zaprojektowane do umożliwienia pełnego kopiowania treści w celach finansowych, co jest dużym problemem etycznym i prawnym.

Szare strefy i prawne wyzwania

Suleyman zwrócił uwagę, że wydawcy lub organizacje mogą oznaczać swoje treści, aby systemy takie jak roboty indeksujące Google nie miały do nich dostępu. Jednak zauważył, że niektóre strony oznaczają swoje treści jako dostępne tylko dla wyszukiwarek, ale nie dla innych celów, takich jak trening AI. Jest to szara strefa, którą Suleyman uważa za obszar do rozstrzygnięcia przez sądy. Może to sugerować, że według niego strony nie powinny móc blokować dostępu do swoich treści dla AI.

To zagadnienie jest aktualne, ponieważ firma Perplexity AI znalazła się ostatnio w centrum uwagi za rzekome ignorowanie takich oznaczeń online i zbieranie danych bez zgody. Wzmacnia to debatę na temat granic etycznego wykorzystania danych dostępnych w internecie.

Wyzwania w dobie AI

Generatywna sztuczna inteligencja potrzebuje ogromnych ilości danych do prawidłowego funkcjonowania. Bez danych jest jedynie zbiorem skomplikowanych obliczeń. Firmy takie jak Apple nawiązują partnerstwa z serwisami publikującymi treści, jak Reddit, aby uzyskać dostęp do miliardów tekstów i zdjęć użytkowników. Inne firmy są oskarżane o nielegalne pozyskiwanie danych, co prowadzi do licznych procesów sądowych, jak np. New York Times przeciwko firmom generującym muzykę AI.

To przypomnienie dla firm i użytkowników, aby być ostrożnym przy korzystaniu z odpowiedzi chatbotów, sprawdzając, czy nie naruszają one praw autorskich innych firm. Również należy uważać, jakie dane publikujemy online, aby nie stały się one materiałem treningowym dla modeli AI bez naszej zgody.

Mustafa Suleyman wskazuje na ważne kwestie związane z etycznym i prawnym wykorzystaniem danych dostępnych w internecie. W dobie szybkiego rozwoju sztucznej inteligencji, granice fair use oraz ochrona własności intelektualnej stają się kluczowymi tematami do rozstrzygnięcia przez sądy i regulacje prawne. Dla firm i użytkowników oznacza to potrzebę większej ostrożności w publikowaniu i korzystaniu z treści online.

 

Źródło: Inc