Η εκπαίδευση τεχνητής νοημοσύνης (AI) βασίζεται σε τεράστιους όγκους δεδομένων. Αυτά τα δεδομένα μπορεί να περιλαμβάνουν κείμενα, εικόνες, ήχους και άλλα δημιουργικά έργα, πολλά εκ των οποίων προστατεύονται από πνευματικά δικαιώματα. Σε αυτό το πλαίσιο, οι άδειες Creative Commons (CC) έχουν αποκτήσει ιδιαίτερη σημασία, καθώς επιτρέπουν τη χρήση περιεχομένου υπό συγκεκριμένους όρους. Ωστόσο, η εφαρμογή των αδειών CC στην εκπαίδευση AI παρουσιάζει αρκετές προκλήσεις και νομικές ασάφειες.

Το Νομικό Πλαίσιο
Η πνευματική ιδιοκτησία είναι ένα πολύπλοκο νομικό πεδίο, με σημαντικές διαφοροποιήσεις ανά χώρα. Για παράδειγμα, στην Ιαπωνία ή την Ε.Ε. υπάρχουν νομικές εξαιρέσεις που επιτρέπουν την αναπαραγωγή για σκοπούς εκπαίδευσης AI χωρίς την ανάγκη άδειας. Στην Αυστραλία και στο Ηνωμένο Βασίλειο, οι εξαιρέσεις είναι πολύ πιο περιορισμένες.
Αυτό σημαίνει ότι η απλή χρήση έργων που διατίθενται με άδεια CC για την εκπαίδευση ενός μοντέλου AI μπορεί να είναι νόμιμη σε μία χώρα, αλλά παράνομη σε μια άλλη. Οι άδειες Creative Commons εφαρμόζονται μόνο όταν η χρήση απαιτεί άδεια σύμφωνα με τη νομοθεσία περί πνευματικών δικαιωμάτων — και αυτό ποικίλει γεωγραφικά και κατά περίπτωση.
Τα Στοιχεία των Αδειών CC και η Εφαρμογή τους στην AI
Οι άδειες Creative Commons περιλαμβάνουν διάφορους όρους, οι οποίοι είναι σημαντικό να εξετάζονται με προσοχή όταν ένα έργο πρόκειται να χρησιμοποιηθεί για την εκπαίδευση AI:
1. Αναφορά (Attribution – BY)
Όλες οι άδειες CC απαιτούν αναγνώριση του δημιουργού. Στην περίπτωση της εκπαίδευσης AI, αυτό μπορεί να μεταφραστεί σε μια γενική αναφορά στην πηγή του συνόλου δεδομένων (π.χ., “Training data from the LAION dataset”). Σε περιπτώσεις που το αποτέλεσμα ενός μοντέλου μπορεί να συνδεθεί με συγκεκριμένο έργο, όπως μέσω τεχνικών ανάκτησης (π.χ., RAG), συνιστάται να δίνεται πλήρης αναφορά στην πηγή.
2. Όμοια Διανομή (ShareAlike – SA)
Εάν τα δεδομένα υπόκεινται στον όρο ShareAlike, οποιοδήποτε έργο βασίζεται σε αυτά —συμπεριλαμβανομένων των μοντέλων ή των αποτελεσμάτων τους— θα πρέπει να διατίθεται με την ίδια άδεια. Αυτή η προσέγγιση θεωρείται συντηρητική αλλά προληπτικά συνεπής.
3. Μη Εμπορική Χρήση (NonCommercial – NC)
Όταν μια άδεια περιλαμβάνει τον όρο NonCommercial, η χρήση του έργου δεν πρέπει να αποσκοπεί σε εμπορικό όφελος. Αυτό περιπλέκει τη χρήση σε εμπορικά AI μοντέλα. Η εκπαίδευση ενός AI μοντέλου με τέτοιο υλικό και η πώληση του τελικού προϊόντος μπορεί να θεωρηθεί παραβίαση της άδειας.
4. Χωρίς Παράγωγα Έργα (NoDerivatives – ND)
Εάν μια άδεια περιλαμβάνει τον περιορισμό ND, τότε το έργο δεν μπορεί να τροποποιηθεί. Αν και τα AI μοντέλα δεν παράγουν απευθείας “παράγωγα έργα”, η χρήση τέτοιων έργων για εκπαίδευση AI θα πρέπει να αποφεύγεται, υπό τη συντηρητική προσέγγιση.
Η Εκπαίδευση και η Μνήμη των Μοντέλων AI
Η διαδικασία εκπαίδευσης μοντέλων AI περιλαμβάνει σχεδόν πάντα την αντιγραφή των δεδομένων. Αυτή η αντιγραφή μπορεί να εμπίπτει στο δίκαιο της πνευματικής ιδιοκτησίας, αναλόγως της δικαιοδοσίας.
Επιπλέον, ένα άλλο κρίσιμο ζήτημα είναι η μνήμη του μοντέλου (memorization), δηλαδή η δυνατότητα ενός μοντέλου να αναπαράγει αυτούσιο ή σχεδόν αυτούσιο περιεχόμενο από το υλικό εκπαίδευσης. Αν ένα AI μοντέλο “θυμάται” μια εικόνα ή ένα κείμενο και το αναπαράγει, μπορεί να θεωρηθεί ότι έχει αποθηκεύσει ένα προστατευμένο έργο, το οποίο εμπλέκει δικαιώματα πνευματικής ιδιοκτησίας.
Ωστόσο, η απόδειξη της παραβίασης είναι δύσκολη, καθώς δεν υπάρχει τρόπος να μετρηθεί αντικειμενικά ο βαθμός απομνημόνευσης. Επιπλέον, δεν είναι όλες οι περιπτώσεις απομνημόνευσης παραβίαση. Οι προγραμματιστές προσπαθούν να αποτρέψουν τέτοιες περιπτώσεις, αλλά δεν μπορούν να τις εξαλείψουν εντελώς.
Πότε Ενεργοποιούνται οι Όροι της Άδειας;
Οι όροι όπως το BY, SA, και ND ενεργοποιούνται μόνο όταν το έργο ή η παραλλαγή του κοινοποιείται δημόσια. Για παράδειγμα, αν ένα μοντέλο παράγει ένα αποτέλεσμα σχεδόν όμοιο με το αρχικό έργο, τότε απαιτείται αναφορά του δημιουργού.
Αντίθετα, ο όρος NC ισχύει για όλες τις χρήσεις που απαιτούν άδεια — ακόμη και αν δεν υπάρξει δημόσια κοινοποίηση. Αυτό σημαίνει ότι το αν ένα έργο με άδεια NC μπορεί να χρησιμοποιηθεί εξαρτάται από το αν η χρήση του είναι μη εμπορική σε όλες τις φάσεις.
Η Σημασία της Συντηρητικής Συμμόρφωσης
Λόγω των νομικών ασάφειών, πολλοί ερευνητές και προγραμματιστές AI επιλέγουν να συμμορφώνονται με όλους τους όρους των αδειών CC, ακόμη και όταν πιθανόν δεν απαιτείται, ως ένδειξη καλής πίστης και για τη μείωση του νομικού κινδύνου. Αυτή η στρατηγική ονομάζεται υπερσυμμόρφωση (overcompliance).
Μια τέτοια προσέγγιση μπορεί να περιλαμβάνει την αποφυγή χρήσης έργων με περιοριστικούς όρους (όπως NC ή ND), τη διασφάλιση της αναφοράς σε όλα τα δεδομένα εκπαίδευσης, και τη διάθεση των εξόδων ή και του ίδιου του μοντέλου υπό την ίδια άδεια (σε περίπτωση SA).
Τι Σημαίνει Αυτό για τους Δημιουργούς;
Οι δημιουργοί που επιλέγουν να διαθέσουν το έργο τους με άδεια CC πρέπει να γνωρίζουν ότι το έργο τους μπορεί να χρησιμοποιηθεί για την εκπαίδευση μοντέλων AI. Αν αυτό δεν τους βρίσκει σύμφωνους, θα πρέπει να εξετάσουν την προσθήκη επιπλέον περιορισμών ή την επιλογή πιο περιοριστικής άδειας. Το πλαίσιο των αδειών CC προς το παρόν δεν παρέχει δυνατότητα εξαίρεσης από την εκπαίδευση AI με σαφήνεια.
Η χρήση έργων με άδεια Creative Commons στην εκπαίδευση μοντέλων τεχνητής νοημοσύνης είναι ένα εξαιρετικά σύνθετο και δυναμικό πεδίο. Παρά τις κατευθυντήριες γραμμές που μπορούν να προσφέρουν οι άδειες CC, η τελική νομιμότητα μιας τέτοιας χρήσης εξαρτάται από πολλούς παράγοντες: τη χώρα χρήσης, τον τύπο της άδειας, τον τρόπο χρήσης και τις τεχνολογικές μεθόδους.
Οι προγραμματιστές καλούνται να ενεργούν με υπευθυνότητα και καλή πίστη, ενώ οι δημιουργοί περιεχομένου πρέπει να κατανοούν πού και πώς μπορεί να χρησιμοποιηθεί το έργο τους. Μέχρι να υπάρξει ένα πιο ξεκάθαρο και ομοιόμορφο νομικό πλαίσιο, η συζήτηση γύρω από την τεχνητή νοημοσύνη και τις άδειες CC θα παραμείνει στο προσκήνιο, με την τεχνολογία και τη νομική σκέψη να εξελίσσονται παράλληλα.
Πηγή άρθρου: https://creativecommons.org