Αναγνωρίζοντας ότι ορισμένα δεδομένα δεν πρέπει να κοινοποιούνται (για λόγους ηθικής, δεοντολογίας ή/και απορρήτου) και ορισμένα δεν μπορούν να κοινοποιηθούν (για νομικούς ή άλλους λόγους), τα Creative Commons (CC) πιστεύουν ότι έχει αξία η παροχή κινήτρων για τη δημιουργία, την κοινή χρήση και τη χρήση ανοικτών δεδομένων για την προώθηση της παραγωγής γνώσης. Καθώς οι ανοιχτές κοινότητες συνεχίζουν να φαντάζονται, να σχεδιάζουν και να δημιουργούν ψηφιακά δημόσια αγαθά και δημόσιες υπηρεσίες υποδομής για την εκπαίδευση, την επιστήμη και τον πολιτισμό, αυτά τα αγαθά και οι υπηρεσίες –όποτε είναι δυνατό και κατάλληλο– θα πρέπει να παράγουν, να μοιράζονται και/ή να βασίζονται σε ανοιχτά δεδομένα.
Ανοικτά δεδομένα και ψηφιακά δημόσια αγαθά (DPG)
Τα CC είναι μέλος της Συμμαχία Δημοσίων Ψηφιακών Αγαθών (DPGA) και τα νομικά εργαλεία των CC έχουν αναγνωριστεί ως δημόσια ψηφιακά αγαθά (DPGs). Τα DPG είναι «λογισμικό ανοιχτού κώδικα, ανοιχτά πρότυπα, ανοιχτά δεδομένα, ανοιχτά συστήματα AI και συλλογές ανοιχτού περιεχομένου που συμμορφώνονται με το απόρρητο και άλλες εφαρμοστέες βέλτιστες πρακτικές, δεν βλάπτουν και έχουν μεγάλη σημασία για την επίτευξη της Βιώσιμης Ανάπτυξης των Ηνωμένων Εθνών 2030 Στόχοι (SDGs)» Αν θέλουμε να λύσουμε τις μεγαλύτερες προκλήσεις του κόσμου, οι κυβερνήσεις και άλλοι χρηματοδότες θα πρέπει να επενδύσουν, να αναπτύξουν, να αδειοδοτήσουν ανοιχτά, να μοιραστούν και να χρησιμοποιήσουν DPG.

Τα ανοιχτά δεδομένα είναι σημαντικά για τα DPG, επειδή τα δεδομένα αποτελούν βασικό μοχλό οικονομικής ζωτικότητας με αποδεδειγμένη δυνατότητα εξυπηρέτησης του δημόσιου συμφέροντος. Στον δημόσιο τομέα, τα δεδομένα ενημερώνουν τη χάραξη πολιτικής και την παροχή δημόσιων υπηρεσιών βοηθώντας στη διοχέτευση σπάνιων πόρων σε όσους έχουν μεγαλύτερη ανάγκη. παρέχοντας τα μέσα για να λογοδοτήσουν οι κυβερνήσεις και να προωθήσουν την κοινωνική καινοτομία. Εν ολίγοις, τα δεδομένα έχουν τη δυνατότητα να βελτιώσουν τη ζωή των ανθρώπων. Όταν τα δεδομένα είναι κλειστά ή διαφορετικά δεν είναι διαθέσιμα, το κοινό δεν συγκεντρώνει αυτά τα οφέλη.
Τα CC πρόσφατα συμμετείχαν σε μια υποεπιτροπή DPGA που εργάζεται για τη διατήρηση της ακεραιότητας των ανοιχτών δεδομένων ως μέρος του DPG Standard. Αυτό είναι μια σημαντική ενημέρωση στο Πρότυπο DPG εισήχθη για να διασφαλιστεί ότι μόνο τα ανοιχτά σύνολα δεδομένων και οι συλλογές περιεχομένου με ανοιχτές άδειες είναι κατάλληλες για αναγνώριση ως DPG. Αυτή η νέα απαίτηση σημαίνει ότι τα ανοικτά σύνολα δεδομένων και οι συλλογές περιεχομένου πρέπει να πληρούν τα ακόλουθα κριτήρια για να αναγνωριστούν ως ψηφιακό δημόσιο αγαθό.
- Ολοκληρωμένη ανοιχτή αδειοδότηση:
- Ολόκληρο το σύνολο δεδομένων/η συλλογή περιεχομένου πρέπει να είναι κάτω από μια αποδεκτή ανοιχτή άδεια. Συλλογές με μικτές άδειες δεν θα γίνονται πλέον δεκτές.
- Προσβάσιμο και Ανακαλύψιμο:
- Όλα τα σύνολα δεδομένων και οι συλλογές περιεχομένου πρέπει να έχουν ανοιχτή άδεια και να είναι εύκολα προσβάσιμα από μια ξεχωριστή, ενιαία τοποθεσία, όπως μια μοναδική διεύθυνση URL.
- Περιορισμοί Επιτρεπόμενης Πρόσβασης:
- Ορισμένοι περιορισμοί πρόσβασης – όπως συνδέσεις, εγγραφές, κλειδιά API και περιορισμός – επιτρέπονται εφόσον δεν κάνουν διακρίσεις σε βάρος των χρηστών ή δεν περιορίζουν τη χρήση με βάση τη γεωγραφία ή άλλους παράγοντες.
Σύμφωνα με την DPGA: «Αυτή η νέα απαίτηση έχει σχεδιαστεί για να αυξήσει την εμπιστοσύνη σε όλα τα DPG διασφαλίζοντας ότι οι χρήστες μπορούν να ασχοληθούν πλήρως με λύσεις χωρίς να ανησυχούν για παραβίαση πνευματικής ιδιοκτησίας. Η απλοποίηση της πρόσβασης και της χρήσης ευθυγραμμίζεται με τον στόχο της DPGA να κάνει τα DPG πραγματικά ανοιχτά και προσβάσιμα για ευρεία υιοθέτηση… συμβάλλει στην ενίσχυση ενός περιβάλλοντος και ενός οικοσυστήματος όπου η καινοτομία μπορεί να ευδοκιμήσει χωρίς νομικές αβεβαιότητες».
AI και Open Data
Καθώς τα CC εξετάζουν την τεχνητή νοημοσύνη και τις δυνατότητές της να είναι δημόσιο αγαθό που βοηθά στην επίλυση παγκόσμιων προκλήσεων, πιστεύουμε ότι τα ανοιχτά δεδομένα θα διαδραματίσουν εξίσου σημαντικό ρόλο.
Τα CC αναγνωρίζουν ότι η τεχνητή νοημοσύνη είναι ένας ταχέως αναπτυσσόμενος χώρος και εκτιμούμε την επιμελή δουλειά όλων μας για τη δημιουργία ορισμών, συστάσεων και καθοδήγησης και προειδοποιήσεων σχετικά με την τεχνητή νοημοσύνη. Μετά από δύο χρόνια διαβούλευσης με την κοινότητα, το Open Source Initiative κυκλοφόρησε την έκδοση 1.0 του Ορισμού τεχνητής νοημοσύνης ανοιχτού κώδικα (OSAID) στις 28 Οκτωβρίου 2024. Αυτός ο ορισμός είναι ένα σημαντικό βήμα για την έναρξη της συζήτησης σχετικά με το τι σημαίνει ανοιχτό για συστήματα τεχνητής νοημοσύνης. Ωστόσο, οι απαιτήσεις κοινής χρήσης δεδομένων του OSAID παραμένουν αμφιλεγόμενες, ιδιαίτερα σχετικά με το εάν και πώς θα πρέπει να κοινοποιούνται τα δεδομένα εκπαίδευσης για μοντέλα τεχνητής νοημοσύνης.
Τα CC είναι της γνώμης ότι επειδή είναι δύσκολο να δημιουργηθούν και να κυκλοφορήσουν ανοιχτά σύνολα δεδομένων, αυτό δεν σημαίνει ότι δεν πρέπει να το ενθαρρύνουμε. Σε περιπτώσεις όπου τα δεδομένα εκπαίδευσης δεν πρέπει ή δεν μπορούν να κοινοποιηθούν, ενθαρρύνουμε λεπτομερείς περιλήψεις που εξηγούν τα περιεχόμενα του συνόλου δεδομένων και δίνουν οδηγίες για αναπαραγωγιμότητα, αλλά παρόλα αυτά αυτά τα δεδομένα θα πρέπει να ορίζονται ως κλειστά. Όταν τα δεδομένα μπορούν να ανοίξουν και να μοιραστούν, θα πρέπει να είναι.
Συμφωνούμε με τη Liv Marte Nordhaug, Διευθύνουσα Σύμβουλο της Digital Public Goods Alliance που είπε σε πρόσφατη δημοσίευση: «Σε ό,τι αφορά τα συστήματα τεχνητής νοημοσύνης, υπάρχει ανάγκη να διασφαλίσουμε ότι δεν θα υπονομεύσουμε ακούσια την κίνηση ανοιχτών δεδομένων και τα ανοιχτά δεδομένα ως κατηγορία DPG, προωθώντας μια προσέγγιση στα συστήματα τεχνητής νοημοσύνης που είναι πιο επιτρεπτή από ό,τι για άλλες κατηγορίες DPG . Η διατήρηση ενός υψηλού πήχη στα δεδομένα εκπαίδευσης θα μπορούσε ενδεχομένως να οδηγήσει σε λιγότερα συστήματα AI που πληρούν τα κριτήρια DPG Standard. Ωστόσο, η συνάφεια του SDG, η ανεξαρτησία της πλατφόρμας και η σχεδίαση χωρίς βλάβη είναι χαρακτηριστικά που ξεχωρίζουν τα DPG από άλλες λύσεις ανοιχτού κώδικα—και για αυτούς τους λόγους, απαιτείται η συμπερίληψη των δεδομένων εκπαίδευσης [AI]».
Επόμενα Βήματα
Τα CC θα συνεχίσουν να συνεργάζονται με την DPGA και άλλους εταίρους, καθώς αναπτύσσει ένα πρότυπο ως προς το τι χαρακτηρίζει ένα μοντέλο τεχνητής νοημοσύνης ως ψηφιακό δημόσιο αγαθό. Σε αυτό το πεδίο θα υποστηρίξουμε ανοιχτά σύνολα δεδομένων και την εξέταση μιας κλιμακωτής προσέγγισης, έτσι ώστε τα στοιχεία ενός μοντέλου τεχνητής νοημοσύνης να μπορούν να θεωρηθούν ψηφιακά δημόσια αγαθά, χωρίς ολόκληρο το μοντέλο να χρειάζεται να μοιράζεται ανοιχτά κάθε στοιχείο. Οι ενημερωμένες συστάσεις και οδηγίες που αναγνωρίζουν την αξία των πλήρως ανοιχτών συστημάτων τεχνητής νοημοσύνης που χρησιμοποιούν και μοιράζονται ανοιχτά σύνολα δεδομένων θα είναι σημαντικό μέρος της διασφάλισης της τεχνητής νοημοσύνης που εξυπηρετεί το δημόσιο καλό.
Πηγή άρθρου:https://creativecommons.org