Vor ein paar Monaten habe ich ein Dokument zur DSGVO-Konform

Vor ein paar Monaten habe ich ein Dokument zur DSGVO-Konformität für ein KI-Unternehmen gelesen. Der Abschnitt über die Datenlöschung war gründlich, fast beeindruckend. Zeitrahmen, Einwilligungsprotokolle, Aufbewahrungsgrenzen. Ich habe alles durchgelesen und auf den Teil gewartet, der adressiert, was das trainierte Modell noch erinnert. Einen solchen Teil gab es nicht.

das ist kein zufälliger Unterschied. Es spiegelt wider, wie Datenschutzregelungen entworfen wurden, bevor die Einzelheiten des Modelltrainings gut verstanden wurden.
Rahmenbedingungen wie die DSGVO behandeln Daten als etwas, das man lokalisieren, prüfen und löschen kann. Ein trainiertes Modell speichert deine Daten jedoch nicht auf diese Weise. Es speichert, was es von dir gelernt hat, was ein ganz anderes Objekt ist.

Wenn du eine Anfrage auf Löschung deiner Daten einreichst, entfernt die Plattform die Datenbankzeile. Das Modell wird nicht neu trainiert. Gradient-Updates, die deine Verhaltensmuster aufgenommen haben, sind bereits über Milliarden von Gewichtparametern eingebettet und formen Ausgaben für Personen, die nie etwas mit dir geteilt haben. Die ursprünglichen Eingaben verschwinden. Was es im Modell erzeugt hat, jedoch nicht.

Das ist der Teil, den ich eine Weile nicht richtig artikulieren konnte. Daten zu löschen und zu löschen, was ein Modell aus Daten gelernt hat, sind zwei separate Vorgänge. Der eine hat einen rechtlichen Mechanismus. Der andere ist etwas, das die aktuelle Regelung nicht einmal verlangt.

das einzige Rahmenwerk, das ich gefunden habe und das versucht, diese Lücke zu schließen, sitzt auf der Infrastrukturebene. @OpenGradient baut eine überprüfbare Schicht um das Verhalten und die Herkunft des Modells, nicht ein Versprechen über das, was im Inneren ist, sondern eine Struktur, in der wie ein Modell gebaut wurde und was es geprägt hat, tatsächlich untersucht werden kann, anstatt standardmäßig vertraut zu werden.

Ich bin mir nicht sicher, ob das das zugrunde liegende Problem löst. Aber es stellt eine ehrlichere Frage als "Haben wir die Datei gelöscht?"

Wenn deine Daten die Sichtweise eines Modells auf die Welt geprägt haben, hebt das Entfernen dieser Daten irgendetwas auf, oder beseitigt es nur die Beweise für das, was bereits passiert ist?

$OPG
#OPG
$BICO
$BTW