{"id":1246,"date":"2026-06-20T15:57:37","date_gmt":"2026-06-20T15:57:37","guid":{"rendered":"https:\/\/expatcircle.com\/cms\/de\/?p=1246"},"modified":"2026-06-20T15:57:37","modified_gmt":"2026-06-20T15:57:37","slug":"ai-modelle-kollabieren-wenn-sie-auf-rekursiv-erzeugten-daten-trainiert-werden","status":"publish","type":"post","link":"https:\/\/expatcircle.com\/cms\/de\/ai-modelle-kollabieren-wenn-sie-auf-rekursiv-erzeugten-daten-trainiert-werden\/","title":{"rendered":"AI-Modelle kollabieren, wenn sie auf rekursiv erzeugten Daten trainiert werden"},"content":{"rendered":"<article>\n<header><em>Basierend auf: Nature (2024), Volume 631, Seiten 755\u2013759<\/em><\/p>\n<p>Originalstudie:<br \/>\n<a href=\"https:\/\/www.nature.com\/articles\/s41586-024-07566-y\" target=\"_blank\" rel=\"noopener\"><br \/>\nhttps:\/\/www.nature.com\/articles\/s41586-024-07566-y<br \/>\n<\/a><\/p>\n<\/header>\n<section>\n<h2>Kernidee der Studie<\/h2>\n<p>Die Arbeit in <em>Nature<\/em> zeigt ein fundamentales Problem moderner KI-Modelle:<br \/>\nWenn Sprachmodelle wiederholt mit Daten trainiert werden, die selbst von anderen KI-Modellen erzeugt wurden,<br \/>\nbeginnt die Qualit\u00e4t der Modelle systematisch zu kollabieren.<\/p>\n<p>Statt immer besser zu werden, verlieren die Modelle schrittweise Diversit\u00e4t, seltene Informationen und statistische Feinheiten.<br \/>\nAm Ende entsteht eine Art \u201eEcho-Kammer der KI\u201c, in der Fehler verst\u00e4rkt und Realit\u00e4t verzerrt wird.<\/p>\n<\/section>\n<section>\n<h2>Was passiert beim \u201eModel Collapse\u201c?<\/h2>\n<p>Das zentrale Problem ist eine Art Daten-Feedback-Schleife:<\/p>\n<ul>\n<li>Ein Modell wird mit echten Daten trainiert<\/li>\n<li>Es generiert synthetische Texte<\/li>\n<li>Diese synthetischen Daten werden erneut zum Training verwendet<\/li>\n<li>Mit jeder Iteration geht Informationsvielfalt verloren<\/li>\n<\/ul>\n<p>Das Ergebnis ist eine schleichende Vereinheitlichung der Datenverteilung \u2013 seltene, aber wichtige Informationen verschwinden zuerst.<\/p>\n<\/section>\n<section>\n<h2>Warum das relevant ist<\/h2>\n<p>Die Studie ist besonders wichtig, weil gro\u00dfe Teile zuk\u00fcnftiger Internetdaten vermutlich KI-generiert sein werden.<br \/>\nDamit entsteht ein strukturelles Risiko f\u00fcr alle Trainingspipelines moderner Sprachmodelle.<\/p>\n<p>Vereinfacht gesagt: Wenn das Internet zunehmend von KI geschrieben wird, trainieren KIs irgendwann prim\u00e4r auf sich selbst \u2013<br \/>\nmit potenziell degenerierenden Effekten.<\/p>\n<\/section>\n<section>\n<h2>Einordnung: Die Bibliothek von Babel<\/h2>\n<p>Das Problem erinnert stark an das Gedankenexperiment der <a href=\"https:\/\/de.wikipedia.org\/wiki\/Die_Bibliothek_von_Babel\" target=\"_blank\" rel=\"noopener\"><br \/>\n\u201eBibliothek von Babel\u201c<\/a> von Jorge Luis Borges.<\/p>\n<p>Dort existiert theoretisch eine unendliche Bibliothek, die alle m\u00f6glichen Kombinationen von Zeichen enth\u00e4lt \u2013<br \/>\nalso auch alle wahren, falschen und sinnlosen Texte zugleich.<\/p>\n<p>In \u00e4hnlicher Weise droht bei rekursivem KI-Training ein Datenraum, in dem Wahrheit, Halluzination und statistischer L\u00e4rm<br \/>\nzunehmend ineinander \u00fcbergehen \u2013 und die Struktur der \u201eRealit\u00e4t\u201c im Modell verwischt.<\/p>\n<\/section>\n<footer>Fazit: Der gr\u00f6\u00dfte Risikofaktor zuk\u00fcnftiger KI-Systeme ist nicht nur zu wenig Daten \u2013 sondern zu viel der falschen Daten,<br \/>\ninsbesondere wenn sie von anderen KI-Systemen selbst erzeugt wurden.<\/p>\n<\/footer>\n<\/article>\n","protected":false},"excerpt":{"rendered":"<p>Basierend auf: Nature (2024), Volume 631, Seiten 755\u2013759 Originalstudie: https:\/\/www.nature.com\/articles\/s41586-024-07566-y Kernidee der Studie Die Arbeit in Nature zeigt ein fundamentales Problem moderner KI-Modelle: Wenn Sprachmodelle wiederholt mit Daten trainiert werden, die selbst von anderen KI-Modellen erzeugt wurden, beginnt die Qualit\u00e4t der Modelle systematisch zu kollabieren. Statt immer besser zu werden, verlieren die Modelle schrittweise Diversit\u00e4t, [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":"","_links_to":"","_links_to_target":""},"categories":[40],"tags":[],"class_list":["post-1246","post","type-post","status-publish","format-standard","hentry","category-gesellschaft"],"_links":{"self":[{"href":"https:\/\/expatcircle.com\/cms\/de\/wp-json\/wp\/v2\/posts\/1246","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/expatcircle.com\/cms\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/expatcircle.com\/cms\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/expatcircle.com\/cms\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/expatcircle.com\/cms\/de\/wp-json\/wp\/v2\/comments?post=1246"}],"version-history":[{"count":4,"href":"https:\/\/expatcircle.com\/cms\/de\/wp-json\/wp\/v2\/posts\/1246\/revisions"}],"predecessor-version":[{"id":2227,"href":"https:\/\/expatcircle.com\/cms\/de\/wp-json\/wp\/v2\/posts\/1246\/revisions\/2227"}],"wp:attachment":[{"href":"https:\/\/expatcircle.com\/cms\/de\/wp-json\/wp\/v2\/media?parent=1246"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/expatcircle.com\/cms\/de\/wp-json\/wp\/v2\/categories?post=1246"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/expatcircle.com\/cms\/de\/wp-json\/wp\/v2\/tags?post=1246"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}