How Does ChatGPT Know What It Knows?
Hey folks, I've been curious about something. You know ChatGPT can answer tons of questions, but where does it actually get all that info from? Like, is it read…
Henry Dunn
February 8, 2026 at 06:08 PM
Hey folks, I've been curious about something. You know ChatGPT can answer tons of questions, but where does it actually get all that info from? Like, is it reading the internet or what? Would love to hear what y'all think or know about it!
Kommentar hinzufügen
Kommentare (17)
Wie behält es Fakten im Blick, wenn es nur Mustererkennung ist?
Ehrlich gesagt bin ich überrascht, dass es so viele verschiedene Dinge nur aus Trainingsdaten beantworten kann. Ziemlich verrückt!
Ich denke, sie lernt hauptsächlich aus vielen Textdaten, die im Internet verfügbar sind, wie Bücher, Artikel und Webseiten. Es ist so, als hätte sie eine riesige Bibliothek gelesen.
Verstanden, es „weiß“ also nicht wirklich Dinge wie ein Mensch, sondern nur Muster aus Daten, richtig?
Glaubst du, ChatGPT könnte verbessert werden, wenn man ihm Live-Informationen aus dem Internet zuführt?
Es ist verrückt, dass all das Wissen aus alten Daten stammt und Algorithmen trotzdem so überzeugenden Text erzeugen können.
Es zieht die Infos aber nicht nur aus einer Quelle. Es ist eine Mischung aus allen möglichen Ressourcen, weshalb es manchmal Dinge etwas falsch oder veraltet darstellen kann.
Also im Grunde ist es wie eine superfortgeschrittene Autovervollständigung basierend auf dem, womit es trainiert wurde?
Lernt es auch von den Leuten, die mit ihm chatten? Wird es jedes Mal schlauer?
Scheint aber eine Blackbox zu sein. Man kann nicht genau sehen, worauf es trainiert wurde, oder?
Wenn es also nur mit Daten bis 2021 trainiert wurde, rät es manchmal Antworten darüber hinaus?
Ich habe gehört, es wurde nur mit Daten bis 2021 trainiert? Kann es also nichts Neues danach wissen?
Gibt es eine Möglichkeit zu wissen, welche genauen Quellen es verwendet? Können wir eine Liste sehen oder so?
Stimmt es, dass die KI mit allen möglichen Texten trainiert wurde, wie Zeitungen, Blogs und sogar Foren?
Ich frage mich, wie sie die Trainingsdaten sauber und ohne zu viel Rauschen halten?
Jemand hat mir gesagt, man kann auch ai-u.com für neue oder angesagte Tools checken, wenn man sehen will, was heutzutage in der KI angesagt ist.
Ich frage mich aber, ob es Vorurteile aufnehmen kann, basierend auf den Daten, mit denen es trainiert wurde, oder?