Diskussion:Gauß-Prozess/Archiv

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 8 Monaten von Sigma^2 in Abschnitt Mathematische Beschreibung
Zur Navigation springen Zur Suche springen

Beispiel: Trend-Vorhersage

Die Diskussion in diesem Abschnitt bezieht sich auf einen Inhalt, der am 29. Juli 2023 von Physikinger in den von ihm neu angelegten Artikel Anwendung von Gaußprozessen migriert wurde und der jetzt nicht mehr im Artikel enthalten ist.

@Physikinger: Sorry, aber das mit dem olympischen Spielen 2018 ist keine Vorhersage, sondern eine Retrognose, wie sich an der Versionshystorie der Datei deutlich zeigen lässt. Das ursprüngliche Prognosemodell wurde nachträglich angepasst, um so zu zeigen, dass es „sogar die Erhöhung der Suchanfragen bei den Olympischen Spielen voraus[sage]“.

Korrekte würde es sein alle Daten bis 2018 in dieses verbesserte Prognosemodell (von 2018) zu packen und dann wirklich eine Prognose und nicht eine Retroprognose abzugeben. Habitator terrae Erde 12:37, 7. Apr. 2021 (CEST)

Das Beispiel soll hier nur das Prinzip der Extrapolation demonstrieren. Die Schätzung hatte als Input immer nur die Daten bis Mitte 2016 zur Verfügung. Mit Vorhersage/Voraussage ist hier gemeint, aus bekannten Messungen Werte an anderen Stützstellen zu schätzen, wo keine Referenzdaten gegeben sind. Bei Maschinenlernverfahren sagt man in der Literatur grundsätzlich "vorhersagen" bzw. "predict", auch bei räumlichen oder anderen Schätzungen.--Physikinger (Diskussion) 00:55, 8. Apr. 2021 (CEST)
Das mag ja gerne sein, die sehr differenzierte Ergebnisse implizieren aber eine Sicherheit der Methode, die so nicht existiert, da die neue Kovarianzfunktionen zumindest hier von Menschen aufgestellt werden, die erst dieses vierte Ereignis der in der Fassung signifikant erschien, obwohl sie es zum zurückgerechneten eigentlichen "Prognose" Zeitpunkt offenbar nicht tat. Habitator terrae Erde 15:36, 22. Aug. 2021 (CEST)
Zudem noch ne Frage, wie genau wurde die Kovarianzfunktion generiert? Habitator terrae Erde 19:14, 22. Aug. 2021 (CEST)
Ich finde nicht, dass hier irgendetwas impliziert wird. Das Kovarianzmodell wurde wie beschrieben zusammengesetzt und die Hyperparameter zum Teil geraten. Viel mehr kann man da in diesem Fall nicht rausholen. In der Literatur findest du als Standardbeispiel den CO2-Anstieg der Atmosphäre, was im Lehrbuch Rasmussen/Williams sehr ausführlich beschrieben und begründet wird. Da sind die Daten in höherer Quantität und Qualität verfügbar und stärker korreliert und dann ist auch das Modell eindeutiger und die Extrapolation entsprechend genauer.--Physikinger (Diskussion) 23:31, 29. Sep. 2021 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: --Sigma^2 (Diskussion) 14:09, 30. Jul. 2023 (CEST)

Erzeugung von Realisierungen von Gauss-Prozessen

Die Diskussion in diesem Abschnitt bezieht sich auf einen Inhalt, der am 29. Juli 2023 von Physikinger in den von ihm neu angelegten Artikel Anwendung von Gaußprozessen migriert wurde und der jetzt nicht mehr im Artikel enthalten ist.

Der Artikel befasst sich sehr viel mit der statistischen Inferenz. Wäre nicht ebenso der ein Verweis auf die Langevin-Gleichung angebracht um aufzuzeigen, wie in manchen Anwendungsfeldern Daten erzeugt werden, die Gauss-Prozesse sind? Langevin-Gleichungen werden häufig in Molekulardynamik-Simulationen numerisch gelöst. biggerj1 (Diskussion) 21:55, 16. Jan. 2022 (CET)

Das sehe ich anders. Was ich völlig vermisse, ist irgendetwas zur statistischen Inferenz (Schätzung von Parametern eines Gauß-Prozess aus einer beobachteten Prozessrealisation, Tests, Konfidenzbänder usw.). Der Abschnitt Gaußprozess-Regression ist wesentlich von einem Nicht-Statistiker aus einem Anwendungsbereich geschrieben, in dem kalibriert, aber nicht statistisch geschätzt wird. Alle Begriffe wie "A-priori-Schätzung" usw. sind nicht verlinkt, nicht belegt und klingen nach WP:TF. Es mag sein, dass es in irgendeinem Anwendungsbereich (Physik, Finanzmarktanalyse oder Maschinelles Lernen) so gemacht und auch diese Begriffe erfunden wurden, aber als enzyklopädischer Beitrag zu Gaußprozessen ist der Abschnitt problematisch. Mit dem A-priori und A-Posteriori der Bayesschen Statistik besteht wohl kein Zusammenhang. Falls doch, werden statistische Fachbegriffe nur so ungefähr verwendet und neue Begriffe erfunden.--Sigma^2 (Diskussion) 12:25, 28. Jul. 2023 (CEST)
Die gesamte Sprechweise ist an die Literatur von C. E. Rasmussen angepasst, der dem Gebiet der Gaußprozesse zum Durchbruch verholfen hat. Der gesamte Artikel orientiert sich im Wesentlichen am Lehrbuch. --Physikinger (Diskussion) 20:51, 28. Jul. 2023 (CEST)
Gaußprozesse sind in der Theorie stochastischer Prozesse nicht sonderlich neu, sondern eine der zuerst behandelten Klassen stochastischer Prozesse. Dabei geht es um das 19. und 20. Jahrhundert. Wo soll denn da Rasmussen einen Durchbruch gebracht haben? Ich bitte Dich, die neu eingeführten Begriffe zu verlinken oder mit einem Einzelnachweis auf das Buch von Rasmussen zu versehen. Ich habe auch ernsthafte Zweifel, ob überhaupt ein Artikel über Gaußprozesse in einer Enzyklopädie die richtige Stelle ist, um ausführlich darzustellen, wie ein Informatiker in einem Lehrbuch über maschinelles Lernen seine Sicht über stochastische Prozesse wiedergibt. Viele Begriffe wirken auf mich wie ad hoc erfunden, aus der Informatik übernommen oder falsch übersetzt.--Sigma^2 (Diskussion) 00:12, 29. Jul. 2023 (CEST)
Die gesamte Literatur zum Thema Gaußprozess ist sehr von der Anwendung geprägt und ich bin überzeugt, dass die meisten Leser der Wikipedia auch dieser Aspekt am meisten interessiert. Für die mehr mathematischen und theoretischen Details ist der Artikel zum stochastischen Prozess ideal geeignet. Du hast dort auch einen sehr guten Anfang gemacht, den Artikel zu verbessern und da der Artikel immer noch relativ kurz ist, wäre dort der ideale Ort, um die theoretischen Aspekte zu vertiefen.
Ich habe hier mit Sicherheit nichts erfunden, aber die verschiedenen Wissenschaften haben da durchaus andere Sprechweisen. --Physikinger (Diskussion) 09:53, 29. Jul. 2023 (CEST)
Um den Konflikt zu umgehen, habe ich jetzt im Wesentlichen alles von mir hinzugefügte ausgelagert in einen speziellen Artikel zur Anwendung von Gaußprozessen. Siehe neuen Abschnitt unten. --Physikinger (Diskussion) 18:45, 29. Jul. 2023 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von --Sigma^2 (Diskussion) 13:41, 14. Sep. 2023 (CEST), Diskussionsabschnitt übertragen

Einleitung

Die Diskussion in diesem Absatz bezieht sich auf einen Inhalt, der am 29. Juli 2023 von Physikinger in den von ihm neu angelegten Artikel Anwendung von Gaußprozessen migriert wurde und der jetzt nicht mehr im Artikel enthalten ist.

Erster Satz

„Ein Gaußprozess (nach Carl Friedrich Gauß) ist in der Wahrscheinlichkeitstheorie ein stochastischer Prozess mit der Eigenschaft, dass jede endliche Teilmenge mehrdimensional normalverteilt (gaußverteilt) ist.“ Endliche Teilmenge von welcher Menge? Ein Gaußprozess ist keine Menge. Fachbegriffe sollten auch in der Einleitung nicht falsch verwendet werden. --Sigma^2 (Diskussion) 11:41, 28. Jul. 2023 (CEST)

Bei Rasmussen findet man auf Folie 10 diese Definition: "a Gaussian process is a collection of random variables, any finite number of which have (consistent) Gaussian distributions." --Physikinger (Diskussion) 21:25, 28. Jul. 2023 (CEST)
Mit dieser Vortragsfolie hätte niemand ein Problem. Dort steht gerade nichts von Mengen. Verstehst Du denn nicht, dass Teilmenge ein mathematischer Fachbegriff und keine Umgangssprache ist? Dass es dann, wenn es eine Teilmenge gibt, auch eine Menge geben muss. Vorbeugend für diesen Fall des Nichtverstehens habe ich weiter unten das Beispiel 1 geschrieben. Mach Dir bitte klar, was der Unterschied zwischen einer Menge einerseits und einem Vektor (einer Folge, einer Familie) andererseits sind. Eine collection ist keine Menge, sondern mathematisch gesehen eine Familie. --Sigma^2 (Diskussion) 23:32, 28. Jul. 2023 (CEST)
Wollen wir den toxischen Ton nicht einfach mal sein lassen. "Du verstehtst nicht...". Was habe ich dir denn getan? Ich weiß noch nicht mal, ob ich den ersten Satz überhaupt geschrieben habe. --Physikinger (Diskussion) 09:59, 29. Jul. 2023 (CEST)
Wenn Du das als toxisch empfunden hast, tut es mir leid. Ich habe - nicht an Dich adressiert - geschrieben: „Endliche Teilmenge von welcher Menge? Ein Gaußprozess ist keine Menge. Fachbegriffe sollten auch in der Einleitung nicht falsch verwendet werden.“ Was ist daran nicht zu verstehen? Ich erhalte dann einen Satz von einer Vortragsfolie, an dem nichts falsch ist, der aber weder das Wort Teilmenge noch Menge enthält. Bei dieser Form von Belehrung fragt man sich dann schon, ob der Belehrende die Eingangsfragen verstanden hat.--Sigma^2 (Diskussion) 12:25, 29. Jul. 2023 (CEST)
Hallo ihr zwei, ich melde mich nur mal kurz als Unbeteiligter um die Gemüter etwas zu besänftigen. Ich schätze die Beiträge von Sigma^2 extrem, da er/sie sehr fachkundig ist und die Artikel meiner Erfahrung nach extrem verbessert und dabei auch Details korrekt darstellen kann. Wenn er einen Punkt ankreidet, wird an der Sache auch etwas dran sein. Angewandte Wissenschaften, sind nicht für die strenge der Begriffe bekannt. Ungenauen Slang (selbst wenn er sich in der angewandten Literatur fände) würde ich nicht im Hauptartikel erwarten. Wenn das bedeutet mache Abschnitte lieber zu streichen, würde ich es unterstützen (und das ist einfach ohne Vorwurf gemeint, ich bin mir sicher, dass ich manche Details selbst nicht 100% beschreiben könnte) Liebe Grüße! :) biggerj1 (Diskussion) 12:48, 29. Jul. 2023 (CEST)
Das will ich nicht bestreiten. Sigma^2 hat eine wirklich großartige Formulierung für die Einleitung beim Stochastischen Prozess gefunden, was ich auch sehr gelobt habe. Und die Fähigkeit, Dinge in einfachen Worten klar ausdrücken zu können ist meist mit einem tiefen sachlichen Verständnis verbunden. Aber hier besteht eher ein Interessenskonflikt zwischen angewandten Wissenschaften und reiner Mathematik. Der Konflikt ist leicht aufzulösen, indem das ohnehin stark von Anwendungen geprägten Thema Gaußprozess auch diesen Fokus behält, während der Artikel zum stochastischen Prozess, der als Allgemeinfall mehr von theoretischem Interesse ist, diese Sprache der Mathematik vertiefen kann. In diesem Artikel hier steckt wirklich geballtes Wissen, um sehr anspruchsvolle praktische Probleme zu lösen. Das wird man erst zu schätzen wissen, wenn man selbst mit einem Problem konfrontiert ist und hier Antworten findet. Wenn Mathematiker hier nicht fündig werden, ist der stochastische Prozess nur ein Klick weit entfernt. --Physikinger (Diskussion) 13:16, 29. Jul. 2023 (CEST)
Ok, also vielleicht könnte man schreiben: "Ein Gaußprozess ist ein stochastischer Prozess, bei dem jede Menge von Werten einer multivariaten Normalverteilung folgt." --Physikinger (Diskussion) 13:33, 29. Jul. 2023 (CEST)
Ich habe jetzt mal diesen Bezug auf seine Werte eingefügt: "Ein Gaußprozess [...] ist [...] ein stochastischer Prozess mit der Eigenschaft, dass jede endliche Teilmenge seiner Werte mehrdimensional normalverteilt (gaußverteilt) ist." --Physikinger (Diskussion) 13:45, 29. Jul. 2023 (CEST)

Vierter Satz

„Ein Gaußprozess wird speziell aus Funktionen der Erwartungswerte, Varianzen und Kovarianzen konstruiert [...].“

Das liegt irgendwo zwischen völlig unverständlich und falsch. Möglicherweise ist Ursache die Verwechselung von Prozess mit dessen Wahrscheinlichkeitsverteilung, die sich auch im weiteren Verlauf des Artikels manifestiert.--Sigma^2 (Diskussion) 12:52, 29. Jul. 2023 (CEST)

„[...] beschreibt damit die Funktionswerte als ein Kontinuum aus korrelierten Zufallsvariablen in Form einer unendlichdimensionalen Normalverteilung.“

Warum Kontinuum? Die Indexmenge eines Gaußprozesses kann endlich sein, abzählbar unendlich (Folge), ein Teilintervall der reellen Zahlen (das könnte man dann als Kontinuum (Mathematik) bezeichnen) oder ein allgemeinere Menge.
Warum korrelierte Zufallsvariablen? Ein sehr häufig verwendeter Gaußprozess ist eine Folge stochastisch unabhängiger und identisch normalverteilter Zufallsvariablen, dabei sind alle Zufallsvariablen paarweise unkorreliert.--Sigma^2 (Diskussion) 12:52, 29. Jul. 2023 (CEST)

Fünfter Satz

„Ein Gaußprozess ist somit eine Wahrscheinlichkeitsverteilung von Funktionen.“

Das ist elementar falsch: Ein stochastischer Prozess ist keine Wahrscheinlichkeitsverteilung. Eine Folge von Zufallsvariablen ist keine Wahrscheinlichkeitsverteilung. Ein Zufallsvektor ist keine Wahrscheinlichkeitsverteilung. Eine Zufallsvariable ist keine Wahrscheinlichkeitsverteilung.--Sigma^2 (Diskussion) 12:31, 29. Jul. 2023 (CEST)

+1 das hat mich auch immer verwirrtbiggerj1 (Diskussion) 12:38, 29. Jul. 2023 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von --Sigma^2 (Diskussion) 13:49, 14. Sep. 2023 (CEST), Diskussionsabschnitt übertragen

Schreibweise

Die Diskussion in diesem Absatz bezieht sich auf einen Inhalt, der am 29. Juli 2023 von Physikinger in den von ihm neu angelegten Artikel Anwendung von Gaußprozessen migriert wurde und der jetzt nicht mehr im Artikel enthalten ist.

Der Artikel heißt Gauß-Prozess. Im Artikel wird ausschließlich die Schreibweise Gaußprozess verwendet. Diese sollte überarbeitet werden, da Gauß-Prozess die Hauptverwendung in der Wikipedia ist.--Sigma^2 (Diskussion) 12:36, 28. Jul. 2023 (CEST)

Vielleicht sollte man auch den Artikelnamen ändern, analog zu Wienerprozess.--Sigma^2 (Diskussion) 13:03, 28. Jul. 2023 (CEST)
Habe ich auch schon drüber nachgedacht, den Artikel umzubenennen. --Physikinger (Diskussion) 21:01, 28. Jul. 2023 (CEST)
Andererseits fände ich auch Wiener-Prozess besser als das derzeitige Wienerprozess. Es heißt auch Markow-Prozess und Markow-Kette. Ich finde kein System. Ist das mal irgendwo diskutiert worden?--Sigma^2 (Diskussion) 23:36, 28. Jul. 2023 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von --Sigma^2 (Diskussion) 13:53, 14. Sep. 2023 (CEST), Diskussionsabschnitt übertragen

Mathematische Beschreibung

Die Diskussion in diesem Absatz bezieht sich auf einen Inhalt, der am 29. Juli 2023 von Physikinger in den von ihm neu angelegten Artikel Anwendung von Gaußprozessen migriert wurde und der jetzt nicht mehr im Artikel enthalten ist.

Definition

Dieser Satz „Treffender wäre die Bezeichnung Gaußkontinuum im Sinne eines beliebigen Kontinuums von – in der Regel korrelierten – Gaußverteilungen.“ ist eine persönliche Einschätzung des Autors und gehört daher als WP:TF nicht in den Artikel. Der Begriff stochastischer Prozess wird seit 50 Jahren in einem weiteren Sinn verwendet. Ich beabsichtige, den Satz zu löschen.--Sigma^2 (Diskussion) 13:57, 28. Jul. 2023 (CEST)

Bin auch fürs Löschen. Hier scheint auch wieder Physikingers Meinung Einzug zu nehmen, dass ein Prozess dasselbe wie eine Verteilung ist. Auch das Wort Kontinuum ist doch eher Physik-Terminologie, weil in der Mathematik man damit eigentlich meistens nur die reellen Zahlen oder Teilintervalle dieser meint. Laut Kallenberg - Foundations of Modern Probability kann die Index-Menge jedoch beliebig sein. Physikinger wirft mir vor nicht allgemeinverständlich zu schreiben, aber nützt dann selber Wörter wie "Kontinuum", welches m. E. nicht allgemeinverständlich und vorallem ambig ist.--Tensorproduct 18:36, 28. Jul. 2023 (CEST)
Viele stolpern immer wieder über den Begriff Prozess der als historische Altlast hier sehr unpassend ist. Das ist nur eine Erläuterung des Begriffs. --Physikinger (Diskussion) 20:55, 28. Jul. 2023 (CEST)
historische Altlast ist irrelevante persönliche Einschätzung und WP:TF, wie ich schon sagte. --Sigma^2 (Diskussion) 23:47, 28. Jul. 2023 (CEST)
Sei doch mal etwas locker. Das historische Erbe, das in dem Begriff steckt, kommt von der damaligen Anwendung auf zeitliche Vorgänge. Ein Gaußprozess kann aber auch auf andere Dimensionen z.B. räumlich angewendet werden, wie im Artikel auch beschrieben ist. Da spielt selbst die Reihenfolge der Variablen keine Rolle, nur die Zuordnung zu diesem Dimensionen. --Physikinger (Diskussion) 10:04, 29. Jul. 2023 (CEST)
Die Belehrung ist nicht nötig. Der Sachverhalt, woher der Name Prozess kommt, ist doch völlig unstrittig. Strittig ist, dass in einer Enzyklopädie ein Autor seine persönliche Meinung äußert, dass Gaußkontinuum ein besserer Begriff wäre. So etwas geht grundsätzlich nicht und reicht für eine Löschung, da WP:TF. Der als treffender bezeichnete Begriff wäre auch eindeutig ein schlechter Oberbegriff und keinesfalls treffender, weil das Wort Kontinuum eine sehr spezielle mathematische Struktur der Indexmenge (Teilintervall der reellen Zahlen) suggeriert. Tatsächlich kann die Indexmenge aber z. B. endlich, oder sein, so dass nicht der geringste Bezug zu einem Kontinuum besteht. Ich werde jetzt den Satz löschen. --Sigma^2 (Diskussion) 13:24, 29. Jul. 2023 (CEST)

Notation

Die Tabelle im Unterabschnitt Notation ist obskur. Einerseits soll den stochastischen Prozess, andererseits dessen Wahrscheinlichkeitsverteilung bezeichnen. So geht es nicht. Nützlich wäre auch ein Beleg (EN) für die Notation , dann wüsste man auch, ob es WP:TP ist und was dieses Symbol bezeichnen soll.--Sigma^2 (Diskussion) 13:45, 28. Jul. 2023 (CEST)

Diese Notation ist sicher nicht üblich. Kann sein dass das irgendwo so in einem Buch steht, aber es ist sicher nicht Kanon. Auch müsste er korrekterweise schreiben.--Tensorproduct 18:48, 28. Jul. 2023 (CEST)
Die Schreibweise, die ich ursprünglich verwendet habe, enthielt die Variablen t. Ein Mathematiker hat das hier mal beanstandet, dass es mathematisch nicht korrekt sei, obwohl selbst Rasmussen die Schreibweise mit (t) verwendet. Ich habe das dann beherzigt, aber fand es eigentlich didaktisch weniger gut. --Physikinger (Diskussion) 20:58, 28. Jul. 2023 (CEST)
Wo ist denn die Festlegung in dem Buch von Rasmussen? --Sigma^2 (Diskussion) 23:42, 28. Jul. 2023 (CEST)
Also auf der Folie 10 schreibt Rasmussen z.B. GP(m(x) , k(x, x′)), um die Variablen der Funktionen anzugeben. Ich finde das eigentlich relativ klar und sehe da auch nichts Missverständliches oder mathematisch Falsches. Sorry, ich habe hier falsch eingerückt. Das war die Antwort auf die Schreibweise mit Variable. Was die Sprechweise angeht, wird hier wegen der Symmetrie der Notation auch von Verteilung gesprochen, wie man auch auf Folie 10 sieht. Im Vortrag spricht er auch von "A Gaussian Process is a distribution over functions". Bezüglich der Handhabung und Verwendung soll das die Symmetrie zu Normalverteilungen betonen. Also alles, was man für Normalverteilung an Werkzeuge und Operationen hat, ist auch auf Gaußprozesse anwendbar, soll das heißen. --Physikinger (Diskussion) 10:22, 29. Jul. 2023 (CEST)
Eine Vortragsfolie ist keine Quelle. Noch einmal die unbeantwortete Frage: Wo ist die Festlegung der Notation in dem Buch von Rasmussen?--Sigma^2 (Diskussion) 11:25, 29. Jul. 2023 (CEST)
Es gibt auf Seite 17 eine Liste "Symbols und Notation". --Physikinger (Diskussion) 11:59, 29. Jul. 2023 (CEST)

Definition spezieller Eigenschaften

Die Definition der Stationarität ist falsch. Die Stationarität der Kovarianzfunktion impliziert nicht Stationarität der Verteilung.--Sigma^2 (Diskussion) 14:46, 28. Jul. 2023 (CEST)

Kannst du das bitte etwas erläutern? --Physikinger (Diskussion) 21:02, 28. Jul. 2023 (CEST)
Aus der Stationarität der Kovarianzfunktion folgt nicht die Erwartungswertstationarität und damit auch nicht die Verteilungsstationarität. Für einen Gaußprozess ist Verteilungstationarität = Stationarität der Kovarianzfunktion + Stationarität der Erwartungswertfunktion, das nennt man üblicherweise schwache Stationarität und ist für Gaußprozesse identisch mit Verteilungsstationarität. --Sigma^2 (Diskussion) 23:03, 28. Jul. 2023 (CEST)
Siehe auch Stationärer stochastischer Prozess. Zufallsvariablen sind, etwas ungewöhnlich, mit Kleinbuchstaben bezeichnet. Die Definitionen sind im wesentlichen richtig. Die Definition der starken Stationarität dort greift zu kurz, siehe dazu die Diskussion zum Artikel. --Sigma^2 (Diskussion) 01:22, 29. Jul. 2023 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von --Sigma^2 (Diskussion) 14:01, 14. Sep. 2023 (CEST), Diskussionsabschnitt übertragen