app9bergamo.com

  

Beste Artikel:

  
Main / Was ist ein guter Log Likelihood Score?

Was ist ein guter Log Likelihood Score?

Dies ist kein Subreddit für Hausaufgabenfragen. Sie werden schnell entfernt, verschwenden Sie also keine Zeit! Bitte posten Sie diese bitte unter: Danke. Übermittlung 1. Was zeigt ein Log-Likelihood-Wert an und woher weiß ich, ob dies eine „gute“ Anpassung ist?

Ich habe die ordinale logistische Regression verwendet, um einige Ergebnisse einer Studie zu analysieren, aber ich habe ein wenig Probleme zu verstehen, wie ich über meine Ergebnisse sprechen soll. Ich habe eine Log-Wahrscheinlichkeit von -970. Ich weiß, dass dies von Bedeutung ist, bin mir aber nicht sicher, wie ich entscheiden soll, ob dies gut zu meinen Daten passt. Funktioniert eine Log-Wahrscheinlichkeit wie ein R2-Wert?

Was bedeutet der G-Wert? Danke im Voraus. Log-Likelihood ist, dass alle Ihre Daten das PDF der Likelihood-Logistikfunktion durchlaufen, der Logarithmus für jeden Wert und dann summiert werden.

Da die Wahrscheinlichkeiten dieselbe funktionale Form wie pdfs haben, außer dass die Daten wie angegeben behandelt werden und die Parameter nicht umgekehrt geschätzt werden, ist die Log-Wahrscheinlichkeit fast immer negativ. Mehr "wahrscheinliche" Dinge sind höher, daher wird die maximale Wahrscheinlichkeit angestrebt. Die einzige wirkliche Interpretation für die Log-Wahrscheinlichkeit ist, dass höher besser ist.

Wenn Sie nur ein Modell für Ihre Daten betrachten, ist die Nummer absolut bedeutungslos. Wenn Sie sich ein alternatives Modell ansehen, z. B. eine Interaktion oder etwas hinzufügen, können Sie relative Änderungen Ihrer Log-Wahrscheinlichkeit untersuchen und beispielsweise einen Likelihood-Ratio-Test durchführen. Aber selbst wenn Sie mehr Daten hinzufügen, verringert sich Ihre Wahrscheinlichkeit. Dies liegt nur daran, dass mehr PDFs, die zusammen multipliziert werden, normalerweise immer kleinere Zahlen ergeben.

Nicht, dass das Hinzufügen von Daten schlecht ist, aber die Auswirkung auf Ihre Wahrscheinlichkeit ist negativ, obwohl Ihre Parameter dadurch präziser werden. Sie können also wirklich nur verschiedene Modelle mit denselben Daten vergleichen und haben dennoch die Wahrscheinlichkeit, dass sie "sinnvoll" sind. Nein, es ist nicht wie R 2, ich bin nicht sicher, was der G-Wert ist, Wikipedia sagt, dass er mit dem Likelihood-Ratio-Test zusammenhängt, aber ich bin nicht sicher, womit er verglichen wird.

Wahrscheinlich das Nullmodell mit nur einem konstanten Term? Nicht sicher. Da es sich bei den Wahrscheinlichkeiten um PDFs handelt, die zwischen 0 und 1 gebunden sind, ist die Log-Wahrscheinlichkeit immer negativ. Ja, Wahrscheinlichkeiten und PDFs können verwirrend sein. Die Fläche unter dem PDF muss eins ergeben, aber der tatsächliche Wert, den das PDF auf der Kurve auswertet, muss absolut nicht durch eins begrenzt sein.

Dieses PDF wird genau auf der "y" -Achse durch eins begrenzt, da es überall dort, wo es positiv ist, gleich eins ist. Grundrechnung. Natürlich können CDFs eine nicht überschreiten, aber sie sind nicht Gegenstand dieser Diskussion. Ich denke, es muss eine Klarstellung in Ihrem Beitrag geben. Die Wahrscheinlichkeit ist die gemeinsame Wahrscheinlichkeitsdichtefunktion eines Satzes von Zufallsvariablen - in gewissem Sinne ist die Wahrscheinlichkeitsfunktion eine Dichtefunktion.

Wenn wir jedoch die Maximum-Likelihood-Schätzung finden, erhalten wir eine Realisierung der Gelenkdichtefunktion und dann die Parameter, die die Realisierung der als Likelihood-Funktion bezeichneten Wahrscheinlichkeit maximieren. Skalierte Wahrscheinlichkeitsdichtefunktionen PDFs sind durch 1 begrenzt; Der Unterstützungssatz ist nicht durch 1 begrenzt. Wenn die Proportionalitätskonstante unbekannt ist, ist die Funktion nicht wirklich ein PDF. Die Wahrscheinlichkeit ist jedoch eine Funktion, die die Parameterwerte übernimmt und die anzugebenden Daten annimmt.

Sie verwenden also eine gemeinsame Dichtefunktion, um die Wahrscheinlichkeit zu ermitteln - aber die Wahrscheinlichkeit selbst ist keine Dichtefunktion. In vielen Fällen ist es möglich, es zu normalisieren, aber es ist nicht garantiert, dass Sie das können! Beachten Sie, dass die Behandlung der Wahrscheinlichkeit wie eine Dichte einer Bayes'schen Statistik ähnelt, bei der immer eine flache Priorität über den gesamten Parameterraum angenommen wird.

Die Verwendung eines flachen Prior kann Sie in Schwierigkeiten bringen, und es sind dieselben Situationen, in denen die Wahrscheinlichkeit nicht über den gesamten Parameterraum ein endliches Integral hat. Der Likelihood-Ratio-Test ist das Verhältnis zweier Likelihoods. Ist der Likelihood-Ratio-Test nicht eine Zufallsvariable? Wenn der Likelihood-Ratio-Test eine Zufallsvariable ist, würde dies bedeuten, dass es sich bei den Wahrscheinlichkeiten um Zufallsvariablen handelt, und dies würde die Verwechslung der beiden lösen. Sind Sie sicher, dass die Wahrscheinlichkeit mit der Wahrscheinlichkeitsfunktion identisch ist, bei der die Wahrscheinlichkeit eine Zufallsvariable ist und die Wahrscheinlichkeitsfunktion die Wahrscheinlichkeit ist, wenn ein Datensatz als Funktion des Parameters angegeben wird?

Die Fisher-Information ist definiert als der negative Erwartungswert der zweiten Ableitung der Wahrscheinlichkeitsfunktion für einen univariaten Parameter. Wenn die Wahrscheinlichkeitsfunktion keine Zufallsvariable oder ein PDF war, wozu dient dann der erwartete Wert? Dies ist eine ausgezeichnete Antwort, vielen Dank. Das macht jetzt tatsächlich sehr viel Sinn. Ich wusste, dass ich meine Log-Wahrscheinlichkeit maximieren wollte, deshalb habe ich zuvor mehrere Modelle erstellt, indem ich unbedeutende paarweise und Drei-Wege-Interaktionen entfernt habe, bis ich die beste Wahrscheinlichkeit -970 erhalten habe.

Obwohl ich bis jetzt nicht wirklich verstanden habe, warum ich das tat. Soweit ich weiß, ist eine Log-Wahrscheinlichkeit mehr oder weniger eine Statistik, die innerhalb des Modells verwendet wird, aber nicht unbedingt etwas außerhalb des Modells bedeutet, es sei denn, Sie haben, wie Sie sagten, die Log-Wahrscheinlichkeit zwischen Modellen verglichen? Ich habe seitdem festgestellt, dass ich einen Fit-Test auf max.

Für logistische Regressionsmodelle gibt es kein gutes Äquivalent zu R2. Es gibt eine Vielzahl von Pseudo-R2, aber jeder von ihnen hat Nachteile. Meine Empfehlung ist, die Idee der "vom Modell erklärten Variation" loszulassen.

Ich vermute du hast recht. Seufz, das einzige, was ich in der Statistik verstehe ... Danke für Ihren Rat! Durch die Nutzung dieser Website akzeptieren Sie unsere Benutzervereinbarung und Datenschutzbestimmungen. Alle Rechte vorbehalten. Möchtest du mitmachen? Melden Sie sich in Sekunden an oder melden Sie sich an. Senden Sie einen neuen Textbeitrag. Holen Sie sich eine werbefreie Erfahrung mit besonderen Vorteilen und unterstützen Sie Reddit direkt. Dies ist ein Subreddit für die Diskussion von statistischer Theorie, Software und Anwendung.

Bitte versuchen Sie, die Beiträge zum Thema und von hoher Qualität zu halten. Nur weil es eine Statistik enthält, ist es keine Statistik. Memes und Bildmakros sind keine akzeptablen Formen von Inhalten.

Selbstbeiträge mit Wegwerfkonten werden von AutoModerator gelöscht. Verwandte Subreddits: Regierungsdatenportal St. Louis Fed. Quick-R - großartige R-Referenzseite. Verwandte Software-Links: Einreichung 1 Tipps für Studenten: Einreichung 1 Jobs und Praktika Für Absolventen: ISU Für Studenten: Willkommen bei Reddit, der Titelseite des Internets.

Werden Sie Redditor und schließen Sie sich einer von Tausenden von Communities an. Möchten Sie zur Diskussion hinzufügen? Einen Kommentar posten! Ein Konto erstellen. G ist wie ein Chi-Quadrat und asymptotisch als eins verteilt, mit ähnlicher Interpretation. Sie können besser entscheiden, wie gut die Passform ist, indem Sie die Modelldiagnose untersuchen. Einige sachliche Fehler wurden behoben. Wahrscheinlichkeiten sind keine PDFs. Und PDFs sind nicht unbedingt oben durch 1 gebunden.

(с) 2019 app9bergamo.com