Was ist in R der Unterschied zwischen dt (), pt () und qt () in Bezug auf die t-Verteilung des Schülers?


Antwort 1:

Das ist manchmal verwirrend. Ich habe beschlossen, ein kleines Bild zu malen, um meine Antwort besser zu veranschaulichen. Die ähnlichen Funktionen gelten für in R implementierte Hauptwahrscheinlichkeitsverteilungen und funktionieren je nach Präfix gleich:

d - Dichte ergibt den Dichtefunktionswert in einem gegebenen Punkt

p - Wahrscheinlichkeit ergibt CDF, d. h. Wahrscheinlichkeit, dass eine Zahl zurückgegeben wird, die kleiner als ein Argument für diese Funktion ist

q - Quantil, inverse CDF, d. h. welcher Wert bei gegebenem Quantil ist.

Lassen Sie mich das etwas näher erläutern. Betrachten wir die Verteilung mit 30 Freiheitsgraden, die der Normalverteilung nahe kommt.

qt (.95,30) gibt 1,69 zurück, was dem Wert des 95. Perzentils dieser Verteilung entspricht. Dies bedeutet, dass 95% aller Zahlen in unserer Distribution kleiner als 1,69 sind und nur 5% größer. Dies ist inverses CDF.

Wenn Sie pt (1.69,30) verwenden, erhalten Sie in ähnlicher Weise ein Ergebnis nahe 95%. Diese Funktion gibt die CDF zurück. Dies ist die Wahrscheinlichkeit, dass eine Zahl kleiner oder gleich dem Argument ist. Da 1,69 unser 95. Perzentil ist, liegt der CDF-Wert tatsächlich bei 95%.

dt (x, 30) ergibt den Wert der Wahrscheinlichkeitsdichtefunktion in x. Für 1,69 ist es 0,096, was ziemlich niedrig ist, während es für 0 50% ist.

Bedenken Sie, dass dies keine Wahrscheinlichkeit ist, diese Zahl zu erhalten. Um die Wahrscheinlichkeit zu erhalten, müssen Sie die Dichtefunktion für einen Wertebereich integrieren. Dies ist der Grund, warum die CDF-Funktion nützlich ist, da Sie durch Berechnen einer Differenz für zwei Werte die Wahrscheinlichkeit ermitteln können, eine Zahl zu erhalten, die zwischen diese beiden Zahlen fällt.


Antwort 2:

Ich gehe davon aus, dass dies Funktionen der t-Verteilung von Student sind und werde auf dieser Basis antworten.

dt () gibt die Wahrscheinlichkeitsdichte der t-Verteilung für einen bestimmten Freiheitsgrad zurück. Ich kann die t-Verteilung mit 9 Freiheitsgraden zeichnen und wie folgt anzeigen:

Das gibt:

pt () gibt die Schwanzwahrscheinlichkeiten an. Angenommen, Sie führen einen unteren Schwanztest durch und Ihre Teststatistik ist gleich -2,75 mit den gleichen Freiheitsgraden. Dann können Sie die untere Schwanzwahrscheinlichkeit wie folgt berechnen:

pt (-2,75, df = 9, lower.tail = TRUE)

Und Ihre Antwort lautet:

0,0112

Sie lehnen also Ihre Null bei 5% ab, aber nicht bei 1%, aber Sie sind nah dran.

qt () ist die Umkehrfunktion von t. Sie geben eine Wahrscheinlichkeit an und erhalten ein Quantil der t-Verteilung zurück. Angenommen, Sie wollten ein Konfidenzintervall von 99%. Das würde 0,005 in beiden Endstücken (1 - 0,99) / 2 lassen. Da ich Tabellen von minus unendlich bis t verwendet habe, würde ich dieses Quantil wie folgt berechnen:

qt (0,995, df = 9, unterer Schwanz = WAHR)

[1] 3.249836

>