Neyman-Pearson-Lemma

Das Neyman-Pearson-Lemma, auch Fundamentallemma von Neyman-Pearson oder Fundamentallemma der mathematischen Statistik genannt, ist ein zentraler Satz der Testtheorie und somit auch der mathematischen Statistik, der eine Optimalitätsaussage über die Konstruktion eines Hypothesentests macht. Gegenstand des Neyman-Pearson-Lemmas ist das denkbar einfachste Szenario eines Hypothesentests, das auch Neyman-Pearson-Test genannt wird: Dabei ist sowohl die Nullhypothese H 0 {\displaystyle H_{0}} als auch die Alternativhypothese H 1 {\displaystyle H_{1}} einfach, d. h., sie entsprechen jeweils einer einzelnen Wahrscheinlichkeitsverteilung, deren zugehörige Wahrscheinlichkeitsdichten nachfolgend mit f 0 {\displaystyle f_{0}} und f 1 {\displaystyle f_{1}} bezeichnet werden. Dann, so die Aussage des Neyman-Pearson-Lemmas, erhält man den besten Test durch eine Entscheidung, bei der die Nullhypothese verworfen wird, wenn der Likelihood-Quotient f 0 / f 1 {\displaystyle f_{0}/f_{1}} einen bestimmten Wert unterschreitet.

Das Lemma ist nach Jerzy Neyman und Egon Pearson benannt, die es 1933 bewiesen haben.[1]

Situation

Gesucht ist ein möglichst „guter“ Hypothesentest, der mit hoher Zuverlässigkeit eine Entscheidung zwischen Null- und Alternativhypothese herbeiführen soll. Dabei wird vorausgesetzt, dass Null- und Alternativhypothese jeweils genau einer für die Beobachtungsergebnisse geltenden Wahrscheinlichkeitsverteilung entsprechen. Unter dieser Voraussetzung kann für jede Festlegung eines Verwerfungsbereichs die Wahrscheinlichkeit einer falschen Testentscheidung exakt berechnet werden: Im Detail handelt es sich um die beiden Wahrscheinlichkeiten für einen Fehler erster Art und einen Fehler zweiter Art. Daher können bei einer durch das Signifikanzniveau vorgegebenen Obergrenze für einen Fehler erster Art die theoretisch denkbaren Testentscheidungen besonders einfach in qualitativer Hinsicht untereinander verglichen werden.

Formale Beschreibung der Situation

Beobachtet werden Realisierungen eines reellen Zufallsvektors X {\displaystyle X} mit Dimension d {\displaystyle d} mit Werten in dem Messraum ( R d , B d ) {\displaystyle (\mathbb {R} ^{d},{\mathcal {B}}^{d})} . Unbekannt ist die exakte Verteilung P X {\displaystyle P_{X}} von X {\displaystyle X} . Getestet werden soll die Nullhypothese „ P X = P 0 {\displaystyle P_{X}=P_{0}} “ gegen die Alternative „ P X = P 1 {\displaystyle P_{X}=P_{1}} “ für zwei Wahrscheinlichkeitsmaße P 0 , P 1 {\displaystyle P_{0},P_{1}} über dem gegebenen Messraum. Die Maße P 0 {\displaystyle P_{0}} und P 1 {\displaystyle P_{1}} besitzen Dichten f 0 {\displaystyle f_{0}} bzw. f 1 {\displaystyle f_{1}} bzgl. des Lebesgue-Maßes, d. h., sie sind stetige Verteilungen auf R d {\displaystyle \mathbb {R} ^{d}} .

Charakterisiert wird ein Entscheidungsverfahren jetzt durch die Festlegung eines Verwerfungsbereichs B B d {\displaystyle B\in {\mathcal {B}}^{d}} , mit dessen Hilfe man die Nullhypothese genau dann verwirft, wenn die beobachtete Realisierung von X {\displaystyle X} in B {\displaystyle B} liegt. Dieser Test darf ein vorgegebenes Niveau α ( 0 , 1 ) {\displaystyle \alpha \in (0,1)} nicht überschreiten,

P 0 ( B ) = 1 B ( x ) f 0 ( x ) d x α {\displaystyle P_{0}(B)=\int 1_{B}(x)f_{0}(x)dx\leq \alpha } ,

d. h., die Wahrscheinlichkeit für ein fälschliches Verwerfen der Nullhypothese, der sog. Fehler 1. Art, darf nicht größer als α {\displaystyle \alpha } sein. Unter allen Tests, die dieses Niveau einhalten, nennt man denjenigen den stärksten Test, der die sog. Teststärke P 1 ( B ) {\displaystyle P_{1}(B)} maximiert, sprich einen minimalen Fehler 2. Art,

P 1 ( B ) = 1 B ( x ) f 1 ( x ) d x {\displaystyle P_{1}(B^{\complement })=\int 1_{B^{\complement }}(x)f_{1}(x)dx} ,

die Wahrscheinlichkeit für ein fälschliches Nichtverwerfen der Nullhypothese, besitzt.

Formulierung

Das Neyman-Pearson-Lemma

Unter der obigen Situation betrachtet man für eine Realisierung von X {\displaystyle X} den erweiterten Likelihood-Quotienten

q ( x ) := { f 0 ( x ) f 1 ( x )   , f 1 ( x ) > 0 1   , f 0 ( x ) = f 1 ( x ) = 0   , f 0 ( x ) > 0 , f 1 ( x ) = 0   . {\displaystyle q(x):={\begin{cases}{\frac {f_{0}(x)}{f_{1}(x)}}\ ,&f_{1}(x)>0\\1\ ,&f_{0}(x)=f_{1}(x)=0\\\infty \ ,&f_{0}(x)>0,f_{1}(x)=0\end{cases}}\ .}

Der Fall f 0 ( x ) = f 1 ( x ) = 0 {\displaystyle f_{0}(x)=f_{1}(x)=0} wird nur der Vollständigkeit halber definiert, da er mit keiner positiven Wahrscheinlichkeit eintritt.

Jetzt ist ein Test der Hypothese „ P X = P 0 {\displaystyle P_{X}=P_{0}} “ gegen die Alternative „ P X = P 1 {\displaystyle P_{X}=P_{1}} “ zu einem gegebenen Niveau α ( 0 , 1 ) {\displaystyle \alpha \in (0,1)} genau dann optimal (stärkster Test), wenn ein γ ( 0 , ) {\displaystyle \gamma \in (0,\infty )} existiert, sodass sein Verwerfungsbereich B B d {\displaystyle B\in {\mathcal {B}}^{d}} die Forderungen

  1. P 0 ( B ) = α {\displaystyle P_{0}(B)=\alpha } sowie
  2. q ( x ) γ {\displaystyle q(x)\leq \gamma } für fast sicher alle x B {\displaystyle x\in B} und
  3. q ( x ) γ {\displaystyle q(x)\geq \gamma } für fast sicher alle x B {\displaystyle x\in B^{\complement }}

erfüllt. Die fast sicheren Eigenschaften aus 2. und 3. beziehen sich hierbei auf das Wahrscheinlichkeitsmaß 0 , 5 ( P 0 + P 1 ) {\displaystyle 0{,}5(P_{0}+P_{1})} , d. h. sie müssen fast sicher bzgl. P 0 {\displaystyle P_{0}} und P 1 {\displaystyle P_{1}} eintreten.

Erfüllt ein Verwerfungsbereich B {\displaystyle B} die Forderungen 1.–3., nennt man diesen auch einen Neyman-Pearson-Bereich. In diskreten Modellen existiert solch ein Verwerfungsbereich nur zu bestimmten Niveaus α {\displaystyle \alpha } , um ein vorgegebenes Niveau komplett auszuschöpfen muss gegebenenfalls auf randomisierte Tests zurückgegriffen werden.

Sonderfälle

Durch das obige Lemma nicht betrachtet wurden wenigstens die folgenden Sonderfälle:

  • Der Verwerfungsbereich B 0 = { f 0 = 0 } {\displaystyle B_{0}=\{f_{0}=0\}} ist der stärkste Test zum Testniveau α = 0 {\displaystyle \alpha =0} , d. h. der Test weist keinen Fehler 1. Art auf. Der entsprechende Testparameter ist γ = 0 {\displaystyle \gamma =0} .
  • Der Verwerfungsbereich B 1 = { f 1 > 0 } {\displaystyle B_{1}=\{f_{1}>0\}} ist der stärkste Test zum Niveau α = P 0 ( B 1 ) {\displaystyle \alpha =P_{0}(B_{1})} , denn er besitzt die Teststärke P 1 ( B 1 ) = 1 {\displaystyle P_{1}(B_{1})=1} , d. h. der Test weist keinen Fehler 2. Art auf. Der entsprechende Testparameter ist γ = {\displaystyle \gamma =\infty } .

Literatur

  • Jörg Bewersdorff: Statistik – wie und warum sie funktioniert. Ein mathematisches Lesebuch. Vieweg+Teubner Verlag, 2011, ISBN 978-3-8348-1753-2, S. 196–201, doi:10.1007/978-3-8348-8264-6. 
  • Edward J. Dudewicz, Satya N. Mishra: Modern Mathematical Statistics. John Wiley & Sons., 1988. 
  • Jerzy Neyman, Egon Pearson: On the Problem of the Most Efficient Tests of Statistical Hypotheses. In: Philosophical Transactions of the Royal Society of London. Series A, Containing Papers of a Mathematical or Physical Character. 231. Jahrgang, 1933, S. 289–337, doi:10.1098/rsta.1933.0009 (jstor.org). 

Einzelnachweise

  1. Neyman-Pearson lemma. In: Michiel Hazewinkel (Hrsg.): Encyclopedia of Mathematics. Springer-Verlag und EMS Press, Berlin 2002, ISBN 1-55608-010-7 (englisch, encyclopediaofmath.org). 
  • cnx.org: Neyman-Pearson criterion