Privacy Policy Cookie Policy Terms and Conditions Hypergeometrische Verteilung - Wikipedia

Hypergeometrische Verteilung

aus Wikipedia, der freien Enzyklopädie

Die Hypergeometrische Verteilung ist eine diskrete Wahrscheinlichkeitsverteilung in der Stochastik. Umgangssprachlich werden Fragestellungen, die von der hypergeometrischen Verteilung erfasst werden auch als Ziehen ohne Zurücklegen bezeichnet (siehe auch Kombinatorik).

Sie wird verwendet, um Vorgänge zu modellieren, bei denen aus einer dichotomen Grundgesamtheit zufällig eine Stichprobe entnommen und auf eine bestimmte Eigenschaft geprüft wird.

Die hypergeometrische Verteilung gibt dann Auskunft darüber, mit welcher Wahrscheinlichkeit in der Stichprobe eine bestimmte Anzahl von Elementen vorkommt, die die gewünschte Eigenschaft haben. Bedeutung kommt dieser Verteilung daher etwa bei Qualitätskontrollen zu.

Ein beispielhaftes Problem: In einer Urne befinden sich 45 Kugeln, 20 davon sind gelb. Wie hoch ist die Wahrscheinlichkeit in einer 10-elementigen Stichprobe 4 gelbe Kugeln zu ziehen? - Das Beispiel wird unten durchgerechnet.

Inhaltsverzeichnis

[Bearbeiten] Definition

Die hypergeometrische Verteilung ist abhängig von drei Parametern:

  • der Anzahl N der Elemente einer Grundgesamtheit.
  • der Anzahl M\leq N der Elemente mit einer bestimmten Eigenschaft in dieser Grundmenge.
  • Der Anzahl n\leq N der Elemente in einer Stichprobe.

Die Verteilung gibt nun Auskunft darüber, wie wahrscheinlich es ist, dass sich k Elemente mit der zu prüfenden Eigenschaft in der Stichprobe befinden. Der Ergebnisraum Ω ist daher {0,1,...,n}.

Eine diskrete Zufallsgröße X unterliegt der hypergeometrischen Verteilung mit den Parametern M, N, n und k, wenn sie die Wahrscheinlichkeiten

h(k|N;M;n):= P(X = k) = \frac{\displaystyle{M \choose k}{N-M \choose n-k}}{\displaystyle{N \choose n}}

für x \in \Omega besitzt. Dabei bezeichnet N \choose n den Binomialkoeffizienten "N über n".

Die Verteilungsfunktion H(x | N;M;n) gibt dann die Wahrscheinlichkeit an, dass höchstens k viele Kugeln erster Sorte in der Stichprobe sind. Diese kumulierte Wahrscheinlichkeit ist die Summe

H(k|N;M;n) := P(X \le k)= \sum_{y=0}^{k}h(y|N;M;n)                                = \sum_{y=0}^{y<k} \frac{\displaystyle{M\choose y}{\displaystyle{N-M}\choose{n-y}}}{\displaystyle{N\choose n}}.

[Bearbeiten] Eigenschaften der Hypergeometrischen Verteilung

[Bearbeiten] Symmetrie

h(k|N;M;n)=h(k|N;n;M)= \frac{{M \choose k}{N-M \choose n-k}}{{N \choose n}}= \frac{{n \choose k}{N-n \choose M-k}}{{N \choose M}}

[Bearbeiten] Erwartungswert

Der Erwartungswert der Hypergeometrischen Verteilung ist

\operatorname{E}(X)= \sum_{k=0}^n k \frac{\displaystyle{M\choose k}{\displaystyle{N-M}\choose{n-k}}}{\displaystyle{N\choose n}} = n\frac{M}{N}.

[Bearbeiten] Varianz

Für die Varianz erhält man in analoger Weise

\operatorname{Var}(X)=\sum_{k=0}^n k^2 \frac{\displaystyle{M\choose k}{\displaystyle{N-M}\choose{n-k}}}{\displaystyle{N\choose n}} -\left(n\frac{M}{N}\right)^2 =n \, \frac{M}{N} \left( 1-\frac{M}{N} \right) \frac{N-n}{N-1},

wobei der letzte Bruch der so genannte Korrekturfaktor beim Modell ohne Zurücklegen ist.

[Bearbeiten] Charakteristische Funktion

Die charakteristische Funktion hat die Form

\phi_{X}(s) = (1-p(1-e^{is}))^{n} \,.

[Bearbeiten] Beziehung zu anderen Verteilungen

[Bearbeiten] Beziehung zur Binomialverteilung

Im Gegensatz zur Binomialverteilung werden bei der Hypergeometrischen Verteilung die Stichproben nicht wieder in das Reservoir zu erneuten Auswahl zurückgelegt. Ist der Umfang n der Stichprobe relativ klein im Vergleich zum Umfang N der Grundgesamtheit , dann unterscheiden sich die Wahrscheinlichkeiten, die durch die Binomialverteilung und die Hypergeometrische Verteilung berechnet werden, nicht wesentlich voneinander. In diesen Fällen wird oft die Binomialverteilung der Hypergeometrischen Verteilung vorgezogen, weil sie mathematisch einfacher zu handhaben ist.(Als Faustregel für dieses Vorgehen gilt hier n / N < 0,05.)

[Bearbeiten] Beispiele

In einem Behälter befinden sich 45 Kugeln, davon sind 20 gelb. Es werden 10 Kugeln ohne Zurücklegen entnommen.
Die Hypergeometrische Verteilung gibt die Wahrscheinlichkeit dafür an, dass genau x = 0, 1, 2, 3, ..., 10 der entnommenen Kugeln gelb sind.

Wahrscheinlichkeit beim deutschen Lotto
vergrößern
Wahrscheinlichkeit beim deutschen Lotto
Wahrscheinlichkeit beim deutschen Lotto logarithmisch skaliert
vergrößern
Wahrscheinlichkeit beim deutschen Lotto logarithmisch skaliert

Das wohl häufigste Beispiel für die Anwendung der Hypergeometrischen Verteilung ist das Lotto: Beim Zahlenlotto gibt es 49 nummerierte Kugeln; davon werden bei der Auslosung 6 gezogen; auf dem Lottoschein werden 6 Zahlen angekreuzt.
h(x|49;6;6) gibt die Wahrscheinlichkeit dafür an, genau x = 0, 1, 2, 3, ..., 6 "Treffer" zu erzielen.

[Bearbeiten] Ausführliches Rechenbeispiel für die Kugeln

farbige Kugeln
Zu dem oben aufgeführten Beispiel der farbigen Kugeln soll die Wahrscheinlichkeit ermittelt werden, dass genau 4 gelbe Kugeln resultieren

Gesamtanzahl der Kugeln N = 45
Anzahl mit der Eigenschaft "gelb" M = 20
Umfang der Stichprobe n = 10
davon Anteil gelb x = 4

Also h(4|45,20,10)

Die Wahrscheinlichkeit ergibt sich aus:

Anzahl der Möglichkeiten, genau 4 gelbe (und damit genau 6 violette) Kugeln auszuwählen
geteilt durch
Anzahl der Möglichkeiten, genau 10 Kugeln beliebiger Farbe auszuwählen

Es gibt

{ M \choose x } = { 20 \choose 4 } = 4845

Möglichkeiten, genau 4 gelbe Kugeln auszuwählen.

Es gibt

{ {N - M }\choose {n - x }} =  { 25 \choose 6 } = 177100

Möglichkeiten, genau 6 violette Kugeln auszuwählen.

Da jede "gelbe Möglichkeit" mit jeder "violetten Möglichkeit" kombiniert werden kann, ergeben sich

{ M \choose x } \cdot { {N - M }\choose {n - x }} =  4845 \cdot 177100 =858049500

Möglichkeiten für genau 4 gelbe und 6 violette Kugeln.

Es gibt insgesamt

{ N \choose n }

Möglichkeiten, 10 Kugeln zu ziehen.

Wir erhalten also die Wahrscheinlichkeit

P(X=4)=h(4|45,20,10)=\frac{{ 20 \choose 4 }{ 25 \choose 6 }}{{ 45 \choose 10 }} = \frac{4845 \cdot 177100 }{3190187286} = 0,2690,

das heißt, in rund 27 Prozent der Fälle werden genau 4 gelbe (und 6 violette) Kugeln entnommen.

[Bearbeiten] Zahlenwerte zu den Beispielen

h(x|45;20;10)
x
Anzahl möglicher
Ergebnisse
Wahrscheinlichkeit
in %
0 3268760 0,1024
1 40859500 1,2807
2 205499250 6,4416
3 547998000 17,1776
4 858049500 26,8965
5 823727520 25,8207
6 490314000 15,3694
7 178296000 5,5889
8 37791000 1,1846
9 4199000 0,1316
10 184756 0,0058
3190187286 100,0000
Erwartungswert 4,4444
Varianz 1,9641
h(x|45;10;20)
x
Anzahl möglicher
Ergebnisse
Wahrscheinlichkeit
in %
0 3247943160 0,1024
1 40599289500 1,2808
2 204190544250 6,4416
3 544508118000 17,1776
4 852585079500 26,8965
5 818481676320 25,8207
6 487191474000 15,3694
7 177160536000 5,5889
8 37550331000 1,1846
9 4172259000 0,1316
10 183579396 0,0058
11 0 0
12 0 0
13 0 0
14 0 0
15 0 0
16 0 0
17 0 0
18 0 0
19 0 0
20 0 0
3169870830126 100,0000
Erwartungswert 4,4444
Varianz 1,9641
h(x|49;6;6)
x
Anzahl möglicher
Ergebnisse
Wahrscheinlichkeit
in %
0 6096454 43,5965
1 5775588 41,3019
2 1851150 13,2378
3 246820 1,7650
4 13545 0,0969
5 258 0,0018
6 1 0,0000
13983816 100,0000
Erwartungswert 0,7347
Varianz 0,5776

[Bearbeiten] Weblinks

Wikibooks: Hypergeometrische Verteilung – Lern- und Lehrmaterialien

Static Wikipedia 2008 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -