Deze bundel is een initiatief van verscheidene studenten met verschillende academische achtergronden, zowel technische als economische. Zij hebben getracht in een bundel alle noodzakelijke kennis samen te vatten en in gebruikelijk taal uiteen te zetten. De schrijvers gaan er van uit dat lezers van deze bundel enige voorkennis hebben van de basisbeginselen van de Statistiek. Studenten die onderzoek doen en de basis van de Statistiek al onder de knie hebben, kunnen direct doorbladeren naar hoofdstuk 11.
Veel plezier in de wereld van statistiek!
Arnoud Hattink
Statistiek is een manier om informatie te verkrijgen van data.
Niets meer, niets minder. Veel studenten vragen zich af waarom statistiek boeken zo schrikbarend dik zijn als statistiek zich louter bezighoudt met het verkrijgen van informatie over data. Dit komt doordat studenten vandaag de dag geconfronteerd worden met verschillende soorten data die onderzocht kunnen worden met verscheidene methoden.
Om de beginselen van de statistiek te begrijpen is kennis van een aantal basisbegrippen en symbolen een noodzaak. In de tabel hieronder is een aantal symbolen met hun betekenis te vinden.
| Α ∪ Β | De vereniging van gebeurtenissen Α en Β die plaatsvindt als Α of Β of beiden plaatsvinden |
| Α ∩ Β | De doorsnede van de gebeurtenissen Α en Β die plaatsvindt als Α en Β beiden plaatsvinden |
| Αc | Het complement van gebeurtenis Α vindt plaats als Α niet plaatsvindt |
| Α − Β | Het verschil tussen Α en Β |
| Α ⊂ Β | Α is een deelverzameling van Β |
Een Venndiagram is een diagram dat gebruikt wordt om relaties tussen verzamelingen aan te geven. Het Venndiagram hieronder geeft een versimpelde illustratie van Α als deelverzameling van Β.
Figuur 1a. Α ⊂ Β (Bron: Wikipedia.nl)
Als er een willekeurig experiment (ook wel random experiment = een actie of proces dat leidt tot een of meerdere mogelijke uitkomsten) wordt uitgevoerd zijn een paar begrippen van belang.
Alle mogelijke uitkomsten van zo’n experiment bij elkaar noemt men de uitkomstenruimte (Ω). Het complement van Ω noteert men als ∅ (=Ωc). Elk element van Ω heeft een uitkomst ω. De notatie ω ∈ Ω staat voor ″ω is element van Ω en deelverzamelingen van Ω heten gebeurtenissen.
Een paar (Ρ, Ω) dat bestaat uit verzamelingen Ω en kansfunctie Ρ noemt men een kansruimte. Deze kansruimte voegt aan elke deelverzameling Α ⊂ Ω een reëel getal op het interval [0;1] toe en wel op zo'n manier dat er sprake is van de twee volgende axioma's (axioma = een niet bewezen , maar als grondslag aanvaarde stelling):
als de deelverzameling A1, A2,... van Ω paarsgewijs disjunct zijn.De kans op gebeurtenis Α noteert met als Ρ(Α). De term disjunct vereist wat toelichting. Twee gebeurtenissen Α en Β zijn disjunct als geldt Α ∩ Β = ∅. Met andere woorden, Α en Β sluiten elkaar uit.
Uit de 2 bovenstaande axioma's kan het volgende geconcludeerd worden:
| Als Α ⊂ Β dan Ρ(Β − Α) = Ρ(Β) − Ρ(Α) = Ρ(Αc ∩ Β) |
| Als Ρ(Αc) = 1 − Ρ(Α); in geval van Α = Ω : Ρ(∅) = 0 |
| Als Α ⊂ Β dan Ρ(Α) ≤ Ρ(Β) |
|
;dit is ook wel de ongelijkheid van Bonferroni
|
| Als Α1, Α2, …, Αn paarsgewijs disjunct zijn dan geldt Ρ(Α1 ∪ … ∪ Αn = Ρ(Α1 + … + Ρ(Α1) |
Er is een uitzondering op al het bovenstaande:
Heeft Ω een eindig aantal elementen (Ν) met allen gelijke
kansen dan geldt Ρ(ω) = 1 ⁄ Ν voor iedere &omega ∈ Ω.
Tevens geldt dat
is het aantal elementen van Α
Beschouw de verzameling Ω = {1,2,3,4}. Definieer voor iedere deelverzameling Α ⊃ Ω
Dit voorbeeld kan model staan voor een worp met (let op!) een 4-zijdige dobbelsteen.
Figuur 1b : 4-zijdige dobbelsteen (bron: www.wikipedia.nl)
Beschouw de verzameling Ω = {1,2,3,4} x {1,2,3,4}. Definieer voor iedere deelverzameling Α ⊃ Ω
Dit voorbeeld kan model staan voor twee worpen met een 4-zijdige dobbelsteen. De gebeurtenis "twee gelijke ogen" zou omschreven worden als Ω = { (1,1), (2,2), (3,3), (4,4) }.
Vaak wil men weten hoe twee gebeurtenissen gerelateerd zijn. Sterker nog, men wil de kans weten van een gebeurtenis gegeven dat een andere, gerelateerde gebeurtenis plaatsvindt. Deze kans noemt men de voorwaardelijke kans wordt als volgt genoteerd:
De kans op Α, gegeven Β is:
Ρ(Α | Β) = Ρ(Α ∩ Β) ⁄ Ρ(Β)
De kans op Β, gegeven Α is:
Ρ(Β | Α) = Ρ(Α ∩ Β) ⁄ Ρ(Α)
Voortbordurend op deze definities kan men de productregel toepassen:
Ρ(Α ∩ Β) = Ρ(Β) x Ρ(Α | Β) = Ρ(Α) x Ρ(Β | Α)
Toptennisser Nedal speelt in de finale van het tennistoernooi Ronald Barros
tegen de winnaar van de halve finale tussen Foderer en Kraaijenbek. Aangezien
Kraaijenbek zijn beste jaren tennis al gehad heeft, schat men de kans dat
Foderer de finale haalt op 86%. De kans dat Nedal Foderer in de finale verslaat
is 67%, daar Nedal heer en meester is op gravel. De kans dat Nedal Kraaijenbek
in de finale verslaat is nog groter, te weten 93%. De kans dat Nedal het
toernooi wint, wordt dan als volgt berekend:
Ρ(Nedal wint Ronald Barros) = Ρ(Foderer wint halve finale) × Ρ(Nedal wint Ronald Barros | Foderer wint halve finale) + Ρ(Kraaijenbek wint halve finale) × Ρ(Nedal wint Ronald Barros | Kraaijenbek wint halve finale)
=
0,86 × 0,67 + 0,14 × 0,93 = 70,6 %
Een van de doelen van het berekenen van de voorwaardelijke kans is het vaststellen of twee gebeurtenissen gerelateerd aan elkaar zijn of niet. Anders gezegd, men wil er achter komen of gebeurtenissen onafhankelijk zijn van elkaar.
Twee gebeurtenissen A en B zijn onafhankelijk van elkaar als:
Ρ(Α | Β) = Ρ(Α)
of
Ρ(Β | Α) = Ρ(Β)
Met andere woorden, twee gebeurtenissen zijn onafhankelijk van elkaar als de kans van een gebeurtenis niet beïnvloed wordt door het plaatsvinden van de andere gebeurtenis.
Daan gooit 2 euromunten op. Beschouw de gebeurtenissen
Α: de eerste euromunt is kop
Β: de tweede euromunt is munt
De kans hierop is:
Ρ(Α ∩ Β) = 1⁄4 = 1⁄2 x 1⁄2 = Ρ(Α) x Ρ(Β)
Gegeven de bovenstaande kans kan men concluderen dat α en β onafhankelijk zijn. Immers zal de uitkomst van de worp van de eerste euromunt geen invloed hebben op de uitkomst van de worp met de tweede euromunt (en andersom is uiteraard ook het geval).
Met de somregel kan men de kans van de vereniging van twee gebeurtenissen berekenen. De kans dat gebeurtenis Α, of gebeurtenis Β, of beiden plaatsvinden is
Ρ(Α ∪ Β) = Ρ(Α) + Ρ(Β) − Ρ(Α ∩ Β)
De meeste studenten vragen zich nu per direct af waarom Ρ(Α ∩ Β) van Ρ(Α) en Ρ(Β) wordt afgetrokken. Dit komt doordat bij de optelling van Ρ(Α) en Ρ(Β) de kans Ρ(Α ∩ Β) dubbel wordt geteld en deze dient er weer vanaf getrokken te worden.
Arnold is bezig met zijn derde jaar Bachelor van Bedrijfskunde en heeft nog twee vakken openstaan die hij moet halen om in september aan zijn Master te beginnen. Aangezien Arnold erg druk is met zijn studie en daarnaast ook nog werkt, kan zijn werk invloed hebben op zijn studieresultaten. Zie 10 onderstaande tabel met de kansen dat hij wel of niet aan zijn Master begint gecombineerd met 1 of 2 dagen in de week werken.
| 2 dagen werken | 1 dag werken | |
|---|---|---|
| Master in september | 0.11 | 0.29 |
| Geen master in september | 0.66 | 0.54 |
In geval van 3 willekeurige gebeurtenissen wordt automatisch de somregel ook langer:
P (A ∪ B ∪ C) = P (A) + P (B) + P (C)
- P (A ∩ B) - P (A ∩ C) - P (B ∩ C)
+ P ∩ (A ∩ B ∩ C)
Hierop voortbordurend kan men voor n gebeurtenissen de volgende somregel afleiden:
Let op! Voor de laatste term gebruikt men een plusteken voor een oneven n en een minteken voor een even n.
Voorwaardelijke kansen worden vaak gebruikt om relaties tussen twee gebeurtenissen te peilen. I voorbeeld 1c werd al aangegeven dat een voorwaardelijke kans de kans meet dat een gebeurtenis plaatsvindt, gegeven dat een mogelijke oorzaak van deze gebeurtenis al heeft plaatsgevonden. Al de kans op een gebeurtenis bekend is, maar de kans op een van de mogelijke oorzaken berekend dient te worden, kunnen problemen ontstaan. Het theorema van Bayes biedt hiervoor de oplossin Hieronder zal alleen de formule van het theorema van Bayes gegeven worden, daar er in de studieboeken van de Bedrijfsstatistiek hier maar kort op ingegaan wordt.
Theorema van Bayes:
Voor meer achtergrondinformatie over het theorema van Bayes dient de lezer er geavanceerde statistiekboeken op na te slaan.
In de combinatoriek of combinatieleer bestudeert men eindige verzamelingen van objecten die aan gespecificeerde eigenschappen voldoen. In het bijzonder houdt men zich bezig met het "tellen" van objecten in deze verzamelingen en het bepalen of er zekere "optimale" objecten in een verzameling aanwezig zijn1.
Binnen de combinatoriek kent men 4 “hoofdcategorieën”. Hieronder worden deze categorieën zo overzichtelijk mogelijk uiteengezet met de corresponderende formules.
Men kiest k elementen uit n; hier is de volgorde van belang en er sprake van trekken met
terugleggen. De formule die men hiervoor hanteert is
Oscar gooit tien keer met een euromunt. Elke worp heeft twee mogelijkheden: óf kop, óf munt. Er zijn dan 2 10 = 1024 uitkomsten voor deze tien worpen met de euromunt.
Men trekt k elementen uit een verzameling van n; hier is de volgorde van belang en er is sprake van
trekken zonder terugleggen. De formule die men hiervoor hanteert is

Maurits, Karel en Paul besluiten op een zonnige middag naar de bioscoop te gaan. Na hun kaartjes gekocht te hebben lopen ze de desbetreffende zaal in en komen er achter dat de gehele zaal, bestaande uit 350 zitplaatsen, leeg is. Bereken op hoeveel verschillende manieren ze in de zaal kunnen gaan zitten.
Men trekt k elementen uit een verzameling n; hier is de volgorde niet van belang en er is sprake van
trekken zonder terugleggen. De formule die men hiervoor hanteert is
Pieter heeft lang gespaard en kan 3 nieuwe videospellen kopen voor zijn Woo-spelcomputer. In de winkel valt zijn oog op 5 spellen die allemaal even duur zijn. Hij kan er echter maar 3 kiezen. Bereken hoeveel keuzemogelijkheden Pieter heeft.
Men trekt k elementen uit een verzameling n ; hier is de volgorde niet van belang en er is sprake van trekken met terugleggen. De formule die men hiervoor hanteert is
Eelco besluit voor het Paasontbijt zijn ouders te verrassen met geschilderde eieren. Hij beschikt over twee dozen van zes eieren en haalt drie potten verf uit de kelder, elk met een andere kleur verf. Bereken op hoeveel verschillende manieren hij de eieren kan beschilderen.
Samengevat :
| Volgorde van belang | Volgorde niet van belang | |
|---|---|---|
| Trekken zonder terugleggen |
|
|
| Trekken met terugleggen |
|
|