Anscombes kvartett är fyra uppsättningar av numeriska data vars enkla statistiska egenskaper är identiska, men deras plot är signifikant olika. Varje uppsättning består av 11 par med nummer. Kvartetten sammanställdes 1973 av den engelske matematikern F. J. Anscombe för att illustrera vikten av plottning för statistisk analys och effekten av extremvärden på egenskaperna hos hela datamängden.
Alla set har följande egenskaper:
Karakteristisk | Menande |
---|---|
Variabelt medelvärde | 9,0 |
Varians av en variabel | 10,0 |
Variabelt medelvärde | 7.5 |
Varians av en variabel | 3,75 |
Korrelation mellan variabler och | 0,816 |
Direkt linjär regression | |
Koefficient för bestämning av linjär regression | 0,67 |
Sekvenserna i sig visas nedan. Värdet är detsamma för de tre första sekvenserna.
jag | II | III | IV | ||||
---|---|---|---|---|---|---|---|
x | y | x | y | x | y | x | y |
10,0 | 8.04 | 10,0 | 9.14 | 10,0 | 7,46 | 8,0 | 6,58 |
8,0 | 6,95 | 8,0 | 8.14 | 8,0 | 6,77 | 8,0 | 5,76 |
13,0 | 7,58 | 13,0 | 8,74 | 13,0 | 12,74 | 8,0 | 7,71 |
9,0 | 8,81 | 9,0 | 8,77 | 9,0 | 7.11 | 8,0 | 8,84 |
11.0 | 8,33 | 11.0 | 9,26 | 11.0 | 7,81 | 8,0 | 8,47 |
14,0 | 9,96 | 14,0 | 8.10 | 14,0 | 8,84 | 8,0 | 7.04 |
6,0 | 7.24 | 6,0 | 6.13 | 6,0 | 6.08 | 8,0 | 5,25 |
4.0 | 4,26 | 4.0 | 3.10 | 4.0 | 5,39 | 19,0 | 12.50 |
12,0 | 10,84 | 12,0 | 9.13 | 12,0 | 8.15 | 8,0 | 5,56 |
7,0 | 4,82 | 7,0 | 7,26 | 7,0 | 6,42 | 8,0 | 7,91 |
5.0 | 5,68 | 5.0 | 4,74 | 5.0 | 5,73 | 8,0 | 6,89 |