Exploratory data analysis ( EDA ) är en analys av datas huvudsakliga egenskaper, hitta gemensamma mönster, fördelningar och anomalier i dem, bygga initiala modeller, ofta med hjälp av visualiseringsverktyg .
Konceptet introducerades av matematikern John Tukey , som formulerade målen för en sådan analys enligt följande:
De huvudsakliga metoderna för explorativ analys är studiet av sannolikhetsfördelningar av variabler, konstruktion och analys av korrelationsmatriser , faktoranalys , diskriminantanalys , flerdimensionell skalning .