Datarensning

Datarensning ( eng.  Data cleansing ) är processen att identifiera och korrigera fel, datainkonsekvenser för att förbättra deras kvalitet, ibland klassificerad som en integrerad del av datautvinning .

Datarensning utförs på specifika uppsättningar data i databaser eller filer. Behovet av datarensning uppstår oftast när man integrerar olika informationssystem ( datalager , företagsresurshanteringssystem, system för hantering av kundrelationer ).

Datakällor i olika system är ofta spridda och i olika tillstånd. Transformationer utförs automatiskt (enligt en uppsättning regler) eller manuellt (interaktivt).

De mest typiska ämnesområdena som ska rengöras och korrigeras i företagens informationssystem är information om individer och organisationer, adress- och kontaktuppgifter, och eventuell referensinformation som läggs in manuellt i textform är också föremål för rengöring.

Länkar