Datarensning ( eng. Data cleansing ) är processen att identifiera och korrigera fel, datainkonsekvenser för att förbättra deras kvalitet, ibland klassificerad som en integrerad del av datautvinning .
Datarensning utförs på specifika uppsättningar data i databaser eller filer. Behovet av datarensning uppstår oftast när man integrerar olika informationssystem ( datalager , företagsresurshanteringssystem, system för hantering av kundrelationer ).
Datakällor i olika system är ofta spridda och i olika tillstånd. Transformationer utförs automatiskt (enligt en uppsättning regler) eller manuellt (interaktivt).
De mest typiska ämnesområdena som ska rengöras och korrigeras i företagens informationssystem är information om individer och organisationer, adress- och kontaktuppgifter, och eventuell referensinformation som läggs in manuellt i textform är också föremål för rengöring.