Effizientes Datenlöschen oder Data Scrubbing ist ein Fehlerkorrekturverfahren, bei dem eine Hintergrundaufgabe verwendet wird, um den Hauptspeicher oder Speicher regelmäßig auf Fehler zu prüfen und erkannte Fehler zu korrigieren, indem redundante oder veraltete Daten systematisch gelöscht werden. Data Scrubbing reduziert die Wahrscheinlichkeit, dass sich einzelne, korrigierbare Fehler ansammeln, was letztlich zu einem reduzierten Risiko nicht korrigierbarer Fehler führt.
Datenintegrität ist ein vorrangiges Problem beim Schreiben, Lesen, Speichern, Übertragen oder Verarbeiten der Computerdaten in Computerbetriebssystemen sowie in Computerspeicher- und Datenübertragungssystemen. Allerdings bieten nur wenige der derzeit existierenden und verwendeten Dateisysteme einen ausreichenden Schutz gegen Datenkorruption. Um dieses Problem zu lösen, bietet Data Scrubbing Routinekontrollen aller Inkonsistenzen in Daten und verhindert im allgemeinen Hard- oder Softwarefehler. Diese "Scrubbing"-Funktion tritt häufig in Speichern, Disk-Arrays, Dateisystemen oder FPGAs als Mechanismus zur Fehlererkennung und -korrektur auf.
Datenbereinigung ist das Identifizieren und Korrigieren von Fehlern und Inkonsistenzen in Daten zur Verbesserung ihrer Qualität. Es wird manchmal als integraler Bestandteil von Data Mining klassifiziert. Die Datenbereinigung wird mit bestimmten Datensätzen in Datenbanken oder Dateien durchgeführt. Bei der Integration verschiedener Informationssysteme (Data Warehouses, Enterprise-Resource-Management-Systeme, Customer-Relationship-Management-Systeme) kommt es häufig zu einer Bereinigung der Daten.
Datenquellen in verschiedenen Systemen sind oft in unterschiedlicher Form und in unterschiedlichen Zuständen vorhanden. Transformationen werden automatisch (gemäß dem Regelwerk) oder manuell (im interaktiven Modus) durchgeführt. Die typischsten Themenbereiche, die in den Informationssystemen der Unternehmen bereinigt und korrigiert werden müssen, sind Informationen über Personen und Organisationen, Adressen und Kontaktinformationen, jegliche manuelle Information in der Textform sind ebenfalls zu bereinigen.
Aufgrund der hohen Integrationsdichte moderner Computerspeicherchips wurden die einzelnen Speicherzellenstrukturen klein genug, um für kosmische Strahlung und/ oder Alphateilchenemission anfällig zu sein. Die Fehler, die durch diese Phänomene verursacht werden, werden als Soft Errors bezeichnet. Dies kann ein Problem für DRAM- und SRAM-basierte Speicher sein. Das Memory Scrubbing führt eine Fehlererkennung und Korrektur von Bitfehlern im Computer-RAM durch, indem ECC-Speicher, andere Kopien der Daten oder andere Fehlererkennungscodes verwendet werden.