Schlechte Daten kosten dich Deals. Duplikate, fehlende Telefonnummern, falsch geschriebene Firmennamen und veraltete E-Mail-Adressen summieren sich. In diesem Artikel zeige ich dir, wie du mit HubSpots KI-Funktionen und Operations Hub deine Datenbank systematisch bereinigst. Inklusive einer Schritt-für-Schritt-Anleitung aus einem realen Kundenprojekt mit 12.000 Kontakten.

Warum ist Datenqualität in HubSpot so entscheidend?

Laut einer Studie von IBM kostet schlechte Datenqualität die US-Wirtschaft jährlich 3,1 Billionen Dollar. Das klingt abstrakt, aber runtergebrochen auf ein einzelnes CRM wird es greifbar: Jeder doppelte Kontakt verfälscht dein Reporting. Jede fehlende Telefonnummer verhindert einen Anruf. Jede falsche Lifecycle-Stage führt dazu, dass dein Vertrieb die falschen Leute anruft.

In unseren HubSpot Audits sehen wir das in fast jedem Portal. Die Datenbank wächst über Jahre, aber niemand kümmert sich aktiv um die Qualität. Kontakte werden importiert, aber nicht standardisiert. Duplikate entstehen durch unterschiedliche Schreibweisen. Properties werden angelegt, aber nie befüllt.

Der MIT Sloan Management Review hat das treffend formuliert: Die versteckten Kosten schlechter Daten übersteigen die sichtbaren um das Zehnfache. Und ehrlich gesagt sehe ich das in der Praxis genauso. Unternehmen investieren in Ads, Content und Sales-Teams, aber die Daten darunter sind ein Chaos.

💡

Wichtig: Datenqualität ist kein einmaliges Projekt. Es ist ein fortlaufender Prozess. HubSpot bietet dir mit Breeze AI und Operations Hub die Werkzeuge, um diesen Prozess zu automatisieren, statt ihn manuell zu betreiben.

HubSpot Data Quality Dashboard: Duplicate Issues, Formatting Issues, Enrichment Gaps und Recommended Actions
HubSpot Data Quality Dashboard: Auf einen Blick siehst du Duplikate, Formatierungsprobleme und Enrichment-Lücken — inklusive konkreter Handlungsempfehlungen

Welche Breeze AI Features helfen bei der Datenbereinigung?

HubSpots Breeze AI hat 2025 und 2026 mehrere Features speziell für Datenqualität eingeführt. Drei davon sind für die Bereinigung besonders relevant:

1. KI-gestützte Duplikat-Erkennung: Breeze erkennt nicht nur identische E-Mail-Adressen, sondern auch ähnliche Kontakte basierend auf Name, Firma und Telefonnummer. Das geht deutlich über den klassischen exakten Abgleich hinaus. Bei einem Kunden hat die KI-Erkennung 340 Duplikate gefunden, die der manuelle Abgleich übersehen hatte.

2. Data Enrichment: Breeze reichert Kontakte automatisch mit öffentlich verfügbaren Daten an: Jobtitel, Firmengröße, Branche, LinkedIn-Profil. Das füllt leere Felder, ohne dass du jeden Kontakt einzeln recherchieren musst.

3. Property Validation: HubSpot prüft automatisch, ob Telefonnummern ein valides Format haben, ob E-Mail-Domains existieren und ob Pflichtfelder ausgefüllt sind. In Kombination mit Workflows kannst du ungültige Daten automatisch markieren oder korrigieren lassen.

HubSpot Kontakt Actions Menü mit Merge, Summarize und weiteren KI-Aktionen
HubSpot Kontakt Actions: Merge, Summarize mit KI und weitere Bereinigungsaktionen direkt im Kontaktdatensatz

Wie bereinigst du deine HubSpot Daten Schritt für Schritt?

Die Reihenfolge ist entscheidend. Wenn du zuerst Duplikate zusammenführst und danach Properties standardisierst, machst du dir doppelte Arbeit. Hier ist der Prozess, den wir bei MAUTTEC in jedem Bereinigungsprojekt anwenden:

Schritt 1: Bestandsaufnahme. Exportiere deine Kontakte und analysiere die Datenqualität. Wie viele Kontakte haben keine E-Mail? Wie viele haben kein Unternehmen zugeordnet? Wie viele Duplikate zeigt HubSpot bereits an? Bei dem Kundenprojekt, das ich gleich beschreibe, waren es 12.341 Kontakte, davon 2.800 ohne Telefonnummer und 1.100 potenzielle Duplikate.

Schritt 2: Properties standardisieren. Bevor du irgendetwas zusammenführst, definiere Standards. Ländernamen als ISO-Codes (DE statt Deutschland). Telefonnummern im E.164-Format (+49...). Firmennamen ohne GmbH-Zusatz im separaten Feld. HubSpot Properties lassen sich dafür mit Dropdowns und Validierungsregeln absichern.

Schritt 3: Bulk-Bereinigung mit Operations Hub. Operations Hub bietet formatierte Workflows, die Daten bei Erstellung oder Änderung automatisch in das richtige Format bringen. Großbuchstaben am Anfang von Nachnamen, Leerzeichen am Ende entfernen, Telefonnummern normalisieren. Das sind keine glamourösen Features, aber sie verhindern, dass neue Daten wieder unsauber reinkommen.

Schritt 4: Duplikate zusammenführen. Jetzt erst kommen die Duplikate dran. HubSpot zeigt dir unter Contacts die erkannten Duplikate. Breeze AI bewertet die Wahrscheinlichkeit und schlägt vor, welche Felder aus welchem Datensatz übernommen werden sollen.

Schritt 5: Enrichment aktivieren. Nachdem die Basis sauber ist, aktivierst du Breeze Data Enrichment. Es füllt leere Felder automatisch auf. Aber erst nach der Bereinigung, sonst reicherst du Duplikate an, die du danach zusammenführst, und verlierst die angereicherten Daten.

HubSpot Merge Duplicate Records Maske mit zwei Kontakten im Vergleich
HubSpot Duplikate zusammenführen: Die Merge-Maske zeigt beide Datensätze nebeneinander mit allen Properties

KI-gestützte Duplikat-Erkennung vs. manuelle Bereinigung: Was bringt mehr?

Die kurze Antwort: beides zusammen. Die KI-Erkennung findet Duplikate, die du manuell nie entdeckt hättest. Aber sie macht auch Fehler, besonders bei häufigen Nachnamen oder Firmen mit mehreren Standorten.

Kriterium Manuelle Bereinigung KI-gestützte Bereinigung
Geschwindigkeit 5-10 Kontakte pro Minute Hunderte pro Minute (Vorschläge)
Fuzzy Matching Nur exakte Treffer erkennbar Ähnliche Namen, Tippfehler, Varianten
Fehlerquote Niedrig (bei Konzentration) 3-7% False Positives (muss geprüft werden)
Skalierbarkeit Nicht praktikabel ab 5.000+ Kontakten Funktioniert auch bei 100.000+
Kosten Arbeitszeit (intern oder Agentur) Operations Hub Professional (ab 792€/Monat)

Erfahrungswerte aus 40+ Bereinigungsprojekten bei MAUTTEC. Stand: April 2026.

Unser Ansatz: KI macht die Vorarbeit, ein Mensch prüft die kritischen Fälle. Bei dem 12.000er-Projekt hat das die Bereinigungszeit von geschätzt 80 Stunden auf 14 Stunden reduziert. Ehrlich gesagt hätte der Kunde ohne KI-Unterstützung das Projekt wahrscheinlich gar nicht gestartet.

HubSpot Manage Duplicates: Kontakt-Duplikate mit Review/Reject-Optionen und Filterung
Manage Duplicates: HubSpot zeigt erkannte Duplikate mit Firma, E-Mail und Lifecycle Stage — du entscheidest per Review oder Reject
HubSpot Merge Properties Detailansicht mit Vergleich der Felder beider Kontakte
Property-Vergleich beim Merge: HubSpot zeigt dir Feld für Feld, welcher Wert übernommen werden soll

Wie automatisierst du Datenqualität mit Workflows?

Die einmalige Bereinigung ist nur die halbe Miete. Ohne Prävention hast du in 6 Monaten wieder dasselbe Problem. HubSpot Workflows in Kombination mit Operations Hub lösen das, indem sie Daten bei jedem Zugang automatisch standardisieren.

Format-Standardisierung: Operations Hub Professional bietet sogenannte Data Quality Automation Workflows. Die können automatisch Vornamen großschreiben, Leerzeichen trimmen, Telefonnummern formatieren und Länderkürzel vereinheitlichen. Das passiert bei jedem neuen Kontakt und bei jeder Änderung, ohne dass jemand eingreifen muss.

Fehlende Felder auffüllen: Ein Workflow kann prüfen, ob bei einem Kontakt nach 7 Tagen immer noch kein Unternehmen zugeordnet ist. Wenn ja, erstellt er einen Task für den zuständigen Mitarbeiter oder versucht über Breeze Enrichment die Information automatisch zu ergänzen.

Ungültige Daten markieren: E-Mails die bouncen, Telefonnummern die zu kurz sind, Kontakte ohne Lifecycle Stage. All das lässt sich per Workflow erkennen und in eine "Datenqualität prüfen" Liste schieben. So entsteht ein Frühwarnsystem für schlechte Daten.

Tipp: Starte mit drei Workflows: einem für Format-Standardisierung (Groß-/Kleinschreibung, Trimming), einem für fehlende Pflichtfelder und einem für Bounce-Erkennung. Mehr brauchst du am Anfang nicht. Baue erst aus, wenn diese drei sauber laufen. Details zu HubSpot Automatisierung findest du im separaten Artikel.
HubSpot Breeze Data Agent: Web Research, Calls & Activities und Property Data mit KI-Prompts
Breeze Data Agent: KI-gestütztes Web Research, Analyse von Calls und Activities, und automatische Property-Anreicherung — direkt in HubSpot
HubSpot Enrich Contact Records Dialog: Enrichment-Optionen mit Fill Behavior Einstellungen
Data Enrichment aktivieren: Wähle zwischen „Fill empty values only", „Overwrite existing" oder „Do not fill" — pro Property konfigurierbar

Wie verbessern saubere Daten deine Conversion Rates?

Laut dem Experian Data Quality Report geben 83% der befragten Unternehmen an, dass Datenqualität direkten Einfluss auf ihren Umsatz hat. Das deckt sich mit dem, was wir bei unseren Kunden sehen.

Ein konkretes Beispiel: Ein Maschinenbauer aus Ulm hatte 8.400 Kontakte in HubSpot. Nach der Bereinigung (Duplikate entfernt, Properties standardisiert, Enrichment aktiviert) stieg die E-Mail-Öffnungsrate von 18% auf 27%. Warum? Weil Kontakte jetzt korrekt segmentiert waren und relevantere E-Mails bekamen. Die Bounces sanken von 4,2% auf 0,8%.

Der Salesforce State of Data Report bestätigt den Zusammenhang: Unternehmen mit hoher Datenqualität haben 70% höhere Lead-Conversion-Rates als solche mit niedriger Qualität. Das überrascht nicht. Wenn dein Vertrieb den richtigen Ansprechpartner mit der richtigen Telefonnummer in der richtigen Lifecycle Stage sieht, schließt er schneller ab.

📊

ROI Rechnung: Ein Sales-Mitarbeiter kostet dich ca. 60€ pro Stunde. Wenn er täglich 30 Minuten mit der Suche nach richtigen Kontaktdaten verbringt, sind das 650€ pro Monat, verschwendet. Bei 5 Vertrieblern sind das 3.250€ monatlich. Die CRM-Investition in saubere Daten zahlt sich innerhalb von 2-3 Monaten zurück.

Praxis: Wie wir 12.000 Kontakte bei einem Kunden bereinigt haben

Anfang 2026 kam ein SaaS-Unternehmen aus München zu uns. 12.341 Kontakte in HubSpot, gewachsen über 4 Jahre aus Messebesuchen, Webinar-Anmeldungen, Website-Formularen und drei verschiedenen CSV-Importen. Das Marketing-Team beschwerte sich über niedrige E-Mail-Raten, der Vertrieb über falsche Kontaktdaten.

Die Diagnose: 1.100 erkannte Duplikate (HubSpot-Standard), weitere 340 durch Breeze AI erkannt. 2.800 Kontakte ohne Telefonnummer. 1.900 ohne Unternehmenszuordnung. 430 mit ungültigen E-Mail-Adressen. Lifecycle Stages bei 40% der Kontakte nicht gesetzt.

Der Prozess (insgesamt 14 Arbeitstage):

  • Tag 1-2: Bestandsaufnahme und Property-Standards definieren. Wir haben 11 Properties mit Validierungsregeln versehen und 3 neue Dropdown-Properties angelegt
  • Tag 3-4: Operations Hub Workflows eingerichtet: Format-Standardisierung, Telefonnummern-Normalisierung, Lifecycle Stage Logik
  • Tag 5-8: Duplikate zusammenführen. 1.440 Paare, davon 890 automatisch gemergt (hohe Konfidenz), 550 manuell geprüft
  • Tag 9-11: Breeze Enrichment aktiviert und leere Felder aufgefüllt. 1.600 Telefonnummern und 2.100 Jobtitel ergänzt
  • Tag 12-14: Qualitätskontrolle, Dashboard aufgesetzt, Team geschult

Das Ergebnis nach 3 Monaten: E-Mail-Öffnungsrate von 16% auf 24%. Bounce Rate von 5,1% auf 0,6%. Der Vertrieb hat im ersten Quartal nach der Bereinigung 23% mehr Calls gebucht, weil die Telefonnummern endlich stimmten. Na ja, und das Marketing-Team hat zum ersten Mal aussagekräftige Reports bekommen, weil Lifecycle Stages und Quellen korrekt waren.

Daten bereinigen lassen?

Wir analysieren dein HubSpot Portal und zeigen dir, wo die größten Datenqualitätsprobleme liegen.

Jetzt beraten lassen

Fazit: Datenbereinigung ist kein Luxus, sondern Pflicht

Wenn du HubSpot ernsthaft als CRM-System nutzen willst, kommst du an sauberen Daten nicht vorbei. Die gute Nachricht: Mit Breeze AI und Operations Hub hast du Werkzeuge, die den Großteil der Arbeit automatisieren. Die schlechte Nachricht: Du musst einmal den Aufwand investieren, deine Datenbank grundlegend aufzuräumen.

📊

Unser Rat: Starte mit einem HubSpot Audit. Wir schauen uns an, wie schlimm es wirklich ist, definieren die Bereinigungsstrategie und setzen die Automationen auf, damit es sauber bleibt. Das Onboarding neuer Daten wird dadurch ebenfalls standardisiert. Der typische Zeitaufwand für ein Bereinigungsprojekt liegt bei 5-15 Tagen, abhängig von der Datenbankgröße. Danach läuft die Qualitätssicherung automatisch.

Häufige Fragen zur Datenbereinigung mit KI in HubSpot

Was kostet die KI-Datenbereinigung in HubSpot?

Die KI-Features für Datenbereinigung sind ab Operations Hub Professional (792€/Monat) verfügbar. Breeze Data Enrichment ist als Add-on buchbar. Die Grundfunktionen zur Duplikat-Erkennung gibt es bereits im kostenlosen CRM, allerdings ohne KI-gestütztes Fuzzy Matching.

Kann Breeze AI automatisch Duplikate zusammenführen?

Breeze erkennt Duplikate und schlägt das Zusammenführen vor. Vollautomatisches Merging ist bei hoher Konfidenz möglich, aber wir empfehlen immer eine manuelle Prüfung bei mittlerer und niedriger Konfidenz. Die False-Positive-Rate liegt bei 3-7%.

Wie lange dauert eine Datenbereinigung in HubSpot?

Das hängt von der Datenbankgröße ab. Bei 5.000 Kontakten rechne mit 3-5 Tagen, bei 10.000-20.000 Kontakten mit 8-15 Tagen. Davon entfällt der größte Teil auf die manuelle Prüfung von Duplikaten und das Einrichten der Automatisierungen.

Brauche ich Operations Hub für die Datenbereinigung?

Für die Grundfunktionen (manuelle Duplikat-Erkennung, Standard-Properties) nicht. Für automatisierte Format-Standardisierung, Data Quality Workflows und programmierbare Automationen brauchst du Operations Hub Professional. Das ist die sinnvollste Investition für langfristige Datenqualität.

Wie verhindere ich, dass neue Daten wieder unsauber werden?

Mit Operations Hub Workflows, die bei jedem neuen Kontakt automatisch greifen: Format-Standardisierung, Pflichtfeld-Prüfung und Duplikat-Check beim Import. Zusätzlich empfehlen wir klare Import-Richtlinien und Validierungsregeln auf Formular-Ebene.

Funktioniert Breeze Data Enrichment auch bei deutschen Kontakten?

Ja, aber die Trefferquote ist bei deutschen Kontakten niedriger als bei US-amerikanischen. Erfahrungsgemäß werden bei DACH-Kontakten 40-60% der fehlenden Felder korrekt ergänzt. Bei englischsprachigen Kontakten liegt die Quote bei 60-80%.

Was passiert mit den Aktivitäten beim Zusammenführen von Duplikaten?

HubSpot überträgt alle Aktivitäten (E-Mails, Calls, Notes, Meetings, Tasks) vom gelöschten auf den verbleibenden Kontakt. Deals, Tickets und Zugehörigkeiten werden ebenfalls übernommen. Allerdings werden die Timeline-Einträge chronologisch zusammengeführt, was bei vielen Aktivitäten anfangs unübersichtlich wirken kann.

Kann ich die Datenbereinigung auch selbst durchführen?

Grundsätzlich ja. HubSpot bietet alle Werkzeuge in der Oberfläche. Für die einmalige Grundbereinigung empfehlen wir aber professionelle Unterstützung, weil die Reihenfolge und die Konfiguration der Automationen entscheidend sind. Falsch zusammengeführte Duplikate lassen sich nicht rückgängig machen.