Data & sources

Was macht es so komplex, verschiedene Daten zu kombinieren?

Why is Combining Data from Multiple Sources so Challenging?

Irene

Feb 18, 2025

Was macht es so komplex, verschiedene Daten zu kombinieren?

Wir alle kennen das: Um datengestützte Entscheidungen zu treffen, reicht es häufig nicht aus, sich nur eine einzelne Informationsquelle anzuschauen. Oft entstehen wirklich neue Erkenntnisse erst daraus, dass man mehrere Informationen miteinander kombiniert.

Ob es um die Zusammenführung von Vertriebszahlen aus verschiedenen Abteilungen geht, um das Sammeln von Kundenfeedback von mehreren Kanälen oder einfach um die Finanzdaten aus verschiedenen Konten — Daten zu kombinieren, kann nervig sein. Vor allem für Business User fühlt sich dieser Prozess oft an, als würde man ohne Karte durch ein Labyrinth navigieren. Aber was macht es so knifflig und zeitaufwendig?

1. Inkonsistente Daten

Ein typisches Problem bei der Kombination von Daten aus verschiedenen Quellen ist die Inkonsistenz. Die Daten können in unterschiedlichen Formaten gespeichert sein, unterschiedliche Konventionen verwenden oder verschieden detailliert sein. In einem System kann der Name eines Kunden beispielsweise als “Max Mustermann” aufgeführt sein, während er in einem anderen als “Mustermann, Max” gespeichert ist. Wenn Du mit Datenbanken nicht vertraut bist, kann es frustrierend sein, diese Unterschiede zu erkennen und zu lösen.

Eine weitere häufige Inkonsistenz sind z. B. Datumsformate. Ein Datensatz verwendet vielleicht “TT.MM.JJJJ”, während ein anderer “JJJJ-MM-TT” verwendet. Diese kleinen Unterschiede können bei der Zusammenführung von Daten erhebliche Probleme verursachen.

2. Datensilos

In vielen Unternehmen werden Daten in ‘Silos’ aufbewahrt: Das bedeutet, dass verschiedene Abteilungen oder Teams ihre eigenen Systeme und Prozesse für die Speicherung von Informationen haben. Ein Marketingteam verwendet vielleicht eine Software für die Verwaltung von Kundenbeziehungen, während das Vertriebsteam eine andere verwendet. Wenn es hilfreich wäre, diese Daten zusammenzuführen, stellt Ihr möglicherweise fest, dass diese Systeme nicht ohne weiteres miteinander “sprechen”.

Für viele Teammitglieder kann das Handling dieser Daten entsprechend frustrierend und zeitaufwendig sein, vor allem, wenn man mit den dafür erforderlichen Tools nicht vertraut ist.

3. Fehlende Standardisierung

Selbst wenn die Daten zugänglich sind, kann die fehlende Standardisierung über verschiedene Quellen hinweg die Kombination der Daten zu einem Albtraum machen. Verschiedene Abteilungen haben möglicherweise ihre eigene Art, Daten zu kategorisieren und aufzuzeichnen. So kann ein Team beispielsweise den Umsatz nach Produktlinie erfassen, während ein anderes die Daten nach Region erfasst. Der Versuch, diese Datensätze zu einem kohärenten Ganzen zusammenzufügen, ohne Data Scientist zu sein, kann wie der Versuch sein, Teile unterschiedlicher Puzzles zusammenzusetzen. Diese fehlende Standardisierung erfordert oft manuelle Eingriffe, um die Daten abzugleichen, was sowohl zeitaufwendig als auch fehleranfällig ist.

4. Komplexe Tools & Software

Selbst mit den richtigen Daten und einer gewissen Standardisierung können die Tools, die zur Kombination und Analyse größerer Datenmengen verwendet werden, für einige Teammitglieder einschüchternd wirken. Programme wie SQL, Python oder auch “nur” fortgeschrittene Excel-Funktionen erfordern ein gewisses Maß an technischen Kenntnissen. Ohne diese Kenntnisse fühlen sich die Benutzer möglicherweise überfordert und können die Aufgabe nicht effizient erledigen.

Diese Komplexität kann dazu führen, dass man auf technische Teams angewiesen ist, was in vielen Firmen zu Verzögerungen und Engpässen führt. Business User stecken oft fest zwischen Supportanfragen, dem Warten auf Antworten oder dem Versuch, die Tools nebenbei selbst zu erlernen — all das kann den Prozess erheblich verlangsamen.

5. Datensicherheit & -schutz

Beim Umgang mit Daten, insbesondere mit sensiblen oder persönlichen Informationen, kommen zudem noch Sicherheits- und Datenschutzbedenken ins Spiel. Das Kombinieren von Daten aus verschiedenen Quellen bedeutet oft, dass sie zwischen Systemen übertragen werden, was zu potenziellen Verstößen führen könnte.

Für viele Nutzer kann es verwirrend sein, sich in den Datenschutzrichtlinien oder der DSGVO zurechtzufinden. Die Angst, Fehler zu machen, die die Datensicherheit gefährden könnten, sorgt für zusätzlichen Stress und macht den gesamten Prozess noch zäher.

Fazit: Und jetzt?

Das Kombinieren von Daten aus verschiedenen Quellen ist eine Aufgabe, die sorgfältige Überlegungen, Liebe zum Detail und oft auch technisches Know-how erfordert. Für nicht-technische Benutzer kann dieser Prozess aufgrund von Dateninkonsistenzen, Silos, mangelnder Standardisierung, komplexen Tools und Sicherheitsbedenken eine besondere Herausforderung darstellen.

Auch wenn diese Herausforderungen da sind, gibt es Lösungen. Benutzerfreundliche Tools für die Datenintegration und -kombination werden immer gängiger (z. B. DataMonkey ;) ), und viele Unternehmen erkennen zunehmend die Notwendigkeit eines einfachen, alltäglichen Datenzugriffs für alle im Unternehmen — nicht nur für Tech-Experten. Mit der passenden Unterstützung und den richtigen Ressourcen lassen sich die Herausforderungen gut lösen, so dass jeder die Daten und Informationen, die dem Unternehmen zur Verfügung stehen, optimal für seine täglichen Entscheidungen nutzen kann.