Zeenea - Data Innovation Summit 2022

Was ist ein Knowledge Graph und wie stärkt er die Funktionsfähigkeit eines Data Catalogs?

November 4, 2020
November 4, 2020
04 November 2020

Schon seit einigen Jahren hören wir immer wieder den Begriff Knowledge Graph. Sei es beim personalisierten Einkaufserlebnis durch Online-Empfehlungen auf Websites wie Amazon, Zalando usw., oder auf unserer bevorzugten Suchmaschine Google.

Allerdings stellt dieses Konzept für die meisten Datenverantwortlichen wie auch bei vielen Datenanalysen nach wie vor eine Herausforderung dar, wenn versucht wird, die Assets zu aggregieren und zu verknüpfen, um wie die Internet-Riesen davon profitieren zu können.

Zur Untermauerung dieser Erkenntnis hat Gartner in seinem Artikel „How to Build Knowledge Graphs That Enable AI-Driven Enterprise Applications“ (Wie werden Knowledge Graphs erstellt, die KI-basierte Unternehmensanwendungen ermöglichen) erklärt, dass « Data and analytics leaders are encountering increased hype around knowledge graphs, but struggle to find meaningful use cases that can secure business buy-in ».

In diesem Artikel erläutern wir anhand eines Beispiels von Google das Konzept des Knowledge Graph. Anschließend nehmen wir sein in Datenkatalogen nutzbares Potenzial unter die Lupe.

Was ist ein Knowledge Graph genau?

Laut GitHub ist ein Knowledge Graph eine Art von Ontologie, die Kenntnisse in Bezug auf Einheiten und ihre gegenseitigen Beziehungen auf dynamische und automatisierte Weise beschreibt, im Gegensatz zu statischen Ontologien, die nur schwierig gepflegt werden können.

Hier folgen noch weitere von verschiedenen Fachleuten vorgeschlagene Definitionen von Knowledge Graph:

  • Ein „Instrument zur Speicherung und Verwendung der Daten, sodass Personen und Maschinen die Verbindungen in Datensätzen besser nutzen können“. (Datanami)
  • Eine „Datenbank, in der Informationen in einem grafischen Format gespeichert werden und die vor allem zur Erstellung einer grafischen Präsentation der Beziehungen zwischen sämtlichen Datenpunkten herangezogen werden kann“. (Forbes)
  • „Lexika der semantischen Welt“. (Forbes)

Dank Machine-Learning-Algorithmen stellt ein Knowledge Graph eine Struktur für alle Ihre Daten bereit und macht es möglich, multilaterale Beziehungen in Ihren gesamten Datenquellen anzulegen.

Die Durchgängigkeit dieser Struktur erweitert sich schrittweise mit der Ergänzung neuer Daten, womit weitere Beziehungen geschaffen werden und zusätzlicher Kontext hinzugefügt wird. Das unterstützt Ihre Datenteams, Entscheidungen zu treffen, denen sonst vielleicht niemals gefundene Beziehungen zugrunde liegen.

Die Idee eines Knowledge Graph besteht darin, ein Objektnetz zu konstruieren bzw. – was noch wichtiger ist – semantische oder funktionelle Beziehungen zwischen verschiedenen Assets herzustellen.

In einem Datenkatalog stellt ein Knowledge Graph somit verschiedene Konzepte dar und verbindet die Objekte miteinander über semantische oder statische Beziehungen.

 

Beispiel Google

Der Algorithmus von Google greift auf dieses System zurück, um für Endnutzer relevante Informationen für die Suche einzuholen und bereitzustellen. Der Knowledge Graph von Google umfasst über 500 Millionen Objekte sowie mehr als 3,5 Mrd. Fakten zu verschiedenen Objekten und zu Beziehungen zwischen diesen Objekten.

Er verbessert Suchen über Google vor allem in dreifacher Hinsicht:

  • Finden guter Ergebnisse: Eine Suche, die nicht nur auf Stichwörtern, sondern auch auf deren Bedeutung beruht.
  • Bester Überblick: Einholung der relevantesten Informationen aus verschiedenen Quellen, je nach Absicht des Nutzers.
  • Vertiefung und Erweiterung der Suche: Dank relevanter Vorschläge erfahren Sie mehr als erwartet.
knowledge-graph

 

Wie stärken Knowledge Graphs die Nutzung von Data Catalogs?

Anhand eines Data Catalogs können Knowledge Graphs Ihr Unternehmen in seiner Datenstrategie wie folgt unterstützen:

Umfassende und tiefgreifende Suchergebnisse

Heutzutage nutzen zahlreiche Suchmaschinen mehrere Knowledge Graphs, um eine Suche durchzuführen, die über Stichwörter hinausgeht. Mit Knowledge Graphs können Suchmaschinen Konzepte, Einheiten und die gegenseitigen Beziehungen verstehen. Daraus ergeben sich folgende Vorteile:

  • Möglichkeit, tiefgreifendere und relevantere Ergebnisse zu liefern –einschließlich der Fakten und Beziehungen – anstelle einfacher Dokumente,
  • Möglichkeit, Suchen in Form von Fragen oder Sätzen zu formulieren, anstatt einer Eingabe von Stichwörtern,
  • Fähigkeit, komplexe Suchen zu verstehen, die sich auf Kenntnisse, wie sie in verschiedenen Elementen gefunden wurden, beziehen, indem die im Graph definierten Beziehungen genutzt werden.

Optimierung der Data Discovery

Unternehmensdaten können in Lichtgeschwindigkeit von einer Stelle zur anderen übertragen und in verschiedenen Datenquellen und Speicheranwendungen gespeichert werden. Mitarbeitern und Partnern ist es so möglich, jederzeit und überall auf die Daten zuzugreifen. Die Identifizierung, Lokalisierung und Klassifizierung Ihrer Daten zu ihrem Schutz und zur Informationsbeschaffung sollten daher eine Priorität darstellen!

Zu einigen der Vorteile von Knowledge Graphs für die Data Discovery zählen unter anderem:

  • Ein besseres Verständnis der Unternehmensdaten – wo sie sich befinden, wer auf sie zugreifen kann und wie sie übertragen werden können,
  • Automatische Klassifizierung der Daten je nach Kontext,
  • Risikomanagement und Einhaltung der Regeln,
  • Komplette Datentransparenz,
  • Identifizierung, Klassifizierung und Überwachung sensibler Daten,
  • Die Möglichkeit, Datenschutzkontrollen in Echtzeit auf der Grundlage vordefinierter Richtlinien und Kontextfaktoren anzuwenden,
  • Korrekte Bewertung aller Daten.

Das hilft einerseits bei der Einführung geeigneter Sicherheitsmaßnahmen, um den Verlust sensibler Daten zu verhindern und verheerende finanzielle und rufschädigende Folgen für das Unternehmen abzuwenden. Andererseits haben Ihre Teams mithilfe von Data Discovery die Möglichkeit, den Kontext der Daten genauer zu erkunden, um spezifische Elemente zu identifizieren, die Antworten liefern sowie Möglichkeiten und Wege zu finden, Ihre Fragen zu beantworten.

 

Relevante Empfehlungen

Wie eingangs erwähnt, stellen Empfehlungen darüber hinaus ein vertrautes Angebot zahlreicher Online-Shops, persönlicher Assistenten und digitaler Plattformen dar.

Empfehlungen müssen sich auf den Inhalt stützen. In einem Data Catalog können die Machine-Learning-Funktionen in Kombination mit einem Knowledge Graph bestimmte Datentypen erkennen und Tags oder statistische Regeln auf die Daten anwenden, um effiziente, intelligente Informationsvorschläge zu liefern.

Diese Funktion heißt auch „data pattern recognition“ (Datenmusterkennung). Sie kann ähnliche Assets identifizieren wie auch auf statistische Algorithmen und ML-Funktionen zurückgreifen, die aus anderen Systemen stammen.

Dieses System der Datenmustererkennung hilft Datenverantwortlichen dabei, Metadaten zu verwalten, um:

  • Datendubletten zu identifizieren und Metadaten zu kopieren,
  • logische Daten zu erkennen (E-Mails, Ort, Adresse, usw.)
  • Attributwerte vorzuschlagen (Erkennung von Dokumentationsmodelle zur Anwendung auf ein ähnliches oder neues Objekt),
  • Verknüpfungen vorzuschlagen – semantische oder Lineage-Verknüpfungen,
  • mögliche Fehler zu erkennen und um damit Qualität und Relevanz des Katalogs zu verbessern.

Die Idee besteht darin, bestimmte, aus Empfehlungen abgeleitete Techniken zu nutzen, die auf in Standard-Nutzungskatalogen enthaltenen Inhalten beruhen. Hat der Nutzer etwas gefunden hat, schlägt der Katalog auch Alternativen vor, die sowohl auf dem Nutzerprofil als auch der Mustererkennung beruhen.

 

Bestimmte Einsatzmöglichkeiten eines Data Catalogs mithilfe eines Knowledge Graph

 

  • Erfassung der Assets, die für digitale Projekte herangezogen oder mit deren Scheitern verknüpft waren.
  • Suche nach Assets von gemeinsamem Interesse für die Einführung neuer Produkte für die Marketing-Abteilung.
  • Erstellung einer Rundum-Ansicht von Personen und Unternehmen für kommerzielle Zwecke.
  • Abgleichen der Unternehmensanforderungen mit Personen und Projekten im HR-Bereich.
  • Auffinden von Regelungen in Bezug auf spezifische Verträge und Investitionen in der Finanzabteilung.

 

Schlussfolgerung

Aufgrund des steten Zuwachses an Daten in Unternehmen würde eine strategielose Organisation der Informationen einen Verlust der Wettbewerbsfähigkeit und Relevanz im Zuge der Digitalisierung nach sich ziehen. Um diesen nachteiligen Effekt einer „Blackbox“ zu verhindern, ist es entscheidend, darauf zu achten, dass Ihr Data Catalog einen Knowledge Graph für Unternehmen enthält.

Mit einem Knowledge Graph in Kombination mit KI und Machine-Learning-Algorithmen werden Ihre Daten besser kontextualisiert. Damit können Sie nicht nur tiefgreifendere und feinere Daten erhalten, sondern auch langfristig intelligentere Entscheidungen treffen.

Für weitere Informationen zum Thema Knowledge Graph lesen Sie hier einen sehr interessanten Artikel des BARC-Analysten Timm Grosser: Linked Data for Analytics?

 

Starten Sie jetzt mit dem Zeenea Data Catalog

Zeenea ist eine zu 100 % cloudfähige Lösung, die mit wenigen Klicks weltweit verfügbar ist. Mit einer Entscheidung für den Zeenea Data Catalog bekommen Sie die Kosten, die für die Implementierung und Pflege eines Datenkatalogs entstehen, ganz leicht in den Griff und können gleichzeitig den Zugriff Ihrer Teams auf Ihre Daten vereinfachen.

Dank der automatischen Einspeisungsmechanismen wie auch der Algorithmen für Vorschläge und Korrekturen können die Gesamtkosten des Katalogs gesenkt und zugleich die Qualität der darin enthaltenen Informationen in Rekordzeit garantiert werden.

zeenea logo

At Zeenea, we work hard to create a data fluent world by providing our customers with the tools and services that allow enterprises to be data driven.

zeenea logo

Chez Zeenea, notre objectif est de créer un monde “data fluent” en proposant à nos clients une plateforme et des services permettant aux entreprises de devenir data-driven.

zeenea logo

Das Ziel von Zeenea ist es, unsere Kunden "data-fluent" zu machen, indem wir ihnen eine Plattform und Dienstleistungen bieten, die ihnen datengetriebenes Arbeiten ermöglichen.

Related posts

Articles similaires

Ähnliche Artikel

Be(come) data fluent

Read the latest trends on big data, data cataloging, data governance and more on Zeenea’s data blog.

Join our community by signing up to our newsletter!

Devenez Data Fluent

Découvrez les dernières tendances en matière de big data, data management, de gouvernance des données et plus encore sur le blog de Zeenea.

Rejoignez notre communauté en vous inscrivant à notre newsletter !

Werden Sie Data Fluent

Entdecken Sie die neuesten Trends rund um die Themen Big Data, Datenmanagement, Data Governance und vieles mehr im Zeenea-Blog.

Melden Sie sich zu unserem Newsletter an und werden Sie Teil unserer Community!

Let's get started
Make data meaningful & discoverable for your teams
Learn more >

Los Geht’s!

Geben Sie Ihren Daten einen Sinn

Mehr erfahren >

Démarrez maintenant
Donnez du sens à votre patrimoine de données
En savoir plus >