Entity Text Extractor — ein Gemini Gem 💎

Der „Semantic Entity Architect“ ist ein KI-gestützter Gemini Gem zur semantischen Analyse und visuellen Strukturierung von Rohtexten. Automatisch wird ein valides Schema.org JSON-LD Skript auf Basis aller vorhandenen Entitäten generiert.

Entity Text Extractor — ein Gemini Gem 💎

Um diesen Prozess zu automatisieren, habe ich einen maßgeschneiderten Gemini Gem 💎 entwickelt und ihn den „Semantic Entity Architect“ oder auch Entity Text Extractor genannt.

Inhaltsverzeichnis

Der Gemini Gem als Semantic Architect

Der Gemini Gem agiert als Semantic Architect, indem er Rohtexte analysiert, um Entitäten und deren Verbindungen zu extrahieren. Aus den extrahierten Daten generiert das kostenfreie SEO-Tool zwei primäre Ergebnisse:

  1. Einen Knowledge Graph zur Visualisierung der Entitätsbeziehungen
  2. Implementierbares Schema.org-Markup im JSON-LD-Format

kostenloser Zugriff auf den Gemini Gem

💡 Sie müssen in Gemini eingeloggt sein, damit sich der Gemini Gem in Ihrem Konto öffnet und aktiviert wird. Danach können Sie mit der Texteingabe und der Analyse beginnen. Hier finden Sie das How-To für den Gem.


Methodik des KI-Tools

Die Methodik des KI-Tools ist ein vierstufiger, automatisierter Prozess zur Umwandlung von Rohtext in strukturierte Daten.

  1. Entity Extraction & Provenance: Identifizierung und Strukturierung benannter Entitäten aus dem Text.
  2. Primary Identity Vector: Analyse und Gewichtung der semantischen Beziehungen zwischen den Entitäten.
  3. Visual Relationship Summary: Übersetzung der Entitätenbeziehungen in ein visuelles Format wie einen Knowledge Graph.
  4. Technical SEO Enhancement: Generierung von maschinenlesbarem Schema.org JSON-LD Code aus den extrahierten Daten.

1️⃣ Entity Extraction & Provenance

Entity Extraction & Provenance ist ein Prozess zur Identifizierung, Kategorisierung und Strukturierung benannter Entitäten aus unstrukturiertem Text. Dieser Schritt extrahiert spezifische Informationen wie Personen, Orte oder Organisationen und stellt deren Herkunft (Provenance) im Quelltext fest, um eine grundlegende Datenstruktur für die weitere Analyse zu schaffen.

2️⃣ Primary Identity Vector

Ein Primary Identity Vector ist eine datenstrukturierte Darstellung, die semantische Beziehungen zwischen Entitäten analysiert und gewichtet. Er beschreibt die Stärke und Art der Verbindung zwischen Entitäten durch definierte Beziehungsarten.

  • knowsAbout: Eine Entität hat Wissen über eine andere
  • worksFor: Eine Person arbeitet für eine Organisation
  • locatedIn: Eine Entität befindet sich an einem Ort

3️⃣ Visual Relationship Summary

Eine Visual Relationship Summary ist eine visuelle Darstellung, die komplexe Entitätenbeziehungen in ein strukturiertes Format übersetzt. Sie nutzt eine standardisierte Struktur, wie zum Beispiel Markdown-Ablaufdiagramme im Format [Entität A] -> [Beziehung] -> [Entität B], um einen Knowledge Graph abzubilden.

4️⃣ Technical SEO Enhancement (JSON-LD)

Technical SEO Enhancement durch JSON-LD bezeichnet den Prozess, extrahierte semantische Daten in maschinenlesbaren, strukturierten Code umzuwandeln. Dabei wird ein Schema.org JSON-LD Skript generiert, oft unter Verwendung der @graph-Logik, um komplexe Entitätsbeziehungen abzubilden. Dieser Code ermöglicht es Suchmaschinen, den Inhalt und die Zusammenhänge einer Webseite präziser zu verstehen, indem Entitäten und ihre Eigenschaften explizit deklariert werden.


Named Entity Recognition (NER)

Named Entity Recognition (NER) ist eine Kernkomponente von Large Language Models (LLMs) und eine Methode der Informationsgewinnung, die benannte Entitäten in unstrukturiertem Text identifiziert und kategorisiert.

Der Prozess dient dazu, Texte semantisch zu erfassen, indem er spezifische Informationen erkennt und klassifiziert. Typische Entitätskategorien sind: Personen, Organisationen, Orte, Marken, Daten und Zeitangaben, Fachbegriffe.

Jedes moderne Large Language Model (LLM) nutzt als Kernkomponente die sogenannte Named Entity Recognition (NER), um Texte semantisch zu erfassen und Entitäten sowie deren Zusammenhänge überhaupt erst zu verstehen.

Anstatt die KI als reinen Textgenerator einzusetzen, wird hier die native, analytische NER-Kompetenz isoliert abgerufen, um unstrukturierte Inhalte in strukturierte SEO-Daten und Wissensgraphen zu übersetzen.


How-To: Nutzung des Gemini Gems

Dieser Gemini Gem automatisiert die semantische Analyse von Texten und generiert fertige SEO-Strukturdaten. Für die Nutzung sind keine Prompting-Kenntnisse erforderlich.

  1. Texteingabe: Fügen Sie den zu analysierenden Rohtext in das vorgesehene Eingabefeld ein.
  2. Analyse starten: Initiieren Sie den Prozess per Knopfdruck.
  3. Ergebnisse erhalten: Das Tool generiert automatisch eine visuelle Zusammenfassung der Entitätenbeziehungen und ein fertiges JSON-LD Skript.

Schritt-für-Schritt-Anleitung

  1. Inhalt vorbereiten: Kopieren Sie den vollständigen Rohtext, den Sie analysieren möchten (z. B. einen neuen Blogartikel, eine Pressemitteilung, einen „Über uns“-Text oder eine Leistungsbeschreibung).
    • Hinweis: Übergeben Sie idealerweise immer nur einen thematisch zusammenhängenden Text pro Anfrage, um eine Vermischung von Kontexten im JSON-LD zu vermeiden.
  2. Text übergeben: Fügen Sie den kopierten Text einfach in das Eingabefeld des Gems ein und drücken Sie auf Senden. Sie müssen keine zusätzlichen Befehle (wie „Bitte analysiere…“ oder „Erstelle JSON-LD…“) dazuschreiben. Der Gem führt seine Instruktionen automatisch aus.
  3. Ergebnisse prüfen: Der Gem gibt nun exakt vier standardisierte Blöcke aus.
    • Kontrollieren Sie die Tabelle unter Entity Extraction & Provenance, ob alle für Sie wichtigen Akteure und Marken erkannt wurden.
    • Prüfen Sie im Visual Relationship Summary, ob die fachliche Logik Ihres Textes korrekt abgebildet ist.
  4. JSON-LD implementieren: Scrollen Sie zum vierten Abschnitt (Technical SEO Enhancement). Kopieren Sie den generierten Schema.org-Code (den JSON-LD-Block). Fügen Sie diesen Code in den Head-Bereich Ihrer HTML-Seite oder in das entsprechende Feld Ihres CMS (z. B. Yoast, RankMath, Custom Fields) ein.

Best Practices

  • Validierung: Auch wenn der Gemini Gem validen Code schreibt, empfiehlt es sich, das generierte Snippet vor dem Live-Gang kurz durch den offiziellen Schema Markup Validator (validator.schema.org) laufen zu lassen.
  • Iterationen: Fehlt eine wichtige Entität im Output? Sie können dem Gem im selben Chat einfach antworten: „Ergänzen Sie Entität X in der Analyse und updaten Sie den JSON-LD Code.

Troubleshooting (Fehlerbehebung)

Sollte der Gem einmal nicht das gewünschte Ergebnis liefern, helfen folgende Lösungsansätze.

  1. Textqualität prüfen: Stellen Sie sicher, dass der Eingabetext klar formuliert, frei von Tippfehlern und gut strukturiert ist. Mehrdeutigkeiten im Text können die Entitätserkennung erschweren.
  2. Eingabelänge anpassen: Bei sehr langen oder komplexen Texten kann eine Aufteilung in kürzere, thematisch fokussierte Abschnitte die Genauigkeit der Analyse verbessern.
  3. Prozess wiederholen: Aufgrund der probabilistischen Natur von LLMs kann ein erneuter Durchlauf zu einem besseren Ergebnis führen.
  • Wichtige Entitäten werden nicht erkannt
    • Ursache: Der Text ist möglicherweise zu kurz oder erwähnt die Entität komplett ohne Kontext (z. B. nur ein alleinstehendes Wort ohne Bezug).
      • Lösung: Erweitern Sie den Textauszug um ein bis zwei beschreibende Sätze oder weisen Sie den Gem direkt an: „Führen Sie die Analyse erneut durch und berücksichtigen Sie zwingend die Organisation [Name].“
  • Falsche Schema-Typen im JSON-LD (z. B. erfundene Personen)
    • Ursache: Der Text ist unpräzise formuliert, sodass die KI beispielsweise einen Produktnamen fälschlicherweise für eine Person hält.
      • Lösung: Der Gem verfügt über eine strikte Fallback-Logik, um dies zu vermeiden. Sollte es dennoch passieren, korrigieren Sie die KI im Chat: „Entfernen Sie das Person-Schema. [Name] ist ein Produkt. Generieren Sie den Code neu.“
  • Der Gem weicht vom Standard-Format ab
    • Ursache: Bei sehr langen Chat-Verläufen oder mehrfachen Rückfragen kann die KI ihre ursprüngliche Formatierungsanweisung (die 4 festen Schritte) aus den Augen verlieren.
      • Lösung: Starten Sie einfach einen neuen Chat mit dem Gem und fügen Sie Ihren Rohtext erneut ein, um die Analyse sauber zurückzusetzen.

Textbeispiel zum Testen des Gems

DataFlow Dynamics GmbH revolutioniert die Cloud-Datenanalyse im Mittelstand
Die DataFlow Dynamics GmbH aus München setzt neue Maßstäbe in der europäischen Cloud-Migration. Mit dem Release von NexusAnalytics 3.0 bietet das Softwareunternehmen nun eine vollumfängliche Lösung für Predictive Analytics, die speziell für den Mittelstand in der DACH-Region entwickelt wurde. Ein massiver Vorteil der neuen Plattform ist die nahtlose Integration in bestehende CRM-Systeme wie Salesforce, wodurch der ROI von Marketingkampagnen in Echtzeit gemessen und skaliert werden kann. Da alle Datenverarbeitungsprozesse auf lokalen Servern stattfinden, ist eine 100-prozentige DSGVO-Konformität für alle Kunden jederzeit garantiert.

Die zu erwartenden Ergebnisse des Textbeispiels:

  • NER: Der Semantic Entity Architect sollte „DataFlow Dynamics GmbH“ und „Salesforce“ (ORG), „NexusAnalytics 3.0“ (PROD), „München“ / „DACH-Region“ (LOC) sowie „Predictive Analytics“, „Cloud-Migration“, „ROI“ und „DSGVO-Konformität“ (CONCEPT) finden.
  • Beziehungen: Der Semantic Entity Architect sollte erkennen, dass DataFlow Dynamics das Produkt NexusAnalytics 3.0 herstellt und dass dieses Produkt wiederum mit Salesforce interagiert.
  • JSON-LD (Der wichtigste Test): Der Code sollte eine @graph-Struktur enthalten, in der eine Organization (DataFlow Dynamics) vorkommt, die vielleicht ein Product (NexusAnalytics) anbietet. Das Attribut areaServed sollte für die DACH-Region genutzt werden. Ein Person-Typ darf im Code nicht auftauchen.

Gehen Sie Ihrem ersten Impuls nach und teilen Sie Ihr Feedback mit mir ⬇️


SEO-Knowhow direkt vom Profi ✔

3 überzeugende Werte der DHEMANT Consulting GmbH

SEO Berater Rene Dhemant

Fundiert.

Handfeste und datenbasierte Handlungsempfehlungen statt Bauchgefühl oder lediglich angelesenem Buchwissen.

SEO Berater Rene Dhemant

Wirksam.

Die Steigerung Ihrer Wirtschaftlichkeit ist mein oberstes Ziel in der Suchmaschinenoptimierung.

SEO Berater Rene Dhemant

Nachhaltig.

Wachstumsstrategien werden erarbeitet und sorgen für mehr qualifizierte Besucher, die auch in die Handlung kommen.