Worin besteht der Unterschied zwischen NLP und NLU?

Ihnen ist der Unterschied zwischen NLP (Natural Language Processing) und NLU (Natural Language Understanding) nicht klar? Gestatten Sie uns, Sie aufzuklären.

1 März 2022

KI: Worin besteht der Unterschied zwischen NLP und NLU?

 

Obwohl sie sich nur durch einen kleinen Buchstaben voneinander unterscheiden, handelt es sich bei NLP (Natural Language Processing) und NLU (Natural Language Understanding) um unterschiedliche Begriffe, die sich dennoch durch Texterkennung und Wortverständnis ergänzen.

Es ist leicht verständlich, warum das Verstehen natürlicher Sprache eine äußerst wichtige Herausforderung für Unternehmen darstellt, die intelligente Roboter zur Kommunikation mit ihren Kunden verwenden möchten.

Der Begriff NLP, zu Deutsch „Computerlinguistik“ (CL) oder „Linguistische Datenverarbeitung“ (LDV), taucht zuerst in den 60er Jahren auf.  Das Ziel besteht darin, Maschinen in die Lage zu versetzen, in natürlicher Sprache formalisierte Informationen zu erfassen und zu verarbeiten.

 

NLU – NLP: der Unterschied

 

Um zu funktionieren und eine reibungslose Interaktion mit uns anbieten zu können, müssen Maschinen mithilfe der linguistischen Datenverarbeitung (LDV), das sogenannte Natural Language processing (NLP), in die Lage versetzt werden, zu lernen.

DAS NLP – Die Verarbeitung natürlicher Sprache

Beim NLP bzw. „Natural Language Processing“ handelt es sich um ein Bündel von Texterkennungslösungen, das es ermöglicht, von Benutzern formulierte Wörter und Sätze zu verstehen.

Ziel: Ein Bedürfnis, das von einem Menschen auf natürliche Weise geäußert wird, zu analysieren und zu verstehen und darauf reagieren zu können.

Das NLP umfasst alle Technologien, die den „plain text“ (dt. einfacher Text) als Eingabe annehmen und daraus ein erwartetes Ergebnis ableiten (z. B. „Natural Language Understanding“, Zusammenfassung oder Übersetzung). Konkret ermöglicht das NLP, zu verstehen, was der Mensch sagt, die in der Nachricht enthaltenen Daten zu verarbeiten und eine Antwort in natürlicher Sprache auf sie zu geben.

 

Das NLU – eine Unterkomponente des NLP

 

Das Natural Language Understanding (NLU) besteht darin, einen geschriebenen oder in natürlicher Sprache formulierten Text zu analysieren und dessen Absichten zu verstehen.  Es handelt sich somit um eine Unterkomponente des NLP.

Das NLP interpretiert wörtlich, was der Kunde sagt oder schreibt, während das NLU die Absichten und die tiefere Bedeutung identifiziert.

Ein NLU ist ein Algorithmus, den man darauf trainiert, Informationen bzw. „Eingaben“ nach „semantische Datenklassen“ zu kategorisieren. Das mithilfe neuronaler Netze fertiggestellte Modell ist somit in der Lage zu bestimmen, ob ein Element X zur Klasse Y oder zu einer anderen Klasse Z gehört usw.

„Ich möchte mich mit Amazon in Verbindung setzen. Wissen Sie, wie die Nummer lautet?“ Das NLU wird verstehen, dass die Person den Kundendienst des Technologieunternehmen erreichen möchte.

„Wo befindet sich der Amazonaswald?“ Das NLU wird die unterschiedliche Absicht im Vergleich zum vorherigen Satz verstehen. Wir sprechen hier über den Regenwald und nicht um das Technologieunternehmen.

Die NLU ist zudem in der Lage, Einheiten zu erkennen, d. h. Wörter und Ausdrücke, die, wenn sie in der Benutzeranfrage (Input) erkannt werden, den Gesprächsverlauf beeinflussen können.

In unserem Beispiel von Amazon lautet der Input wie folgt: Wo + Amazonas + Wald

 

Absicht und Einheit

 

Das Verständnis der natürlichen Sprache beruht somit auf zwei zentralen Informationen: der Absicht und der Einheit.

Die Absicht ermöglicht das Verständnis der vom Benutzer ausgesandten Nachricht. Diese ist durch eine typische syntaktische Struktur gekennzeichnet, welche sich in den meisten Inputs wiederfindet, die demselben Betreff entsprechen.

Die Einheit ist eine in der Anfrage des Nutzers enthaltene Information, die für das Verständnis seines Betreffs relevant ist und durch typische kurze Wörter und Ausdrücke gekennzeichnet wird. Letztere sind wiederum in einer großen Anzahl von Inputs zu finden, die demselben Betreff entsprechen.

  • Die automatische Zusammenfassung von Dialogen
  • Die automatische Übersetzung

Der durch künstliche Intelligenz gefütterte Callbot wird daher dank des NLU ein weiterentwickeltes Verständnis von natürlicher Sprache entwickeln.  Wenn dieses nicht präzise genug sein sollte, ist ein punktueller menschlicher Eingriff möglich, beispielsweise durch die Nutzung einer Plattform zur Erstellung von Low-Code-Gesprächsagenten.

 

NLU – NLP und die Spracherkennung

 

Die Spracherkennung ist kein neues Thema: Historisch betrachtet bestand das erste Ziel der Spracherkennung in der genauen Erkennung von zehn Ziffern, die mithilfe eines verdrahteten Geräts übermittelt wurden (Davis et al., 1952). Ab 1960 werden numerische Methoden eingeführt, die die Erkennung einzelner Sprachelemente (z. B. wenn Sie am Telefon aufgefordert werden, 1, 2 oder 3 zu sagen) effizient verbessern werden. Dennoch wird es sehr lange dauern, bis man sich mit der „kontinuierlichen“ Sprache befasst, die noch lange Zeit sehr komplex bleiben wird (Haton et al., 2006).

 

Wie beim Lesenlernen, bei dem man zunächst das Alphabet, dann Laute und schließlich Wörter lernt, hat sich auch die Transkription der gesprochenen Sprache mit der Zeit und der Technologie weiterentwickelt.

Vom Einfachen zum Komplexen:

  • Erkennung einzelner Wörter,
  • Erkennung aufeinanderfolgender Wörter: eine einzige Person spricht
  • Koartikulation: Wie ein Phonem* ein anderes beeinflussen kann, wie beispielsweise bei „Lacht sie?“.
  • Die Berücksichtigung störender Elemente: kontinuierliches Sprechen oder auch die Unterschiedlichkeit der Gesprächspartner, die durch den Fortschritt des maschinellen Lernens ermöglicht wurde.

 

ASR oder Automatic Speech Recognition

 

Bei der Bearbeitung von Sprachinteraktionen muss ein System definiert werden, das eine Sprachinteraktion in Echtzeit transkribiert.

Dieser Schritt der Transkription erfolgt zusammen mit den Schritten der Analyse und des Verstehens.

Die Transkription verwendet Algorithmen zur Automatic Speech Recognition (ASR), die in Echtzeit eine schriftliche Version des Gesprächs erstellen.

Einfach ausgedrückt, können Sie die ASR als eine Spracherkennungssoftware betrachten, die es einer Person ermöglicht, eine Sprachanfrage zu tätigen.

Sie wandelt diese Anfrage dann in einen geschriebenen Text um. Der Kontext jedes Wortes wird von der ASR analysiert, um das richtige Wort unter all seinen Homonymen zu erkennen. Wenn man das Wort „Amazon“ ausspricht, meint man dann das Unternehmen oder den Wald? Es ist natürlich der Kontext des Satzes, eine eine optimale Interpretation ermöglichen wird. Und an dieser Stelle kommt die KI ins Spiel, um die wahre Bedeutung der Frage in Abhängigkeit vom Kontext zu ermitteln.

Entdecken Sie das Zaion Lab icon image