Sprachmodelle
Ein Sprachmodell ist ein mathematisches Modell, das die Abfolge von Elementen in einer Sequenz (wie Buchstaben oder Wörtern in natürlichsprachlichen Texten) modelliert, meist in Form eines stochastischen Prozesses. Diese Modelle spielen eine zentrale Rolle in der modernen Computerlinguistik und sind entscheidende Komponenten für Anwendungen wie Textgenerierung, maschinelle Übersetzung und Spracherkennung.
Sprachmodelle basieren auf statistischen Modellen, die Muster in Text- oder Sprachdaten erkennen und diese Muster verwenden, um zukünftige Texte oder Sprachdaten vorherzusagen. Sie treffen typischerweise Voraussagen darüber, wie wahrscheinlich es ist, dass ein bestimmtes Wort auf einen Teil-Satz folgt. Beispielsweise würde ein gut trainiertes Modell dem Wort „Koffer“ eine höhere Wahrscheinlichkeit zuweisen als dem Wort „Flugzeug“, wenn der Satz-Anfang „Ich packe meinen“ lautet.
Für die Funktionsweise von Sprachmodellen ist Natural Language Processing (NLP) entscheidend. NLP ermöglicht es der Künstlichen Intelligenz, einzelne Wörter zu verstehen und ist ein wesentlicher Bestandteil jedes Sprachmodells. Die spezielle Architektur des Neuronennetzwerks bei Sprachmodellen wird als Transformer bezeichnet, wobei es unterschiedliche Transformer-Typen gibt, die Sprache unterschiedlich verarbeiten.
Zu den bekanntesten Sprachmodellen gehören GPT (Generative Pre-trained Transformer) von OpenAI, das besonders stark in der Texterstellung ist, und BERT (Bidirectional Encoder Representations from Transformers), das von Google entwickelt wurde und besonders gut darin ist, komplexe Zusammenhänge zu verstehen. Weitere bekannte Modelle sind Gemini von Google, PaLM, Vicuna 33B und viele andere.
Besonders hervorzuheben sind die Large Language Models (LLMs), also die großen Sprachmodelle, die aus mehreren Milliarden Parametern bestehen. Sie können komplexe Texte und Zusammenhänge verstehen und werden in verschiedenen Bereichen eingesetzt, darunter Content-Erstellung, Kundensupport, Textanalyse, Übersetzungen und Programmierung.
Sprachmodelle haben durch das Aufkommen von Generativer Künstlicher Intelligenz große Bekanntheit gewonnen. So ist auch das ChatGPT zugrunde liegende GPT ein Sprachmodell, das mittlerweile in vielen Bereichen des täglichen Lebens und in Unternehmen zum Einsatz kommt.
« Zurück zum Glossary Index