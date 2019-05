Mit dem »GPT-2« hat die Nonprofit-Forschungseinrichtung OpenAI einen Algorithmus entwickelt, der im Stande ist, Sätze oder Texte zu analysieren und zu vervollständigen. Der GPT-2 basiert auf dem Prinzip des maschinellen Lernens.

Normalerweise sind die Forschungsergebnisse und Codes von OpenAI Open Source, doch nicht dieses Mal.



Aufgrund des Verdachts, man könnte den GPT-2 etwa dazu verwenden, Fake News und Spam zu verbreiten, wurde diesmal nur eine abgespeckte Variante des Modells an die Öffentlichkeit gebracht. Datensätze und Codes, die dem Training des Algorithmus dienten, wurden einbehalten.

Algorithmus »GPT-2«

Trainiert wurde der GPT-2 unter anderem mit wissenschaftlichen Texten, Büchern und knapp zehn Millionen Artikeln des Social-News-Aggregators Reddit. Mithilfe der gesammelten Daten erkennt der GPT-2 die Muster unserer Sprache und kann sich so Stil und Inhalt des vorgegebenen Textes anpassen.

Texte, die generiert werden, scheinen auf den ersten Blick wie von Menschenhand geschrieben. Bei genauerem Betrachten erkennt man jedoch, dass sich einzelne Textpassagen wiederholen oder nicht der Wahrheit entsprechen.

In einem vom Guardian veröffentlichten Video wurde die Funktionalität des Algorithmus vorgeführt.

GPT-2 ist nicht der erste Algorithmus zur Textgenerierung

Bereits vor der Veröffentlichung von OpenAI gab es ähnliche Projekte, wie beispielsweise ELMo vom Allen Institute, oder die von Google trainierte KI: BERT.

Die Technik, die hinter GPT-2 steckt, wurde also nicht neu erfunden. Neu ist laut OpenAI die Zusammensetzung der angesammelten Daten und das Ineinandergreifen von verschiedenen Teilfunktionen.

Das ist wohl einer der Kritikpunkte, die Wissenschaftler darin bestärken, dass OpenAI mit Überschriften, die den Machine Learning Algorithmus als »zu gefährlich für die Öffentlichkeit« betiteln, versucht habe, Clickbait zu betreiben. Man wolle so verschleiern, dass der Durchbruch eigentlich nicht so relevant ist, wie behauptet.

Die Zukunft des Textens

Auch durch OpenAIs GPT-2 wird einmal mehr deutlich, in welche Richtung wir uns in Zukunft bewegen. Durch Künstliche Intelligenz und Algorithmen lassen sich Fachtexte zu bestimmten Themen einfach und schnell produzieren und duplizieren. Die Technik ist zwar noch nicht ausgereift, doch das wird sich in der Zukunft sicherlich ändern.

