Unter der Motorhaube bei Grammary: Veränderung des Schreibstils mit KI

Veröffentlicht: 2018-05-31

Wenn Sie einen guten Eindruck auf jemanden machen müssen, in dem Sie schreiben, ist das, was Sie sagen, nicht das einzige, worüber Sie nachdenken müssen. Wie Sie sagen, es ist oft genauso wichtig. Die Auswahl der richtigen Formalitätsniveau kann eine besondere Herausforderung sein-es ist sehr kontextabhängig, und Sie müssen häufig Vermutungen darüber machen, wie Ihr Empfänger Ihren Ton interpretiert.

Stellen Sie sich vor, Sie schreiben ein Anschreiben. Wie viel von einem Game-Changer wäre es, wenn Sie ein Tool hätten, das erkennen könnte, wenn Ihr Schreiben zu lässig ist (oder manchmal noch schlimmer, zu formal)? Plötzlich werden Ihre Entscheidungen darüber, wie Sie sagen, was Sie sagen möchten, viel weniger trübe. Sie verlassen sich nicht nur auf Vermutungen darüber, wie Ihr Empfänger Ihre Nachricht wahrnimmt. Sie haben einen Algorithmus, der auf viele Daten stützt, die Sie nicht persönlich haben. Wenn Sie noch einen Schritt weiter gehen, könnte dieses Tool Ihnen nicht nur sagen, wann etwas ausgeht, sondern Ihnen auch eine alternative Formulierung anbieten, die Ihr Empfänger besser möchte?

Der Prozess, einen Computer dazu zu bringen, ein Stück Schreiben von einem Stil automatisch in einen anderen zu verwandeln, heißt Style Transfer und ist Gegenstand einer bevorstehenden Zeitung, die ich mit meinem Kollegen Sudha Rao geschrieben habe. Es ist ein Bereich von besonderem Interesse für uns hier bei Grammary, weil wir wissen, wie wichtig es ist, den richtigen Weg zu kommunizieren.

Wenn Sie sich jemals gefragt haben, wie die Forschungsingenieure von Grammary die Systeme bauen, die Ihnen Schreibvorschläge liefern, lesen Sie weiter.

Ein informeller Hintergrund zur Formalität

Bevor wir uns mit den Details unserer Algorithmen eintauchen, schauen wir uns ein Beispiel für informelle und formale Sprache an.

Informell: Muss beide Seiten der Geschichte sehen

Formal: Sie müssen beide Seiten der Geschichte sehen.

Es gibt einige offensichtliche Unterschiede zwischen diesen Sätzen. Die Verwendung von Slang („Gotta“) und der Mangel an Interpunktion am Ende der ersten Satzsignal -Informalität. Es gibt eine Zeit und einen Ort für diese Art von Satz - zum Beispiel ein SMS -Austausch zwischen Freunden.

Als wir uns untersuchten, wie Menschen informelle Sätze in einem formelleren Stil neu geschrieben haben, stellten wir fest, dass die häufigsten Änderungen, die sie vorgenommen haben, Kapitalisierung, Interpunktion und Umgangssprache betrafen. Wir haben auch festgestellt, dass Menschen manchmal drastischere Umschreibungen eines Satzes machen müssen, um die Formalität zu verbessern:

Informell: Wann kommst du zum Meeting?

Formal: Bitte lassen Sie mich wissen, wann Sie an der Sitzung teilnehmen werden.

Aber wie lehren wir Computern, Änderungen wie die oben genannten vorzunehmen? Es gibt verschiedene Möglichkeiten, sich dem Problem zu nähern.

Die, die wir verwenden, erkennt an, dass das Unterrichten eines Computers zur Übersetzung zwischen Schreibstilen dem Unterrichten der Übersetzung von Sprachen ähnelt. Dieser Ansatz wird als maschinelle Übersetzung bezeichnet, wobei ein Computer automatisch von einer Sprache (wie Französisch) zu einer anderen (Deutsch) übersetzt wird. Wenn Sie sich also mit dem Problem der Stilübertragung befassen, ist es sinnvoll, mit einem Übersetzungsmodell oder in unserem Fall mehrere Modelle zu beginnen.

Was ist ein Übersetzungsmodell?

Einer der jüngsten Durchbrüche in der KI ist die Verwendung von Deep Learning oder neuronales Netzwerk Techniken zum Aufbau von maschinellen Übersetzungsmodellen.

NMT -Modelle (Neural Machine Translation) können Darstellungen der zugrunde liegenden Bedeutung von Sätzen lernen. Dies hilft dem Modell, komplexe Satzmuster so zu lernen, dass die Übersetzung fließend und seine Bedeutung dem ursprünglichen Satz treu ist.

Ältere Ansätze zur maschinellen Übersetzung, wie z. B. regelbasierte oder phrase-basierte Modelle (PBMT), unterteilen Sätze in kleinere Einheiten wie Wörter oder Phrasen und übersetzen sie unabhängig. Dies kann zu grammatikalischen Fehlern oder unsinnigen Ergebnissen in der Übersetzung führen. Diese Modelle sind jedoch leichter zu optimieren und sind tendenziell konservativer - was von Vorteil sein kann. Zum Beispiel können wir leicht Regeln einbeziehen, die den Slang in Standardwörter ändern.

Wir haben uns verschiedene Ansätze für die maschinelle Übersetzung angesehen, um zu sehen, welche am besten bei der Stilübertragung ist.

Ein Modell aufbauen

NMT und PBMT sind voller Herausforderungen, nicht zuletzt darin, einen guten Datensatz zu finden, mit dem Sie Ihre Modelle trainieren können. In diesem Fall würden wir geschätzt, dass wir einen Datensatz mit Hunderttausenden von informellen und formalen Satzpaaren benötigen würden. Im Idealfall würden Sie Ihr Modell mit Millionen von Satzpaaren trainieren, aber da die Stilübertragung ein ziemlich neuer Bereich im Bereich der Verarbeitung natürlicher Sprache ist, gab es wirklich einen vorhandenen Datensatz, den wir verwenden konnten. Also haben wir einen geschaffen.

Wir begannen damit, informelle Sätze zu sammeln. Wir haben unsere Sätze aus Fragen und Antworten bezogen, die öffentlich auf Yahoo! Antworten. Wir haben automatisch über einhunderttausend informelle Sätze aus diesem Set ausgewählt und jeweils ein Team mit einer formellen Sprache neu geschrieben, wobei sie erneut vordefinierte Kriterien verwendet haben. (Weitere Informationen zu diesem Prozess finden Sie in unserem Artikel.)

Sobald Sie einen Datensatz haben, können Sie Ihr Modell ausbilden. Ausbildung des Modells bedeutet, dass es viele „Quell“ -Sätze - in unseren fundalen Sätzen - mit vielen „Ziel“ -Sätzen gibt, für uns sind dies die formellen Umschreibungen. Der Algorithmus des Modells sucht dann nach Mustern, um herauszufinden, wie man von der Quelle zum Ziel gelangt. Je mehr Daten es hat, desto besser lernt es.

In unserem Fall verfügt das Modell über einhunderttausend informelle Quellsätze und ihre formellen Umschreibungen, aus denen man lernen kann. Wir haben auch mit verschiedenen Möglichkeiten experimentiert, künstliche formale Daten zu erstellen, um die Größe unseres Trainingsdatensatzes zu erhöhen, da NMT- und PBMT -Modelle häufig viel mehr Daten benötigen, um eine gute Leistung zu erzielen.

Sie brauchen aber auch eine Möglichkeit, zu bewerten, wie gut Ihr Modell seine Aufgabe erfüllt. Hat sich die Bedeutung des Satzes geändert? Ist der neue Satz grammatikalisch korrekt? Ist es eigentlich formeller? Es gibt Klassifizierer da draußen - Programme, die automatisch Sätze für Ton- und Schreibstil bewerten können - und wir haben einige der am häufigsten in der Wissenschaft verwendeten. Keiner von ihnen ist jedoch sehr genau. Am Ende haben wir den Menschen die Ausgaben der verschiedenen Modelle vergleichen, die wir getestet haben, und bewerten sie nach Formalität, Genauigkeit und Flüssigkeit.

Wir haben unserem Team den ursprünglichen informellen Satz, Ausgaben aus mehreren verschiedenen Modellen und das Umschreiben des Menschen gezeigt. Wir haben ihnen nicht gesagt, wer - oder was - jeden Satz generierte. Dann haben sie die Umschreibungen eingestuft und Krawatten zugelassen. Im Idealfall wäre das beste Modell mit den menschlichen Umschreibungen verbunden oder sogar besser als die menschlichen Umschreibungen. Insgesamt erzielte das Team die Umschreiben von 500 informellen Sätzen.

Was wir gefunden haben

Insgesamt haben wir Dutzende von Modellen getestet, aber wir werden uns auf die Top konzentrieren: regelbasierte, phrase-basierte (PBMT), neuronales netzwerkbasiertes (NMT) und ein Paar, das verschiedene Ansätze kombinierte.

Die Umschreibungen des Menschen erzielten insgesamt den höchsten, aber die PBMT- und NMT -Modelle waren nicht so weit zurück. Tatsächlich gab es mehrere Fälle, in denen die Menschen das Modell den Menschen vorzogen. Diese beiden Modelle machten umfangreichere Umschreiben, änderten jedoch die Bedeutung des ursprünglichen Satzes.

Die regelbasierten Modelle hingegen nahmen kleinere Änderungen vor. Dies bedeutete, dass sie besser die Bedeutung bewahren konnten, aber die von ihnen produzierten Sätze waren weniger formal. Alle Modelle hatten es einfacher, kürzere Sätze zu bearbeiten als längere.

Das Folgende ist ein Beispiel für einen informellen Satz mit seinen Menschen- und Modellumschreibungen. In diesem speziellen Fall war es das letzte Modell (NMT mit PBMT-Translation), das das beste Gleichgewicht zwischen Formalität, Bedeutung und natürlicher Phrasierung schlug.

Original informell: Ich sehe ihn kaum in der Schule. Normalerweise sehe ich, dass meine Brüder Basketballspiele.

Human Rewrite: Ich sehe ihn kaum in der Schule. Normalerweise sehe ich ihn mit meinen Brüdern Basketball spielen.

Regelbasiertes Model: Ich sehe ihn kaum in der Schule. Normalerweise sehe ich, dass meine Brüder Basketballspiele.

PBMT -Modell: Ich sehe ihn auch in der Schule kaum, aber meine Brüder Basketballspiele.

NMT Model: Ich sehe ihn selten in der Schule, entweder sehe ich ihn bei den Basketballspielen meines Bruders.

NMT (ausgebildet auf zusätzliche von PBMT erstellte Daten): Ich sehe ihn selten in der Schule. Normalerweise sehe ich ihn bei meinen Brüdern Basketballspielen.

Style Transfer ist ein aufregender neuer Bereich der Verarbeitung natürlicher Sprache mit dem Potenzial für weit verbreitete Anwendungen. Das Tool, das ich am Anfang angenommen habe - das, das Ihnen hilft, herauszufinden, wie Sie sagen, was Sie sagen müssen? Es gibt noch viel zu tun, aber dieses Tool ist möglich, und es wird für Arbeitssuchende, Sprachlernende und jeden, der durch sein Schreiben einen guten Eindruck auf jemanden machen muss, von unschätzbarem Wert sein. Wir hoffen, dass wir und andere auf diesem Gebiet, indem wir unsere Daten öffentlich machen, eine Möglichkeit haben, sich gegenseitig zu bewerten und diesen Forschungsbereich voranzutreiben.

Grammatary ist ein weiterer Schritt in Richtung unserer Vision, einen umfassenden Kommunikationsassistenten zu schaffen, der Ihre Botschaft genauso wie beabsichtigt verstanden wird.

Joel Tetreault ist Forschungsdirektor bei Grammary. Sudha Rao ist Doktorandin an der University of Maryland und war Forschungspraktikant bei Grammarly. Joel und Sudha werden diese Forschung auf der 16. jährlichen Konferenz des Nordamerikas des Association for Computational Linguistics: Human Language Technologies in New Orleans, 1. bis 6. Juni 2018 präsentieren. Das begleitende Forschungspapier mit dem Titel „Lieber Herr oder Madam, möge ich die GYAFC-Datensätze vorstellen: Korpus, Benchmarken und Messcrics for Formality Style,“, wird in den Teilen der Naclics und der Mess-Metrics-Style-Style.