Inhalt

Einleitung: Chat-Bot, Sprachassistent oder KI?

Ist es ein sog. „Chat-Bot“, oder ein sprach-basierter Assistent, oder ist es gar eine KI, die in der Lage ist, natürliche Sprache zu verstehen?

Viele Laien und  Einsteiger können diese Unterscheidung nicht ausreichend präzise treffen – daher werden diese Systeme in drei Einträgen hier im Glossar erläutert. Wir diskutieren den Unterschied zwischen

  • einer simulierten („fake“) menschlichen Konversation („Chat Bot“), der vorwiegend unterhaltend oder informativ soll („small talk“),
    • einem Sprachassistenten (auch genannt: sprach-basierter Assistent, virtueller Assistent), wie Siri und Alexa; diese System sind passiv, reagieren auf  Befehle und Fragen (wie Termine eintragen, Dinge einkaufen). Dazu benötigen diese Systeme lediglich ein eher oberflächliches Verständnis der natürlichen Sprache, und interagieren wenig bis gar nicht mit dem Menschen [der Glossar Eintrag dazu folgt in Kürze].
  • KI-Systemen mit „echtem“ Sprachverständnis (wie IBMs Watson), die die Semantik von Sätzen erkennen, und längere Dokumente und Sammlungen von Texten analysieren können, fachliche Anfragen verstehen und sogar Experten Neues vermitteln können [der Glossar Eintrag dazu folgt in Kürze].

Zu bemerken ist, das aktuelle Systeme diese Grenzen zunehmend verwischen (s.  Google Duplex, s. Microsofts Akquise von „Semantic Machines“ , um Cortana das Führen von Dialogen zu ermöglichen, beides im Mai 2018).

„Chat-Bot“ –  Grundlagen für Einsteiger

Als Einstieg hier Sammlung von Fakten, die sich von der – in Teilen durchaus kritischen – Einführung auf Wikipedia (s. im Beitrag die Punkte „Chatterbots vs. „Chat Bots“) unterscheidet:

  • Wie war die historische Entwicklung solcher Bots? Der erste Chat-Bot „Eliza“ stammt aus dem Jahr 1966, ist im Wikipedia Beitrag erwähnt, aber dann wird es verkürzt. So ist bspw. Apples „Siri“ als „Weiterentwicklung“ bezeichnet. Damit übersieht der Beitrag den militärischen Ursprung von Siris Konzeption, deren sprachliche Reduktion auf wenige Kommandos und Frageformen, den Verzicht auf „echte“ Dialoge, und eine Architektur, die Erweiterbarkeit durch kommerzielle Anwendungen unterstützen muss (vgl. die „Skills“ bei Alexa. )
  • Es fehlt im Wikipedia Beitrag weiterhin die fachliche Warnung vor der typischen Fehleinschätzung vieler Nicht-Fachleute, das sprach-basierte Assistenten wie Siri und Alexa „so ähnlich“ wie Chat-Bots sind; auch wenn das Marketing für diese Produkte genau das durch Einsatz des Sammelbegriff „KI“ gerne verschleiert.

Die Geschichte und Funktionsweise von Chat Bots und von sprach-basierten Assistenten hat der AK Smart Machines in einem populärwissenschaftlichen Vortrag Anfang 2018 diskutiert [link here]. Die verwendeten Algorithmen reichen von

  • einfachen Wenn-Dann Regeln (Weizenbaums Eliza – der Mutter aller Chat Bots aus dem Jahr 1966), über
  • Dialog-Modelle (wie HAM-RPM, das Hamburger Redepartner-Modell; der deutsch-sprachige automatische Hotel-Manager der 80’er Jahre, der unbedingt ein Zimmer vermieten möchte),
  • dem Einsatz von allgemeinem syntaktischen und semantischem Weltwissen (Bruce Wilcox‘ AIML, mehrfacher Gewinner des Loebner Preises) und seinen erfolgreichen Chat-Bots wie Rosette
  • Wilcox und viele andere verwenden WordNet, einem syntaktisch-semantischen Wort-Netz der Universität von Princeton (Bsp.: „Katze“ ist ein „Haustier“), das seit 30 Jahren weiter entwickelt wird
  • kommerziellen Systemen, wie dem Microsoft Bot Framework, das Weltwissen, markt-relevante Information über den Nutzer, und den Zielen der Werbepartner in einem Cloud-basierten Dienst verknüpfen, und das Sie in Cortana, Microsoft Teams, Skype, Slack, Facebook u.a. finden. Insgesamt 25 solcher Bot Entwicklungsumgebungen finden Sie auf Chatbotsjournal.

An der HS KL gibt es mehrere aktuelle Studienarbeiten (2017/2018) zur Funktionsweise unterschiedlicher Typen von Chat Bots:

  • ein Tutorial: Wie erstelle ich einen ersten, selbst programmierten Chat-Bot. Die Fragestellung dieser Studienarbeit war: Kann ich es mir selbst beibringen, nur durch Bearbeiten von Tutorial, ohne (zumindest) Grundkenntnisse zur KI und Sprachanalyse mit zubringen. Lesen Sie mehr zum Experiment hier (und die Antwort ist: es funktionierte nur ein bisschen) [link zur Zusammenfassung folgt].
  • eine Analyse: was sind „Political Bots“ und wie haben sie bevorzugt in den US Wahlkampf 2017 eingegriffen (bemerkenswerterweise über das schlecht gesicherte API von Twitter). Hier der Abschlussvortrag zu dieser Analyse [link zur Präsentation folgt].
  • ein Experiment mit Senioren: Erkenne ich einen Chat Bot, wenn ich ihn sehe oder höre? In dieser Studienarbeit der HS KL hat der Autor ältere Nutzer mit dem www.Otto.de Verkaufs-Chat-Bot konfrontiert, ohne dies vorher anzukündigen. Die Senioren gingen davon aus, das es ein Mensch sei, der ihre Fragen („Ich möchte einen Fernseher bei Ihnen kaufen, der hinten so buntes Licht hat“) beantwortete. Der Verkaufs-Bot von Otto machte viele sprachliche und inhaltliche Fehler; jedoch: Menschen verzeihen viele dieser Fehler! [link zur Präsentation folgt].
  • Denn wenn sie davon ausgehen, es mit einem Menschen zu tun zu haben, sind sie zutiefst kooperativ. Genau diese Eigenschaft des Menschen setzt Google Duplex zum „Wohle“ seines „Besitzers“ ein – und hat dadurch viel Kritik ausgelöst.

[Der Beitrag wird fortgesetzt mit diesen Themen]

Was interessiert Einsteiger und Fortgeschrittene?

Vorschau zu diesem Abschnitt: Im Vortrag “Verstehen Siri, Alexa und Co. unsere Sprache gibt es dazu einen einführenden Teil hier.

Was interessiert Fortgeschrittene?

Vorschau zu diesem Abschnitt: Im Vortrag “Verstehen Siri, Alexa und Co. unsere Sprache gibt es dazu einen vertiefenden Teil hier.

Aktuelle Entwicklungen (seit 2018)

Vorschau zu diesem Abschnitt: NLP, deep learning und “text-to-speech” Systeme, was steckt hinter „Google Duplex, u.v.a.m.