Skip to content
GAR-AI-O_1920x1080px_klein_nur_AI
Jörg Bieri07. November 20237 min read

Wo ist bloss die Intelligenz bei der künstlichen Intelligenz? Einleitung - Teil 1 einer 7-teiligen Blogserie zu KI

Künstliche Intelligenz, wie beispielsweise Chat GPT, ist heutzutage in aller Munde und löst eine Vielzahl unterschiedlichster Reaktionen aus. Auf der einen Seite gibt es die Enthusiasten, die in dieser neuen Technologie eine grosse Chance zur Rettung der Welt sehen. Auf der anderen Seite gibt es die Skeptiker, die wiederum den Untergang der Welt befürchten. In einer siebenteiligen Artikelserie zum Thema KI möchte ich Ihnen zunächst einen Überblick geben und anschliessend in weiteren Artikeln die Details näher erläutern.

Beginnen wir mit einem Überblick:

Was ist künstliche Intelligenz eigentlich?

Einfach ausgedrückt, handelt es sich bei KI im Wesentlichen um Statistik. Viele KI-Dienste nutzen maschinelles Lernen (ML) in Kombination mit dem Finden und Interpretieren von weiteren relevanten Informationen.

Machine Learning

Machine Learning bildet das Fundament einer KI-Lösung und ermöglicht es, Daten vorherzusagen, zu gruppieren und zu klassifizieren. Ein herausragendes Beispiel für den Einsatz von Machine Learning ist die Bilderkennung.

Machine Learning, auf Deutsch maschinelles Lernen, ist eine der Schlüsselkomponenten der künstlichen Intelligenz. Es befähigt Systeme, aus bestehenden Informationen zu lernen, Muster zu erkennen und Vorhersagen auf Grundlage von Daten zu treffen. Dieser Ansatz findet in einer Vielzahl von Applikationen, sei es in der Spracherkennung, der automatischen Übersetzung oder eben in der Bilderkennung.

Mehr Details zum Machine Learning erfahren sie im Blog 2.

Bilderkennung oder Computer Vision

Stellen Sie sich vor, Sie möchten auf Ihrem Informationssystem eine Lösung erstellen, die die Zufriedenheit Ihrer Mitarbeiter anhand von "Daumen hoch" oder "Daumen runter" ermittelt. In Azure verwenden Sie dazu den Custom Vision Dienst, um ein Modell mit Bildern zu trainieren, bei denen Sie angeben, wie die Inhalte erkannt werden sollen. In der Welt des Machine Learning wird ein solches Training von Daten als "supervised Learning" bezeichnet, da auf Basis bekannter Daten Interpretationen für neue Daten gemacht werden (Regression).

Nehmen wir ein Beispiel aus dem Trainingssatz: Das folgende Bild zeigt einen "Daumen hoch" und wird nach dem Training mit einer Erkennungsrate von 95% klassifiziert.

Diese Erkennungsrate verdeutlicht, dass das Erkennen und Interpretieren von Bildern im Wesentlichen auf Statistik beruht. Objekte werden erkannt, und es wird eine statistische Wahrscheinlichkeit berechnet, dass in diesem Fall ein "Daumen hoch" vorliegt. Dabei handelt es sich nicht um eine exakte Bestätigung, ob der Daumen tatsächlich oben oder unten ist.

Diese Erkenntnis ist von grosser Bedeutung, insbesondere im Umgang mit Chat GPT. Schliesslich basieren auch die Antworten von Chat GPT auf statistischen Wahrscheinlichkeiten. Es ist wichtig zu verstehen, dass KI-Systeme, einschliesslich Chat GPT, keine absoluten Wahrheiten kennen. Sie arbeiten aufgrund von bestehenden Daten und Wahrscheinlichkeiten, und es gibt immer Raum für Fehler oder Fehlinterpretationen.

Wichtig ist daher, nicht alles blind zu glauben, was von einer KI geäussert wird. Daten können falsch interpretiert oder sogar absichtlich gefälscht werden. Als Anwender sollten sie kritisch bleiben und die Informationen, die uns von KI-Systemen präsentiert werden, sorgfältig hinterfragen. Dieser kritische Blick ist entscheidend, um die Chancen und Herausforderungen der künstlichen Intelligenz erfolgreich zu meistern.

Mehr Details zur Bilderkennung erfahren sie im Blog 3.

Natural Language Processing (NLP)

Die Interpretation von Sprache erfolgt auf ähnliche Weise wie die Bilderkennung, jedoch mit dem Fokus auf gesprochene oder geschriebene Wörter. Sprache kann in Form von Text oder auch als Audioaufnahme vorliegen, die zunächst in Text umgewandelt werden muss. Dieses Gebiet wird als Natural Language Processing (NLP), also die Verarbeitung natürlicher Sprache, bezeichnet, und es bietet vielfältige Anwendungsmöglichkeiten:

NLP ermöglicht die Analyse von Texten, die Identifizierung von Schlüsselbegriffen und die Erkennung von Entitäten wie Namen, Orte oder Produkte.

NLP kann weiter dazu verwendet werden, die Stimmung oder den Tonfall in Texten zu analysieren. Dies ist nützlich in sozialen Medien, um die öffentliche Meinung zu verfolgen, oder in Kundensupport-Chats, um die Zufriedenheit der Kunden zu bewerten.

NLP ermöglicht die Umwandlung von gesprochener Sprache in Text (Speech-to-Text) und umgekehrt (Text-to-Speech). Diese Technologie findet Anwendung in Sprachassistenten wie Siri oder in der Transkription von Audioinhalten.

Mit NLP können weiter Texte in verschiedene Sprachen übersetzt werden.

Die Interpretation von Sprache bildet auch die Grundlage für die Entwicklung von Bots. Dies kann auf verschiedene Weisen umgesetzt werden, sei es durch die Nutzung eines Question Answering Service, der auf der Basis eines Q&A-Dokuments automatisch einen Bot erstellt, oder durch die Verwendung komplexerer Technologien wie dem Azure Bot Framework, bei dem Programmierarbeit erforderlich ist.

Die Details zu NLP finden sie im Blog 4 dieser Serie.

Die Suche nach Informationen ist eine weitere wichtige Disziplin innerhalb des Gebiets der künstlichen Intelligenz. Es handelt sich dabei um eine der herausforderndsten Aufgaben in der IT, bei der verschiedene Verfahren eingesetzt werden können, um Texte, Bilder oder Sprache effizient zu durchsuchen. Hier sind einige der gängigen Suchmethoden:

  1. Wortbasierte Suche: Dies ist die traditionelle Methode, bei der die Suchmaschine die eingegebenen Worte mit den im Dokument vorhandenen Wörtern abgleicht. Die Trefferliste enthält Dokumente, die die eingegebenen Worte enthalten.
  2. Semantische Suche: Die semantische Suche geht einen Schritt weiter, indem sie versucht, den Inhalt der Sätze zu interpretieren. Sie berücksichtigt die Bedeutung von Worten und versucht, den Kontext zu verstehen. Dadurch kann sie relevante Informationen liefern, auch wenn die eingegebenen Worte nicht exakt übereinstimmen.
  3. Vektorsuche: Die Vektorsuche ist eine fortschrittliche Methode, bei der die Originaldaten in Textblöcke aufgeteilt und diese in Vektoren umgewandelt werden. Diese Vektoren repräsentieren den Inhalt der Textblöcke. Anschliessend erfolgt die Suche anhand dieser Vektoren, um relevante Treffer zu generieren. Dies ermöglicht eine effiziente Suche und Ähnlichkeitsvergleiche.

Durch die Kombination all dieser Suchdienste und ihre Integration mit einem Large Language Model (LLM) eröffnen sich leistungsstarke Lösungen im Bereich der künstlichen Intelligenz. Ein LLM wie GPT-3.5 kann nicht nur natürliche Sprache verstehen und generieren, sondern auch Suchanfragen interpretieren, um hochwertige Antworten und Informationen bereitzustellen. Die Integration von LLMs in Suchsysteme ermöglicht eine noch bessere Verarbeitung von Informationen und eine verbesserte Anpassung an die Bedürfnisse der Benutzer.

Mehr zur Suche im Blog 5.

OpenAI

Im Mittelpunkt von OpenAI steht ein faszinierendes Konzept, nämlich das sogenannte Large Language Model (LLM). Ein LLM ist ein gigantisches neuronales Netzwerk, das auf die Verarbeitung natürlicher Sprache trainiert ist. Mit Hilfe dieser Modelle können Texte generiert werden, um beispielsweise auf Anfragen in Bots zu antworten.

Ein LLM ist jedoch weitaus vielseitiger als nur Textgenerierung. Es kann auch Übersetzungen in andere Sprachen durchführen, Texte zusammenfassen und eine breite Palette von natürlichsprachlichen Aufgaben bewältigen. Es stehen verschiedene Modelle für unterschiedliche Anwendungsfälle zur Verfügung, und eines der bekanntesten Modelle ist zweifelsohne GPT-4, das von OpenAI entwickelt wurde.

Der Name "GPT" steht für "Generative Pretrained Transformer", was bereits einen Hinweis darauf gibt, wie diese Modelle funktionieren. GPT-4 und seine Vorgänger basieren auf einem Transformer-Architektur-Ansatz, der es ihnen ermöglicht, grosse Mengen an Textdaten zu analysieren und daraus zu lernen. Dieses vortrainierte Modell kann dann für verschiedene NLP-Aufgaben, wie Textgenerierung, Übersetzungen und Textverarbeitung, feinabgestimmt werden.

Azure AI und lokale Daten

Im Blog 7 werfen wir einen Blick auf eine innovative Lösung, die es uns ermöglicht, Chatbot-ähnliche Funktionalitäten auf der Grundlage eigener Daten zu implementieren. Als konkretes Beispiel betrachten wir die Bereitstellung von Informationen aus dem Personalhandbuch in Form eines Chatdialogs.

Die zu beantwortende Frage lautet: "Habe ich am 1. August frei?"

Die folgende Skizze zeigt den Prozess im Detail:

  1. Aufteilung der lokalen Daten: Zunächst werden die Informationen aus dem Personalhandbuch in kleine Textabschnitte von etwa 1000 Zeichen unterteilt und in einer Datenbank gespeichert. Dieser Schritt ermöglicht eine effiziente Verarbeitung und Suche in den Informationen. 
  2. Umwandlung in Vektoren: Mithilfe eines OpenAI-Modells werden die Textabschnitte in Vektoren umgewandelt, die als Embeddings bezeichnet werden. Diese Vektoren repräsentieren den Inhalt der Textabschnitte und werden ebenfalls in der Vektordatenbank zusammen mit dem ursprünglichen Text gespeichert.
  3. Benutzerfrage: Der Benutzer stellt seine Frage: "Habe ich am 1. August frei?"
  4. Vektorisierung der Frage: Die Benutzerfrage wird ebenfalls mit dem gleichen Modell wie unter Punkt 2, in einen Vektor umgewandelt. Mithilfe einer Vektorsuche werden diejenigen Textabschnitte gefunden, die relevante Informationen zur gestellten Frage enthalten.
  5. Antwortgenerierung: Die besten drei passenden Textabschnitte, die durch die Vektorsuche ermittelt wurden, werden dem Chat GPT-ähnlichen Modell übergeben. Dies ermöglicht OpenAI, die Frage anhand der lokal gespeicherten Daten sowie unter Berücksichtigung der Daten im Large Language Model (GPT3 oder 4) korrekt zu beantworten.
    In unserem Fall lautet dann die Antwort: "Ja, der 1. August ist ein Feiertag." 

Diese Lösung ermöglicht es, die Vorteile von Chatbot-Technologien und KI-gesteuerten Sprachverarbeitungssystemen zu nutzen, um auf lokale Unternehmensdaten zuzugreifen und massgeschneiderte Antworten auf Benutzerfragen bereitzustellen. Es ist ein tolles Beispiel dafür, wie Unternehmen Azure AI und ähnliche Dienste nutzen können, um ihre internen Prozesse zu verbessern und die Effizienz bei der Bereitstellung von Informationen zu steigern.

Ich freue mich mit Ihnen auf die Reise durch die Welt der künstlichen Intelligenz und ich bin gespannt ob wir die Intelligenz zusammen noch finden werden ;-)

 

 

 

avatar

Jörg Bieri

Chief Technology Officer, Mitglied der Geschäftsleitung
joerg.bieri@garaio.com
+41 58 310 70 60

VERWANDTE ARTIKEL