Was ist KI und wie kann man es jemanden einfach erklären?

Ein Schülerblog von Harman Dhanoya und Benedikt Schmid.

In diesem Artikel werden wir versuchen, die Struktur des KI-Systems auf einfache
Weise zu erklären. Wir ignorieren technische Details, da der Zweck von diesem
Blog darin besteht, Grundkenntnisse zu vermitteln. Im Vergleich zur
herkömmlichen Computerprogrammierungen, bei der die Software nicht automatisch
verbessert werden kann, sind die Einstellungen des künstlichen
Intelligenzsystems sehr unterschiedlich.

Es ist anzumerken, dass der Bau künstlicher Intelligenzsysteme im Laufe der Zeit
nicht nur viel weniger komplex, sondern auch viel billiger geworden ist. Eines
der anschaulichen Beispiele ist Amazon Machine Learning, mit den Produkten im
Katalog automatisch anhand der Produktbeschreibungsdaten als Trainingssatz
klassifiziert werden können.

Um dieses Beispiel zu verstehen, muss man sich auf maschinelles Lernen
konzentrieren, da dieser Bereich die meisten Anwendungen abdeckt. Ein wichtiger
Hinweis: Um AI erfolgreich eingeben zu können, benötigen Sie ein gutes
Verständnis der Statistik.

Wie entwickelt man ein KI-System?
Dies sind die einzelnen Schritte, um ein KI-System zu entwickeln:
1.    Identifizieren des Problems
2.    Vorbereitung der Daten
3.    Auswahl der Algorithmen
4.    Training der Algorithmen
5.    Auswahl der am besten geeigneten Programmiersprache
6.    Auswahl der Plattform

1. Identifizieren des Problems
Zunächst müssen folgende wichtige Fragen beantwortet werden:
1.    Was versuchen man zu lösen?
2.    Welches Ergebnis wird erwünscht?
Man sollte immer daran denken, dass KI an sich kein Allheilmittel sein kann. Es
ist ein Werkzeug und nicht die vollständige Lösung. Es gibt verschiedene
Methoden und viele verschiedene Probleme, die mit AI gelöst werden müssen.

Die folgende Analogie soll helfen, das Obige zu verstehen:

Um ein köstliches Gericht zuzubereiten, müssen Sie genau wissen, welches Gericht
zubereitet wird und welche Zutaten benötigt werden.

2. Vorbereitung der Daten
Das erste, was zu berücksichtigen ist, sind die Daten. Sie sind in strukturierte
und unstrukturierte Datenunterteilt.

Der Begriff strukturierte Daten bezieht sich im Allgemeinen auf alle Arten von
Daten, die in irgendeiner Weise strukturiert oder organisiert sind, um eine
konsistente Verarbeitung und eine einfache Analyse sicherzustellen. Als
einfaches Beispiel für strukturierte Daten kann ein Kundendatensatz mit Vor- und
Nachname, Geburtsdatum, Adresse und anderen Daten angegeben werden.

Im Gegensatz dazu sind unstrukturierte Daten in einem informellen Format
verfügbar. Sie können Audio, Bilder, Symbole, Wörter und Infografiken enthalten.
Einfache Beispiele sind E-Mails, ein Anruf und eine WhatsApp-Nachricht.

Es ist ein Fehler zu glauben, dass die wichtigsten Komponenten der KI komplexe
Algorithmen sind. Tatsächlich ist der wichtigste Teil der KI-Toolkits die
Datenbereinigung. Datenwissenschaftler verbringen normalerweise 80% ihrer Zeit
damit, Daten zu bereinigen, zu verschieben, zu überprüfen und zu organisieren,
bevor sie verwendet oder ein einzelner Algorithmus geschrieben werden.

Unternehmen und große Unternehmen verfügen über umfangreiche proprietäre
Datenbanken, deren Daten möglicherweise nicht AI-fähig sind, und es ist sehr
häufig, dass Daten in Silos gespeichert werden. Dies kann Informationen
duplizieren, von denen einige zusammenfallen und einige sich widersprechen
können. Letztendlich könnten Unternehmen durch diese Datensilos eingeschränkt
werden, um einen schnellen Einblick in ihre internen Daten zu erhalten.

Bevor man die Modelle ausführt, ist es notwendig sich sicherzustellen, dass die
Daten ordnungsgemäß organisiert und bereinigt wurden. Dies bedeutet, die
Konsistenz zu überprüfen, eine chronologische Reihenfolge zu bestimmen, Daten
nach Bedarf zu kennzeichnen usw.

Im Allgemeinen gilt die Regel, dass die Wahrscheinlichkeit, dass das Ergebnis
zur Lösung des angegebenen Problems gefunden wird, umso größer ist, je mehr
Daten massiert werden.

3. Auswahl der Algorithmen
Wie bereits erwähnt, werden technische Details in diesem Blog nicht behandelt.
Es ist jedoch erforderlich, eine kurze Beschreibung der verschiedenen gängigen
Arten von Algorithmen bereitzustellen, die auch von der Art des ausgewählten
Lernens abhängen.

1. Überwachtes Lernen
Grundsätzlich wird ein Label für die Klassifizierung und viel für die Regression
vorhergesagt.

Ein anschauliches Beispiel für die Verwendung eines Klassifizierungs-Algorithmus
könnte ein Szenario sein, in dem bestimmt werden sollte, ob ein Darlehen
fehlschlagen würde oder nicht.

Ein anschauliches Beispiel für die Verwendung eines Regressions-Algorithmus
könnte ein Szenario sein, in dem die Höhe des erwarteten Verlusts für diese
fehlgeschlagenen Kredite quantifiziert werden sollte. In diesem Sinne wird ein
Wert angestrebt: Wie hoch ist der Betrag des Euro, der bei einem Ausfall des
Kredits wahrscheinlich verloren geht?

Sobald das Problem identifiziert wurde, kann der nächste Schritt ausgeführt
werden: Wahl des Algorithmus.

Diese Szenarien sind in der Praxis simpel und unrealistisch. Beim überwachten
Lernen können man aus anderen Algorithmen auswählen

Diese Beispiele sind jedoch erforderlich, um die Arten von Algorithmen in der KI
vollständig zu verstehen.

2. Unüberwachtes Lernen & Verstärkendes Lernen
Hier wären die Arten von Algorithmen sehr unterschiedlich und könnten in
verschiedene Kategorien unterteilt werden, wie z. B. B. Gruppierung, bei der der
Algorithmus ähnliche Objekte finden soll, Assoziation, bei der Verbindungen
zwischen Objekten gefunden werden sollen, Dimensionsreduzierung, bei der die
reduziert werden soll Anzahl der Variablen zur Rauschunterdrückung.

4. Training der Algorithmen
Sobald die Auswahl der Algorithmen abgeschlossen ist, muss das Modell trainiert
und die Daten in das Modell eingegeben werden. Die Modellgenauigkeit ist hier
entscheidend. Obwohl es keine internationalisierten oder allgemein akzeptierten
Schwellenwerte gibt, ist es äußerst wichtig, dass die Genauigkeit des Modells
innerhalb des ausgewählten Rahmens bestimmt wird. Die Festlegung eines
akzeptablen Mindestschwellenwerts und die Anwendung großer statistischer
Disziplin spielen eine entscheidende Rolle. Das Modell muss umgeschult werden,
da die Modelle möglicherweise angepasst werden müssen. Beispielsweise sollten im
Fall des Ergebnisses mit verringerter Vorhersagbarkeit des Modells alle oben
genannten Schritte überprüft und verifiziert werden.

5. Auswahl der am besten geeigneten Programmiersprache für KI
Dies hängt von den Bedürfnissen und vielen Faktoren ab. Heute haben
Datenwissenschaftler und einfache Benutzer Zugriff auf eine Vielzahl von
Programmiersprachen, von C ++ und Java bis Python. Python und R sind derzeit die
beliebtesten und am weitesten verbreiteten Programmiersprachen in der
Datenwissenschaft. Beide sind sehr leistungsfähige Programmiersprachen (für die
Datenanalyse), insbesondere aufgrund der vielen umfangreichen Pakete und
Bibliotheken für maschinelles Lernen. Eine der sehr leistungsfähigen
Bibliotheken für Computerlinguistik ist NLTK (das Natural Language Toolkit). Es
ist eine Zusammenstellung von Bibliotheken und Programmen in der
Programmiersprache Python.

6. Auswahl der Plattform
Sie müssen nicht unbedingt Ihren eigenen Service, Ihre eigene Datenbank usw.
kaufen. Es besteht die Möglichkeit, eine vorgefertigte Plattform auszuwählen,
die alle Dienste bietet.

Diese vorgefertigten Plattformen (maschinelles Lernen als Service) waren eine
der nützlichsten Komponenten der Infrastruktur, dank derer sich maschinelles
Lernen verbreitet hat. Ziel der Entwicklung dieser Plattformen war es,
maschinelles Lernen zu erleichtern und zu vereinfachen. Sie bieten häufig
fortschrittliche Cloud-basierte Analysen, die in mehrere Algorithmen und
Sprachen integriert werden können.

Eine schnelle Implementierung ist entscheidend für den Erfolg des maschinellen
Lernens als Dienstleistung. Plattformen helfen normalerweise bei der Lösung von
Problemen wie Datenvorverarbeitung, Modelltraining und Bewertungsvorhersage. Da
sie sich unterscheiden, ist eine gewisse Vorbewertung von entscheidender
Bedeutung.

Die beliebtesten Plattformen sind Microsoft Azure Machine Learning, die Google
Cloud Prediction API, TensorFlow und andere.

Unsere Quellen:
https://de.wikipedia.org/wiki/K%C3%BCnstliche_Intelligenz
(abgerufen am 07.04.2020 um 17:00)

https://www.computerweekly.com/de/definition/Kuenstliche-Intelligenz-KI
(abgerufen am 08.04.2020 um 09:00)

https://wirtschaftslexikon.gabler.de/definition/kuenstliche-intelligenz-ki-40285
(abgerufen am 08.04.2020 um 09:10)

https://www.salesforce.com/de/products/einstein/ai-deep-dive/
(abgerufen am 07.04.2020 um 17:10)

https://www.ionos.at/digitalguide/online-marketing/verkaufen-im-internet/was-ist-kuenstliche-intelligenz/
(abgerufen am 08.04.2020 um 09:20)

https://www.ai-united.de/ein-genauerer-ueberblick-ueber-die-hauptarten-von-modellen-des-maschinellen-lernens/
(abgerufen am 08.04.2020 um 14:40)

On Key

Related Posts

Wie Tourismus die Welt zerstört

Ein Blog von Tamara Marl Kaum ein Urlaubsort ist heute noch das, was er einmal war. Aber ist das etwas Negatives? Immerhin verändern wir sie

Die Frühen Theorien der Psychologie

Ein Blog von Bianca Kaut Vorwort Theorien der Psychologie reichen bis zu 350 v. Chr. zurück und bilden das Fundament der heutigen praktischen Psychologie. Begriffe

Physik Nobelpreis 2023

Ein Blog von Lukas Paukner Nobelpreis-Sieger Der diesjährige Physik-Nobelpreis geht an Anne L’Huillier von der Universität Lund, Pierre Agostini von der Ohio State University in

Die Zukunft der Raumfahrt

Ein Blog von Florian Pluhar Die Zukunft der Raumfahrt Solange die Menschheit existiert, gab es immer wieder Menschen, die hoch zu den Sternen blickten und