Was ist KI und wie kann man es jemanden einfach erklären?

Digitalisierung Mai 22, 2020

Ein Schülerblog von Harman Dhanoya.

In diesem Artikel werden wir versuchen, die Struktur des KI-Systems auf einfache Weise zu erklären. Wir ignorieren technische Details, da der Zweck von diesem Blog darin besteht, Grundkenntnisse zu vermitteln. Im Vergleich zur herkömmlichen Computerprogrammierungen, bei der die Software nicht automatisch verbessert werden kann, sind die Einstellungen des künstlichen Intelligenzsystems sehr unterschiedlich.

Es ist anzumerken, dass der Bau künstlicher Intelligenzsysteme im Laufe der Zeit nicht nur viel weniger komplex, sondern auch viel billiger geworden ist. Eines der anschaulichen Beispiele ist Amazon Machine Learning, mit den Produkten im Katalog automatisch anhand der Produktbeschreibungsdaten als Trainingssatz klassifiziert werden können.

Um dieses Beispiel zu verstehen, muss man sich auf maschinelles Lernen konzentrieren, da dieser Bereich die meisten Anwendungen abdeckt. Ein wichtiger Hinweis: Um AI erfolgreich eingeben zu können, benötigen Sie ein gutes Verständnis der Statistik.

Wie entwickelt man ein KI-System?

Dies sind die einzelnen Schritte, um ein KI-System zu entwickeln:
1.    Identifizieren des Problems
2.    Vorbereitung der Daten
3.    Auswahl der Algorithmen
4.    Training der Algorithmen
5.    Auswahl der am besten geeigneten Programmiersprache
6.    Auswahl der Plattform

1. Identifizieren des Problems

Zunächst müssen folgende wichtige Fragen beantwortet werden:
1.    Was versuchen man zu lösen?
2.    Welches Ergebnis wird erwünscht?
Man sollte immer daran denken, dass KI an sich kein Allheilmittel sein kann. Es ist ein Werkzeug und nicht die vollständige Lösung. Es gibt verschiedene Methoden und viele verschiedene Probleme, die mit AI gelöst werden müssen.

Die folgende Analogie soll helfen, das Obige zu verstehen:

Um ein köstliches Gericht zuzubereiten, müssen Sie genau wissen, welches Gericht zubereitet wird und welche Zutaten benötigt werden.

2. Vorbereitung der Daten

Das erste, was zu berücksichtigen ist, sind die Daten. Sie sind in strukturierte und unstrukturierte Datenunterteilt.

Der Begriff strukturierte Daten bezieht sich im Allgemeinen auf alle Arten von Daten, die in irgendeiner Weise strukturiert oder organisiert sind, um eine konsistente Verarbeitung und eine einfache Analyse sicherzustellen. Als einfaches Beispiel für strukturierte Daten kann ein Kundendatensatz mit Vor- und Nachname, Geburtsdatum, Adresse und anderen Daten angegeben werden.

Im Gegensatz dazu sind unstrukturierte Daten in einem informellen Format verfügbar. Sie können Audio, Bilder, Symbole, Wörter und Infografiken enthalten. Einfache Beispiele sind E-Mails, ein Anruf und eine WhatsApp-Nachricht.

Es ist ein Fehler zu glauben, dass die wichtigsten Komponenten der KI komplexe Algorithmen sind. Tatsächlich ist der wichtigste Teil der KI-Toolkits die Datenbereinigung. Datenwissenschaftler verbringen normalerweise 80% ihrer Zeit damit, Daten zu bereinigen, zu verschieben, zu überprüfen und zu organisieren, bevor sie verwendet oder ein einzelner Algorithmus geschrieben werden.

Unternehmen und große Unternehmen verfügen über umfangreiche proprietäre Datenbanken, deren Daten möglicherweise nicht AI-fähig sind, und es ist sehr häufig, dass Daten in Silos gespeichert werden. Dies kann Informationen duplizieren, von denen einige zusammenfallen und einige sich widersprechen können. Letztendlich könnten Unternehmen durch diese Datensilos eingeschränkt werden, um einen schnellen Einblick in ihre internen Daten zu erhalten.

Bevor man die Modelle ausführt, ist es notwendig sich sicherzustellen, dass die Daten ordnungsgemäß organisiert und bereinigt wurden. Dies bedeutet, die Konsistenz zu überprüfen, eine chronologische Reihenfolge zu bestimmen, Daten nach Bedarf zu kennzeichnen usw.

Im Allgemeinen gilt die Regel, dass die Wahrscheinlichkeit, dass das Ergebnis zur Lösung des angegebenen Problems gefunden wird, umso größer ist, je mehr Daten massiert werden.

3. Auswahl der Algorithmen

Wie bereits erwähnt, werden technische Details in diesem Blog nicht behandelt. Es ist jedoch erforderlich, eine kurze Beschreibung der verschiedenen gängigen Arten von Algorithmen bereitzustellen, die auch von der Art des ausgewählten Lernens abhängen.

1. Überwachtes Lernen

Grundsätzlich wird ein Label für die Klassifizierung und viel für die Regression vorhergesagt.

Ein anschauliches Beispiel für die Verwendung eines Klassifizierungs-Algorithmus könnte ein Szenario sein, in dem bestimmt werden sollte, ob ein Darlehen fehlschlagen würde oder nicht.

Ein anschauliches Beispiel für die Verwendung eines Regressions-Algorithmus könnte ein Szenario sein, in dem die Höhe des erwarteten Verlusts für diese fehlgeschlagenen Kredite quantifiziert werden sollte. In diesem Sinne wird ein Wert angestrebt: Wie hoch ist der Betrag des Euro, der bei einem Ausfall des Kredits wahrscheinlich verloren geht?

Sobald das Problem identifiziert wurde, kann der nächste Schritt ausgeführt werden: Wahl des Algorithmus.

Diese Szenarien sind in der Praxis simpel und unrealistisch. Beim überwachten Lernen können man aus anderen Algorithmen auswählen

Diese Beispiele sind jedoch erforderlich, um die Arten von Algorithmen in der KI vollständig zu verstehen.

2. Unüberwachtes Lernen & Verstärkendes Lernen

Hier wären die Arten von Algorithmen sehr unterschiedlich und könnten in verschiedene Kategorien unterteilt werden, wie z. B. B. Gruppierung, bei der der Algorithmus ähnliche Objekte finden soll, Assoziation, bei der Verbindungen zwischen Objekten gefunden werden sollen, Dimensionsreduzierung, bei der die reduziert werden soll Anzahl der Variablen zur Rauschunterdrückung.

4. Training der Algorithmen

Sobald die Auswahl der Algorithmen abgeschlossen ist, muss das Modell trainiert und die Daten in das Modell eingegeben werden. Die Modellgenauigkeit ist hier entscheidend. Obwohl es keine internationalisierten oder allgemein akzeptierten Schwellenwerte gibt, ist es äußerst wichtig, dass die Genauigkeit des Modells innerhalb des ausgewählten Rahmens bestimmt wird. Die Festlegung eines akzeptablen Mindestschwellenwerts und die Anwendung großer statistischer Disziplin spielen eine entscheidende Rolle. Das Modell muss umgeschult werden, da die Modelle möglicherweise angepasst werden müssen. Beispielsweise sollten im Fall des Ergebnisses mit verringerter Vorhersagbarkeit des Modells alle oben genannten Schritte überprüft und verifiziert werden.

5. Auswahl der am besten geeigneten Programmiersprache für KI

Dies hängt von den Bedürfnissen und vielen Faktoren ab. Heute haben Datenwissenschaftler und einfache Benutzer Zugriff auf eine Vielzahl von Programmiersprachen, von C ++ und Java bis Python. Python und R sind derzeit die beliebtesten und am weitesten verbreiteten Programmiersprachen in der Datenwissenschaft. Beide sind sehr leistungsfähige Programmiersprachen (für die Datenanalyse), insbesondere aufgrund der vielen umfangreichen Pakete und Bibliotheken für maschinelles Lernen. Eine der sehr leistungsfähigen Bibliotheken für Computerlinguistik ist NLTK (das Natural Language Toolkit). Es ist eine Zusammenstellung von Bibliotheken und Programmen in der Programmiersprache Python.

6. Auswahl der Plattform

Sie müssen nicht unbedingt Ihren eigenen Service, Ihre eigene Datenbank usw. kaufen. Es besteht die Möglichkeit, eine vorgefertigte Plattform auszuwählen, die alle Dienste bietet.

Diese vorgefertigten Plattformen (maschinelles Lernen als Service) waren eine der nützlichsten Komponenten der Infrastruktur, dank derer sich maschinelles Lernen verbreitet hat. Ziel der Entwicklung dieser Plattformen war es, maschinelles Lernen zu erleichtern und zu vereinfachen. Sie bieten häufig fortschrittliche Cloud-basierte Analysen, die in mehrere Algorithmen und Sprachen integriert werden können.

Eine schnelle Implementierung ist entscheidend für den Erfolg des maschinellen Lernens als Dienstleistung. Plattformen helfen normalerweise bei der Lösung von Problemen wie Datenvorverarbeitung, Modelltraining und Bewertungsvorhersage. Da sie sich unterscheiden, ist eine gewisse Vorbewertung von entscheidender Bedeutung.

Die beliebtesten Plattformen sind Microsoft Azure Machine Learning, die Google Cloud Prediction API, TensorFlow und andere.

Unsere Quellen:
https://de.wikipedia.org/wiki/K%C3%BCnstliche_Intelligenz
(abgerufen am 07.04.2020 um 17:00)

https://www.computerweekly.com/de/definition/Kuenstliche-Intelligenz-KI
(abgerufen am 08.04.2020 um 09:00)

https://wirtschaftslexikon.gabler.de/definition/kuenstliche-intelligenz-ki-40285
(abgerufen am 08.04.2020 um 09:10)

https://www.salesforce.com/de/products/einstein/ai-deep-dive/
(abgerufen am 07.04.2020 um 17:10)

https://www.ionos.at/digitalguide/online-marketing/verkaufen-im-internet/was-ist-kuenstliche-intelligenz/
(abgerufen am 08.04.2020 um 09:20)

https://www.ai-united.de/ein-genauerer-ueberblick-ueber-die-hauptarten-von-modellen-des-maschinellen-lernens/
(abgerufen am 08.04.2020 um 14:40)