KI Agenten einfach erklärt: Was sie sind und wie du einen baust

KI Agenten sind überall in den Schlagzeilen. Aber was genau ist ein KI-Agent? Die gute Nachricht: Es ist deutlich einfacher als du vielleicht denkst. Wenn du schon einmal mit ChatGPT oder Claude gearbeitet hast, verstehst du auch KI Agenten.

In diesem Artikel erkläre ich das Konzept und zeige dir, wie du einen einfachen Agenten selbst nachbauen kannst.

Video: KI Agenten Schritt für Schritt erklärt

Den kompletten Aufbau habe ich als Tutorial aufgenommen. Du siehst, wie das Konzept funktioniert und wie ein Agent in n8n entsteht:

Was ist ein KI-Agent?

KI Agenten Definition: LLM plus Tools ergeben einen KI-Agenten

Ein KI-Agent ist nicht viel mehr als ein Large Language Model (LLM), das Software bedienen kann. Das ist das ganze Geheimnis. Kein kompliziertes System, keine mysteriöse Technologie. Ein LLM mit der Fähigkeit, externe Tools zu nutzen.

Um das zu verstehen, müssen wir uns zunächst ein anderes Konzept anschauen: APIs.

Was ist eine API?

API steht für Application Programming Interface. Das klingt technisch, lässt sich aber einfach erklären.

Nimm als Beispiel eine Mikrowelle. Als Mensch bedienst du sie über Knöpfe und Tasten. Du drückst auf Start, stellst die Zeit ein, wählst die Leistung. Das ist die Schnittstelle für Menschen.

Theoretisch könnte man die Mikrowelle aber auch anders steuern: per elektrischen Signalen. Eine Platine könnte angeschlossen werden, die Befehle von einem Computer empfängt und die Mikrowelle entsprechend steuert. Das wäre die Schnittstelle für Maschinen.

Zwei Wege Software zu bedienen: GUI für Menschen, API für Programme

Bei Software ist es genauso. Ein E-Mail-Programm wie Outlook hat eine grafische Oberfläche (GUI). Du klickst auf Felder, tippst Text ein, drückst Senden. Aber Outlook hat auch eine API: Andere Programme können dieselben Aktionen ausführen, ohne dass ein Mensch klickt. Sie senden strukturierte Daten an die richtige Stelle.

Das Prinzip:

GUI (Graphical User Interface): Für Menschen, mit Maus und Tastatur
API (Application Programming Interface): Für Programme, mit strukturierten Daten

Alles was es braucht, um Software zu bedienen, ist also Texteingabe in die richtigen Felder. Betreff, Empfänger, Nachricht. Das sind strukturierte Daten.

Warum LLMs perfekt für APIs sind

Jetzt wird es interessant. Was können Large Language Models sehr gut? Text schreiben.

Und was brauchen APIs? Text in den richtigen Feldern.

Wie ein LLM Software bedient: Text generieren und in API-Felder schreiben

Das bedeutet: Ein LLM kann theoretisch jede Software bedienen, die eine API hat. Es generiert den passenden Text für jedes Feld. Betreff? “Treffen mit Andrea”. Nachricht? “Hallo Andrea, ich würde mich gerne mit dir treffen.” Empfänger? Die entsprechende E-Mail-Adresse.

Das LLM füllt die Felder aus, die ein Mensch sonst manuell befüllen würde. Nur automatisch und basierend auf einer natürlichsprachlichen Anweisung.

Der Aufbau eines KI-Agenten

Was in einem KI-Agenten steckt: Agent-Node verbindet Chat-Modell, Memory und Tools

Ein KI-Agent in einer Automatisierungsplattform wie n8n besteht aus drei Hauptkomponenten:

Das Chat-Modell: Die KI, die Text versteht und generiert (Gemini, Claude, GPT oder andere)
Das Memory (optional): Ermöglicht dem Agenten, sich an vorherige Nachrichten zu erinnern
Die Tools: Die Software-Schnittstellen, die der Agent bedienen kann (Outlook, Kalender, CRM, …)

Der Agent selbst ist der Verbinder. Er nimmt eine Anweisung entgegen, lässt das Chat-Modell arbeiten und ruft bei Bedarf die passenden Tools auf.

Ein einfacher Agent in n8n

Lass uns das Ganze praktisch nachbauen. Wir erstellen einen Agenten, der auf Anweisung eine E-Mail verschickt.

Die Komponenten

Der Workflow braucht:

Einen Chat-Trigger (für die Eingabe)
Einen AI Agent Node (das Herzstück)
Ein Chat-Modell (z.B. Gemini)
Ein Tool (Outlook zum Mail-Versand)

So funktioniert es

Du gibst dem Agenten eine Anweisung: “Sende eine Mail an Andrea, in der du sie nach einem Treffen fragst. Ergänze eigenständig alle fehlenden Informationen.”

Der Agent verarbeitet diese Anweisung. Das Chat-Modell generiert einen passenden Betreff und Mailtext. Dann ruft der Agent das Outlook-Tool auf und füllt die entsprechenden Felder aus: Empfänger, Betreff, Nachricht.

Das Ergebnis: Eine E-Mail wird verschickt. Ohne dass du etwas tippen musstest außer der Anweisung.

Der entscheidende Punkt bei den Tool-Einstellungen: Die Felder für Betreff und Nachricht werden vom Modell automatisch befüllt (“defined automatically by the model”). Das bedeutet, die KI entscheidet selbst, was sie schreibt, basierend auf deiner Anweisung.

Das Fazit

KI Agenten sind keine komplizierte Technologie. Sie sind LLMs mit der Fähigkeit, Software über APIs zu bedienen. Das ist das ganze Konzept.

Ein LLM kann Text generieren
Software braucht Text in Feldern
Also kann ein LLM Software bedienen

Mit diesem Verständnis kannst du selbst Agenten bauen. Die Automatisierungsplattform n8n macht den Einstieg einfach: visueller Builder, vorgefertigte Tool-Integrationen, detaillierte Logs zum Nachvollziehen.

Wenn du tiefer einsteigen willst, findest du im Tutorial für deinen ersten Mail-Agenten eine ausführliche Anleitung. Und falls du Unterstützung beim Aufbau von KI-Agenten für dein Unternehmen brauchst, melde dich bei mir.

Weiterlesen: