nathanrenting.dev
Leistung · freiberuflicher AI Engineer

KI-Agenten bauen. Produktion — keine Demo.

Ich baue KI-Agenten-Systeme, die wirklich laufen — end-to-end. LLM-Orchestrierung, Tool-Calling, RAG und die Integration in deinen bestehenden Stack. Solo, aus Eindhoven, verfügbar 2-3 Tage pro Woche für Kunden in den Niederlanden und der EU.

Womit ich helfe

Die Projekte, bei denen ich den größten Mehrwert schaffe:

  • Agenten von Grund auf aufsetzen. LLM-Orchestrierung · Tool-Calling · Memory-Layer · die gesamte Architektur. Kein Chatbot, der nur redet, sondern ein Agent, der Aufgaben erledigt und dort weitermacht, wo du gestern aufgehört hast.
  • Bestehende LLM-Integration verbessern. Routing zwischen Modellen, niedrigere Kosten, niedrigere Latenz, höhere Zuverlässigkeit. Oft mit Multi-Tier-Fallback und lokalen Modellen für die günstigen Anfragen.
  • RAG auf deinen eigenen Dokumenten aufsetzen. Embeddings, Chunking, Retrieval-Strategie, Evaluierung. Kein generisches "Load and Chat" — sondern abgestimmt auf deinen Korpus und deine Fragen.
  • Claude API-Integration. Tool-Use, MCP-Server, Streaming, Prompt Caching. Für Teams, die von einem Prototyp in die Produktion wollen, ohne in die üblichen Fallstricke zu geraten.
  • Workflow-Automatisierung mit Agenten. SDR-Agenten, Support-Flows, Rechnungsverarbeitung, Content-Pipelines. Mit den richtigen Guardrails und Monitoring, damit nichts stillschweigend kaputtgeht.

Der Stack, zu dem ich greife

Der Stack folgt dem Problem, aber das ist, was ich in der Praxis bei Agenten-Arbeit am häufigsten anfasse:

LLM
Anthropic Claude (Sonnet · Haiku · Opus). Lokal Ollama (Qwen 2.5, Llama 3.2) für günstige Routen und Offline-Fallback.
Backend
Python und FastAPI. Async I/O · Tool-Registry · Streaming. Rust, wo Latenz zählt.
Tooling
Tool-Calling · MCP · agentskills.io-Pattern (OpenClaw-kompatibel). Multi-Tier-Fallback für Produktionszuverlässigkeit.
Memory
Obsidian-Vault als Context-Repository (Letta-Stil), ADD-only-Extraction, optional Qdrant für Vector-Recall.
Infra
Supabase EU · Cloudflare R2 · Sentry EU · Stripe. Vercel oder ein eigener VPS mit Coolify, wenn es passt.
Nicht
Kein Vendor-Lock-in ohne Grund. Kein LangChain-Spaghetti. Kein Agenten-Framework, wenn 100 Zeilen Python es auch tun.

Beweis — ECHO

Ich baue nicht nur für Kunden — ich baue für mich selbst. ECHO ist mein eigener Agenten-Orchestrator, der täglich auf meinem Schreibtisch läuft. Voice-first, geroutet zwischen lokalem Ollama und Claude, eigenes Gedächtnis in einem Obsidian-Vault, ein Live-HUD mit System-Stats. Zehn Jahre Audio-DNA darunter für die Voice-Ebene.

Was ECHO für die Kundenarbeit beweist: Ich weiß, wo Agenten in der Produktion kaputtgehen, und wie man das verhindert. Die Architektur-Entscheidungen, die du früh triffst (Memory-Layer, Routing, Tool-Registry, Fallback-Strategie), bestimmen, ob du in sechs Monaten noch mit der Codebase zufrieden bist — oder ob du von vorne anfängst.

→ Über ECHO lesen

Für wen das am besten funktioniert

  • SaaS-Unternehmen, die ein KI-Feature in die Produktion bringen wollen, ohne ein festes Team einzustellen. Ein oder zwei Sprints von mir reichen oft, um es zum Laufen zu bringen.
  • Mittelstand mit interner Automatisierung. Agenten für Support, Sales-Development, Rechnungsverarbeitung, Content-Flows. Arbeit, die sonst liegen bleibt, weil es kein Team dafür gibt.
  • Solo-Gründer und kleine Teams, die die KI-Ebene unter ihrem Produkt wollen, aber lieber nicht die gesamte LLM-Ökonomie selbst durchdringen müssen.

Wie es abläuft

  1. Eine kurze Mail oder Nachricht. Was das Problem ist, eine grobe Vorstellung dessen, was du suchst, der Zeithorizont. Ein Absatz reicht.
  2. Ein Call von 30 Minuten. Passt es, scopen wir es. Passt es nicht, sage ich das auch. ECHO zeige ich live, wenn du willst.
  3. Zuerst eine bezahlte Woche. Für längere Engagements: eine Woche Arbeit, um den Rhythmus zu prüfen, bevor wir weitermachen.

Bereit loszulegen?

Tarif, Verfügbarkeit und das Formular stehen auf der Hire-Seite. Verfügbar für Kunden in den Niederlanden und EU-remote, 2-3 Tage pro Woche, aus Eindhoven.

→ Zu /hire (Tarif + Kontakt)