nathanrenting.dev
Dienst · freelance AI engineer

AI agents bouwen. Productie || niet demo.

Ik bouw AI agent systemen die echt draaien || end-to-end. LLM-orchestratie, tool-calling, RAG, en de integratie in je bestaande stack. Solo, vanuit Eindhoven, beschikbaar 2-3 dagen per week voor klanten in Nederland en de EU.

Waar ik mee help

De projecten waar ik het meeste waarde toevoeg:

  • Agent vanaf nul opzetten. LLM-orchestratie || tool-calling || geheugen-laag || de hele architectuur. Niet een chatbot die alleen praat, wel een agent die taken uitvoert en doorgaat waar je gisteren stopte.
  • Bestaande LLM-integratie verbeteren. Routing tussen modellen, kosten omlaag, latency omlaag, betrouwbaarheid omhoog. Vaak met multi-tier fallback en lokale modellen voor de goedkope vragen.
  • RAG opzetten op je eigen documenten. Embeddings, chunking, retrieval-strategie, evaluatie. Geen generieke "load and chat" || wel geconfigureerd op jouw corpus en jouw vragen.
  • Claude API integratie. Tool-use, MCP-servers, streaming, prompt caching. Voor teams die van een prototype naar productie willen zonder de standaard valkuilen tegen te komen.
  • Workflow-automatisering met agents. SDR-agents, support-flows, factuurverwerking, content-pipelines. Met de juiste guardrails en monitoring zodat het niet stilletjes kapot gaat.

De stack die ik pak

Stack volgt het probleem, maar dit is wat ik in praktijk het meeste raak voor agent-werk:

LLM
Anthropic Claude (Sonnet || Haiku || Opus). Lokaal Ollama (Qwen 2.5, Llama 3.2) voor goedkope routes en offline-fallback.
Backend
Python en FastAPI. Async I/O || tool-registry || streaming. Rust waar latency telt.
Tooling
Tool-calling || MCP || agentskills.io-patroon (OpenClaw-compatibel). Multi-tier fallback voor productie-betrouwbaarheid.
Memory
Obsidian-vault als context-repository (Letta-stijl), ADD-only extraction, optionele Qdrant voor vector-recall.
Infra
Supabase EU || Cloudflare R2 || Sentry EU || Stripe. Vercel of een eigen VPS met Coolify als het past.
Niet
Geen vendor lock-in zonder reden. Geen LangChain-spaghetti. Geen agent-framework als 100 regels Python het ook doet.

Bewijs || ECHO

Ik bouw niet alleen voor klanten || ik bouw voor mezelf. ECHO is mijn eigen agent-orchestrator die dagelijks draait op mijn bureau. Voice-first, routed tussen lokaal Ollama en Claude, eigen geheugen in een Obsidian-vault, live HUD met system stats. Tien jaar audio-DNA eronder voor de voice-laag.

Wat ECHO bewijst voor klantwerk: ik weet waar agents breken in productie, en hoe je dat voorkomt. De architectuur-keuzes die je vroeg maakt (memory-laag, routing, tool-registry, fallback-strategie) bepalen of je over zes maanden nog steeds blij bent met de codebase || of dat je opnieuw begint.

→ Lees over ECHO

Voor wie dit het beste werkt

  • SaaS-bedrijven die een AI-feature naar productie willen krijgen zonder een vast team aan te nemen. Eén of twee sprints van mij is vaak genoeg om het werkend te krijgen.
  • MKB met interne automatisering. Agents voor support, sales-development, factuurverwerking, content-flows. Werk dat anders blijft liggen omdat er geen team voor is.
  • Solo founders en kleine teams die de AI-laag onder hun product willen, maar liever niet zelf de hele LLM-economie hoeven uit te zoeken.

Hoe het werkt

  1. Korte mail of bericht. Wat het probleem is, ruwe vorm van wat je zoekt, tijdshorizon. Eén alinea is genoeg.
  2. Call van 30 minuten. Klikt het, scopen we het. Klikt het niet, zeg ik dat ook. ECHO laat ik live zien als je dat wil.
  3. Eén betaalde week eerst. Voor langere engagements: één week werken om het ritme te checken voordat we doortrekken.

Klaar om te starten?

Tarief, beschikbaarheid en het formulier staan op de hire-pagina. Beschikbaar voor klanten in Nederland en EU remote, 2-3 dagen per week, vanuit Eindhoven.

→ Naar /hire (tarief + contact)