KI-Softwareentwickler

KI-Softwareentwickler für produktive KI im Bestandsprodukt

KI-Softwareentwickler Martin Tomczak am Schreibtisch mit Code-Editor und Architektur-Diagramm auf zwei Monitoren
  • 10+ JahreBackend- und SaaS-Entwicklung
  • DACH B2BVertrag, Sprache, Compliance
  • Senior-onlyKein Junior-Pool, kein Agenturweg
  • 24 hAntwortzeit auf Erstanfragen
  • DSGVOPflichtbewusst, kein Hype-Marketing

Was Sie als KI-Softwareentwickler von mir bekommen

Konkrete Software, kein Slidedeck. Ich entwickle KI-Funktionen direkt in Ihrem bestehenden Stack — Laravel, Spring, Django, Node, Angular oder Vue — und integriere sie so, dass Anwender den Übergang zwischen klassischer Funktion und KI-Funktion gar nicht bemerken.

Jedes Feature wird so gebaut, wie eine seriöse Backend-Funktion gebaut werden muss: mit Tests, klaren Schnittstellen, Berechtigungslogik und Logging. KI ist dabei eine Komponente, kein Sonderfall.

  • Custom Copilots in Web-Apps, SaaS-Plattformen und internen Tools
  • Semantische Suche über Verträge, Tickets, Wissensdatenbanken oder Produktkataloge
  • Dokumentenextraktion aus PDFs, Scans, E-Mails — mit Human-in-the-Loop für Edge Cases
  • RAG-Architekturen mit klaren Quellenangaben statt halluzinierten Antworten
  • LLM-Backends mit Caching, Rate Limits, Fallbacks und Cost-Caps
  • Trainings- und Übergabedokumentation für Ihr internes Team

Typische Projekte: Wofür DACH-Unternehmen mich beauftragen

Die meisten Anfragen kommen von Mittelstand und SaaS-Anbietern, die bereits eine Software im Markt haben und einen sehr konkreten Schmerzpunkt automatisieren wollen — keine grünen Wiesen, keine Forschungsprojekte.

  • SaaS-Anbieter: KI-Funktion direkt im Produkt, die Bestandskunden upgraded und Neukunden konvertiert
  • Portalbetreiber: Suche und Assistenz auf eigenen Inhalten — schneller, präziser, mehrsprachig
  • Operations-Teams: Eingangs-E-Mails klassifizieren, Tickets vorqualifizieren, CRM anreichern
  • Wissensorganisationen: RAG über interne Dokumente — Onboarding, Compliance, Support-Antworten
  • Backoffice: Rechnungen, Lieferscheine und Verträge automatisch auslesen und in ERP überführen

Was "produktionsreif" konkret heißt

Der Unterschied zwischen einem KI-Prototyp und einer produktiven KI-Funktion ist nicht das Modell, sondern alles drumherum. Genau hier scheitern die meisten Projekte, die mit einem Open-Source-Notebook starten.

Wenn ich für Sie entwickle, prüfe ich von Tag eins die folgenden Punkte – nicht erst kurz vor Go-Live.

  • Berechtigungen: Wer darf welche Daten an das Modell schicken — und wer welche Antworten sehen?
  • Logging: Jeder Prompt, jede Antwort, jedes Tool-Call mit Trace-ID, ohne Klartext-PII in Logs
  • Fehlerbehandlung: Was passiert bei Modell-Timeout, Rate Limit, ungültiger JSON-Antwort, Halluzination?
  • Cost-Caps: Pro User, pro Tag, pro Endpoint — bevor das erste Rechnung sechsstellig wird
  • Evaluierung: Eine messbare Qualitätsmetrik, nicht nur Bauchgefühl
  • Datenschutz: DSGVO-konforme Verarbeitung, EU-Rechenzentren oder On-Prem-Modelle wo gefordert

Tech-Stack — was ich nutze und warum

Ich bin nicht religiös bei Tools. Die Wahl folgt der Aufgabe und Ihrem Bestandssystem. Was ich vermeide: Vendor-Lock-in dort, wo es vermeidbar ist.

  • LLMs: Claude (Anthropic), GPT (OpenAI), Mistral, Llama — abhängig von Latenz, Kosten und Daten-Hosting-Vorgaben
  • Embeddings & Vektorsuche: Qdrant, pgvector, Pinecone — je nach Volumen und Hosting-Setup
  • Backend: Laravel, Node/Express/Fastify, Python (FastAPI), .NET — meistens das, was Sie bereits haben
  • Frontend: React/Next.js, Vue, Angular — KI-UI direkt in bestehende Komponenten integriert
  • Hosting: Azure (Functions, Container Apps), AWS, Hetzner, On-Prem — DSGVO und Souveränität zuerst
  • Observability: Application Insights, OpenTelemetry, strukturierte Logs — kein Black-Box-Betrieb

Wie ein Projekt typischerweise abläuft

Drei Phasen, jede mit klarem Ergebnis. Wenn nach Phase eins kein Sinn da ist, brechen wir ab — ohne Mehrkosten und ohne politisches Drama.

  • 1. Discovery (1–2 Wochen, Festpreis): Anwendungsfall, Datenlage, Architekturskizze, realistischer Aufwand. Liefergegenstand: Implementierungsplan und Risiken.
  • 2. MVP (3–6 Wochen): Kleinster sinnvoller Funktionsumfang in Ihrem Stack, mit Logging und Tests. Liefergegenstand: lauffähiges Feature in Staging.
  • 3. Rollout & Übergabe (1–2 Wochen): Produktiv-Deploy, Monitoring, Kostenüberwachung, Schulung Ihres Teams. Liefergegenstand: Ihr Team kann allein weiterentwickeln.

Was Sie ausdrücklich nicht von mir bekommen

Genauso wichtig wie das Liefermodell ist, wofür ich nicht zur Verfügung stehe. Das spart beiden Seiten Zeit.

  • Keine generischen ChatGPT-Wrapper, die Sie auch selbst in zwei Tagen bauen können
  • Keine Pitch-Decks, Buzzword-Workshops oder "AI Strategy Frameworks" ohne Code dahinter
  • Keine Junior-Backed Outsourcing-Setups — ich arbeite direkt, oder ich arbeite nicht
  • Keine Modell-Prahlerei statt Use-Case: Welches Modell genau zum Einsatz kommt, wird im Discovery entschieden, nicht im Vertrag

Wer ich bin

Martin Tomczak, Senior KI-Softwareentwickler aus Deutschland. Über zehn Jahre Erfahrung mit Backend, APIs, Portalen und SaaS-Plattformen — die letzten Jahre fast ausschließlich an der Schnittstelle zu KI-Funktionen für DACH-B2B.

Ich arbeite remote, deutschsprachig, mit deutschem Vertrag und deutscher Rechnung. Alle Kommunikation läuft direkt mit mir, ohne Account Manager und ohne Tickets-an-fremde-Teams. Wenn Sie genau das suchen, sind Sie hier richtig.

Häufige Fragen

Was kostet ein KI-Projekt mit Ihnen ungefähr?
Das Discovery (1–2 Wochen) ist Festpreis und liegt typischerweise zwischen 4.000 und 8.000 EUR netto, je nach Umfang und Datenlage. Die MVP-Phase wird auf Tagessatz oder Sprintpreis abgerechnet — meistens zwischen 25.000 und 80.000 EUR netto, abhängig von Tiefe und Integrationen. Sie bekommen vor jeder Phase eine konkrete Zahl, nicht eine Spanne mit Sternchen.
Wie lange dauert ein typisches Projekt vom Erstkontakt bis Go-Live?
Discovery 1–2 Wochen. MVP 3–6 Wochen. Rollout 1–2 Wochen. In Summe also 5–10 Wochen für ein klar abgegrenztes Feature — vorausgesetzt, die Datenlage ist im Discovery sauber geklärt. Reine ChatGPT-Wrapper laufen schneller, echte RAG-Systeme mit Bestandsdaten oft länger.
Arbeiten Sie remote oder vor Ort beim Kunden?
Standardmäßig remote — das ist effizienter für beide Seiten. Für Discovery-Workshops, Architektur-Reviews oder Kickoffs komme ich gern in den DACH-Raum. Ich arbeite nicht im Modus "vier Tage pro Woche im Kundenbüro".
Welche LLMs nutzen Sie — und können wir die Modelle selbst hosten?
Claude (Anthropic), GPT (OpenAI), Mistral und Open-Weights-Modelle wie Llama. Die Wahl folgt Ihrem Anwendungsfall: Latenz, Kosten, Datenschutz und Hosting-Vorgaben. Self-Hosting via Azure ML, AWS Bedrock, Hetzner GPU oder On-Prem ist möglich — kostet aber spürbar mehr Engineering und ist nicht für jeden Use Case sinnvoll.
Wie gewährleisten Sie DSGVO-Konformität, wenn Daten an US-Modelle gehen?
Drei Pfade, je nach Sensitivität: (1) EU-Region beim Anbieter und Auftragsverarbeitungsvertrag, (2) Pre-Processing mit PII-Maskierung vor Modell-Call, (3) On-Prem oder europäisches Modell. Die Wahl ist ein Compliance-Gespräch im Discovery, kein Implementierungs-Detail.
Können Sie mit unserem Bestandssystem arbeiten — oder bauen Sie alles neu?
Bestandssystem zuerst. Ich rolle in Laravel, Django, Spring Boot, .NET, Node und Python ein. Greenfield gibt es nur, wenn das Bestandssystem nachweislich blockiert — und auch dann starte ich nicht ohne Migrationsplan. KI ist eine Komponente, keine Refactoring-Ausrede.
Was unterscheidet KI-Softwareentwicklung von KI-Beratung?
KI-Beratung produziert Folien, Roadmaps und Potenzialanalysen. KI-Softwareentwicklung produziert lauffähigen, getesteten, betriebsfähigen Code, der nach dem Projekt für Sie weiter Geld verdient oder Kosten spart. Ich mache das zweite. Wenn Sie eine Strategie-Folie brauchen, sind Sie woanders besser bedient.
Was passiert, wenn das Modell halluziniert oder unsinnige Antworten gibt?
Genau dafür gibt es Architektur statt Magie: harte Validierung der Antworten gegen JSON-Schemas, RAG mit Quellenangaben, Confidence-Scoring, Eskalation an Human-in-the-Loop für niedrige Confidence, Evaluation-Pipelines vor jedem Deploy. Halluzinationen sind nicht vermeidbar, aber sie sind beherrschbar — und das ist die eigentliche Engineering-Aufgabe.

Bereit loszulegen?

Schildern Sie kurz Ihr Projekt — ich melde mich innerhalb von 24 Stunden.

Die Sicherheitsfrage wird geladen …