Location

Berlin, Remote

Employment Type

Vollzeit

Location Type

Hybrid

Department

Engineering

Compensation

€90K – €120K

Bietet Equity

Wettbewerbsfähige Vergütung und Equity in einem AI-Unternehmen mit hoher Wirkung.

Software Engineer - Modell Performance

Modell Performance

Schließen Sie sich dem Kerningenieurteam von Atmantara an, um die Performance von AI-Modellbereitstellungen in Fintech-Anwendungsfällen zu verbessern.

About

Atmantara entwickelt grundlegende AI-Infrastruktur für Finanzinstitute. Von Echtzeit-Betrugserkennung bis hin zu Multi-Modell-Portfoliooptimierung ermöglichen wir Finanzteams skalierbare, sichere und konforme AI-Fähigkeiten, ohne technischen Overhead. Unsere Plattform unterstützt Cloud-native und hybride Implementierungen mit integrierter Beobachtbarkeit, rollenbasierter Zugriffskontrolle und regulatorischer Compliance (SOC 2, GDPR, PSD2, MiFID II).

Wir sind ein hochdynamisches Team mit Sitz in Berlin und Remote-Mitarbeitern, das an der Schnittstelle von AI, Infrastruktur und Fintech arbeitet.

Role

Sie arbeiten an der Performance, Skalierbarkeit und Latenz von AI-Workloads, die Echtzeit-Entscheidungen in Finanzsystemen unterstützen. Von der Optimierung von Inferenz-Pipelines bis hin zu Tools für Modellbewertung und -bereitstellung entwickeln Sie Systeme, die schnelle, zuverlässige Ergebnisse für unsere Kunden liefern.

Sie arbeiten mit Infra- und Produktteams zusammen, um sicherzustellen, dass Modelle unter realen Fintech-Einschränkungen funktionieren: Latenz, Parallelität, Durchsatz und Compliance.

Responsibilities

Optimierung der Inferenz-Serving-Infrastruktur für LLMs und Klassifizierungsmodelle
Entwicklung von Observability-Tools zur Überwachung von Modelllatenz, Durchsatz und Performance
Design von Benchmarks und Test-Frameworks zur Validierung der Modellperformance
Unterstützung der Modellbereitstellung in Produktionsumgebungen über hybride Infrastruktur
Zusammenarbeit mit Research Engineers, um die Lücke zwischen Modell-Design und -Bereitstellung zu schließen

Requirements

Starker Hintergrund in Backend- oder Systemprogrammierung (Go, Rust, Python oder ähnlich)
Erfahrung mit ML-Inferenz-Frameworks (TorchServe, TensorRT, Triton, etc.)
Sicherer Umgang mit latenzempfindlichen, produktionsreifen Systemen
Erfahrung mit Containern, Orchestrierung (Kubernetes, Docker, etc.)
Vertrautheit mit Observability-Stacks (Prometheus, Grafana, OpenTelemetry)

Bonus Experience

Erfahrung mit Hochdurchsatz-Finanzsystemen oder Trading-Infrastruktur
Entwicklung von benutzerdefiniertem Model-Serving oder Scaling-Infra in einem früheren Unternehmen
Erfahrung mit asynchroner Programmierung, Queues und Batch-Systemen
Beiträge zu Open-Source-Modellbereitstellung oder Performance-Tools

What We Offer

Wettbewerbsfähiges Gehalt und Equity in der Frühphase
Flexibles Remote-First-Setup mit zentralem Hub in Berlin
Jährliches Budget für Lernen & Entwicklung
Elternzeit und dediziertes Wellness-Budget
Übernahme der öffentlichen Verkehrsmittel oder Mobilitätszuschuss
Firmenlaptop und vollständige Remote-Arbeitsplatzausstattung
Freitagabend-Essen und Drinks
Jährliche Team-Events und internationale Retreats
Regelmäßige Gastvorträge von AI- und Fintech-Industrieführern
Dedizierte Fokus-Tage, keine internen Meetings, Deep Work wird gefördert

How We Work

Wir glauben, dass AI-Infrastruktur finanzielle Intelligenz beschleunigen sollte. Atmantara ermöglicht schlanken, fokussierten Teams autonomes Arbeiten mit tiefer Zusammenarbeit. Wir messen Erfolg an echten Ergebnissen: Finanzinstituten zu helfen, intelligentere Modelle schneller zu implementieren, ohne Engpässe oder Komplexität.

Wenn Sie sich darauf freuen, die Plattform zu entwickeln, die die nächste Generation der AI in der Finanzwelt antreibt, würden wir uns gerne mit Ihnen unterhalten.

Mit Ihrer Bewerbung stimmen Sie unseren Nutzungsbedingungen und Datenschutzrichtlinien