Location
Berlin, Remote
Employment Type
Vollzeit
Location Type
Hybrid
Department
Engineering
Compensation
€90K – €120K
Bietet Equity
Wettbewerbsfähige Vergütung und Equity in einem AI-Unternehmen mit hoher Wirkung.
Logo

Software Engineer - Modell Performance

Modell Performance

Schließen Sie sich dem Kerningenieurteam von Atmantara an, um die Performance von AI-Modellbereitstellungen in Fintech-Anwendungsfällen zu verbessern.

About

Atmantara entwickelt grundlegende AI-Infrastruktur für Finanzinstitute. Von Echtzeit-Betrugserkennung bis hin zu Multi-Modell-Portfoliooptimierung ermöglichen wir Finanzteams skalierbare, sichere und konforme AI-Fähigkeiten, ohne technischen Overhead. Unsere Plattform unterstützt Cloud-native und hybride Implementierungen mit integrierter Beobachtbarkeit, rollenbasierter Zugriffskontrolle und regulatorischer Compliance (SOC 2, GDPR, PSD2, MiFID II).

Wir sind ein hochdynamisches Team mit Sitz in Berlin und Remote-Mitarbeitern, das an der Schnittstelle von AI, Infrastruktur und Fintech arbeitet.

Role

Sie arbeiten an der Performance, Skalierbarkeit und Latenz von AI-Workloads, die Echtzeit-Entscheidungen in Finanzsystemen unterstützen. Von der Optimierung von Inferenz-Pipelines bis hin zu Tools für Modellbewertung und -bereitstellung entwickeln Sie Systeme, die schnelle, zuverlässige Ergebnisse für unsere Kunden liefern.

Sie arbeiten mit Infra- und Produktteams zusammen, um sicherzustellen, dass Modelle unter realen Fintech-Einschränkungen funktionieren: Latenz, Parallelität, Durchsatz und Compliance.

Responsibilities
  • Optimierung der Inferenz-Serving-Infrastruktur für LLMs und Klassifizierungsmodelle
  • Entwicklung von Observability-Tools zur Überwachung von Modelllatenz, Durchsatz und Performance
  • Design von Benchmarks und Test-Frameworks zur Validierung der Modellperformance
  • Unterstützung der Modellbereitstellung in Produktionsumgebungen über hybride Infrastruktur
  • Zusammenarbeit mit Research Engineers, um die Lücke zwischen Modell-Design und -Bereitstellung zu schließen
Requirements
  • Starker Hintergrund in Backend- oder Systemprogrammierung (Go, Rust, Python oder ähnlich)
  • Erfahrung mit ML-Inferenz-Frameworks (TorchServe, TensorRT, Triton, etc.)
  • Sicherer Umgang mit latenzempfindlichen, produktionsreifen Systemen
  • Erfahrung mit Containern, Orchestrierung (Kubernetes, Docker, etc.)
  • Vertrautheit mit Observability-Stacks (Prometheus, Grafana, OpenTelemetry)
Bonus Experience
  • Erfahrung mit Hochdurchsatz-Finanzsystemen oder Trading-Infrastruktur
  • Entwicklung von benutzerdefiniertem Model-Serving oder Scaling-Infra in einem früheren Unternehmen
  • Erfahrung mit asynchroner Programmierung, Queues und Batch-Systemen
  • Beiträge zu Open-Source-Modellbereitstellung oder Performance-Tools
What We Offer
  • Wettbewerbsfähiges Gehalt und Equity in der Frühphase
  • Flexibles Remote-First-Setup mit zentralem Hub in Berlin
  • Jährliches Budget für Lernen & Entwicklung
  • Elternzeit und dediziertes Wellness-Budget
  • Übernahme der öffentlichen Verkehrsmittel oder Mobilitätszuschuss
  • Firmenlaptop und vollständige Remote-Arbeitsplatzausstattung
  • Freitagabend-Essen und Drinks
  • Jährliche Team-Events und internationale Retreats
  • Regelmäßige Gastvorträge von AI- und Fintech-Industrieführern
  • Dedizierte Fokus-Tage, keine internen Meetings, Deep Work wird gefördert
How We Work

Wir glauben, dass AI-Infrastruktur finanzielle Intelligenz beschleunigen sollte. Atmantara ermöglicht schlanken, fokussierten Teams autonomes Arbeiten mit tiefer Zusammenarbeit. Wir messen Erfolg an echten Ergebnissen: Finanzinstituten zu helfen, intelligentere Modelle schneller zu implementieren, ohne Engpässe oder Komplexität.

Wenn Sie sich darauf freuen, die Plattform zu entwickeln, die die nächste Generation der AI in der Finanzwelt antreibt, würden wir uns gerne mit Ihnen unterhalten.

Mit Ihrer Bewerbung stimmen Sie unseren Nutzungsbedingungen und Datenschutzrichtlinien