tempera
Warteliste

Feinabgestimmte LLMs für Unternehmen

Trainieren Sie kleinere, einsetzbare Modelle auf den proprietären Daten und Workflows nach, die Frontier-Labs auslassen — Finanzen, Recht, Operations und darüber hinaus.

Feinabstimmung

Trainieren Sie nach, was Frontier-Labs auslassen

Frontier-RL-Umgebungen decken Ihre 10-Ks, Ihre Trading-Desks oder Ihre Underwriting-Playbooks nicht ab. Wir tun es — und verwandeln Ihre Domäne in ein Modell, das ein gewöhnliches kommerzielles LLM bei der Arbeit, die Ihnen wichtig ist, übertrifft.

R+0.73ppogrpodpo

Domänen-Daten

Proprietäre Korpora, Spuren und Tool-Aufrufe werden zum Trainingssignal.

RSI

Vom Reinforcement Learning zu echter Generalisierung

Unsere Mission ist es, das Post-Training über Reinforcement Learning hinaus zu echter Generalisierung zu führen — Modelle, die in Ihrer Domäne schließen, nicht nur auf akademischen Benchmarks. Wir kommen dorthin, indem wir state-of-the-art Methoden durch rekursive agentische Selbstverbesserung entdecken und iterieren.

Der Loop

Der Post-Training-Loop, automatisiert

Drei Primitive, ein geschlossener Loop, wiederholt bis das Modell generalisiert.

schritt 01→ nächster

Gestalten

Definieren Sie Umgebungen, Aktionen, Werkzeuge und Belohnungen in einer typsicheren, versionierten API.

schritt 02→ nächster

Rollout

Führen Sie tausende parallele Rollouts aus; jeder Schritt verfolgt, jede Belohnung zugeordnet.

schritt 03↺ wiederholen

Trainieren

Tempera erforscht Post-Training-Methoden auf Ihren Daten und liefert das Modell, das am besten generalisiert.

API

Drei Aufrufe. Ein Loop

Komponieren Sie Umgebungen, Rollouts und Training in einer einzigen typisierten Oberfläche.

import { tempera } from "@tempera/sdk";

// Definiere die Welt, in der dein Modell trainiert.
const env = await tempera.envs.create({
  name: "research-assistant",
  observation: { kind: "text" },
  action: {
    kind: "tool-use",
    tools: ["search", "shell", "browse"],
  },
  reward: { fn: "./rewards/helpfulness.ts" },
});

env.publish({ tag: "v1" });

Bereitstellung

Ihr Modell. Ihr Perimeter

Feinabgestimmte Modelle laufen dort, wo Ihre Daten leben. Wählen Sie das Isolationsmodell, das zu Ihrer Sicherheits- und Compliance-Haltung passt.

01

VPC · Single-Tenant

Eine dedizierte Control- und Data-Plane in Ihrem Cloud-Konto. Keine geteilten Ressourcen, keine geteilten Gewichte.

  • Läuft in Ihrer AWS-, GCP- oder Azure-VPC
  • Dedizierte GPUs und Inferenz-Endpunkte
  • Daten und Gewichte verlassen Ihr Konto nie
02

VPC · Multi-Tenant

Geteilte gemanagte Control-Plane mit pro Kunde isolierten Data-Planes. Schnelleres Onboarding, niedrigere TCO.

  • Tempera-gemanagte Control-Plane
  • Pro Mandant isolierte Inferenz
  • SOC 2-konforme Mandantengrenzen
03

On-Prem

Air-Gapped-Bereitstellung auf Ihrer Hardware für die am stärksten regulierten Umgebungen.

  • Läuft auf Ihren eigenen GPU-Clustern
  • Offline / Air-Gapped unterstützt
  • Bringen Sie Ihr eigenes KMS, Ihren IdP und Ihre Audit-Log-Senken mit

Karriere

Mach mit

Kleines Team, große Ideen, unendliche Mission.

Forschung

vollzeit · vor Ort in San Francisco

Forschen Sie zu Post-Training, Generalisierung, Weltmodellen und rekursiver Selbstverbesserung.

Bewerbenfounders@tempera.dev

Forschungs­infrastruktur

vollzeit · vor Ort in San Francisco

Bauen Sie umfassende Scheduling-, verteilte Trainings- und Observability-Systeme, die Forschung ermöglichen.

Bewerbenfounders@tempera.dev

Machine Learning

vollzeit · vor Ort in San Francisco

Bringen Sie Forschung in die Produktion.

Bewerbenfounders@tempera.dev

Offene Bewerbung

vollzeit · vor Ort in San Francisco

Wir suchen ständig talentierte Menschen aus allen Disziplinen, die sich uns anschließen möchten.

Bewerbenfounders@tempera.dev

Warteliste

Bringen Sie Ihre Daten. Liefern Sie ein Modell

Tragen Sie sich für die erste Kohorte in die Warteliste ein, oder schreiben Sie den Gründern direkt.