Feinabgestimmte LLMs für Unternehmen

Trainieren Sie kleinere, einsetzbare Modelle auf den proprietären Daten und Workflows nach, die Frontier-Labs auslassen — Finanzen, Recht, Operations und darüber hinaus.

Auf die Warteliste Gründer kontaktieren

Feinabstimmung

Trainieren Sie nach, was Frontier-Labs auslassen

Frontier-RL-Umgebungen decken Ihre 10-Ks, Ihre Trading-Desks oder Ihre Underwriting-Playbooks nicht ab. Wir tun es — und verwandeln Ihre Domäne in ein Modell, das ein gewöhnliches kommerzielles LLM bei der Arbeit, die Ihnen wichtig ist, übertrifft.

Domänen-Daten

Proprietäre Korpora, Spuren und Tool-Aufrufe werden zum Trainingssignal.

RSI

Vom Reinforcement Learning zu echter Generalisierung

Unsere Mission ist es, das Post-Training über Reinforcement Learning hinaus zu echter Generalisierung zu führen — Modelle, die in Ihrer Domäne schließen, nicht nur auf akademischen Benchmarks. Wir kommen dorthin, indem wir state-of-the-art Methoden durch rekursive agentische Selbstverbesserung entdecken und iterieren.

entdecken

Frontier-Modelle

Agenten scannen SOTA-Modellreleases, Papers und Methodenspuren nach Kandidaten, die Tests wert sind.

experimentieren

Interne Iteration

ablation / rollout / bewertung

Wir führen Rollouts, Ablationen und Reward-Checks aus, bis eine Methode in realistischen Aufgaben besser wird.

bereitstellen

API-Endpunkte

endpunkt veröffentlicht

Die besten Varianten werden Endpunkte, die Sie in Ihrer Domain aufrufen, kombinieren und evaluieren können.

feedback

Ergebnisse zurückführen

evals / spuren

Produktionsspuren und Evals fließen in den nächsten Suchzyklus zurück, damit sich das System selbst verbessert.

Der Loop

Der Post-Training-Loop, automatisiert

Drei Primitive, ein geschlossener Loop, wiederholt bis das Modell generalisiert.

schritt 01→ nächster

Gestalten

Definieren Sie Umgebungen, Aktionen, Werkzeuge und Belohnungen in einer typsicheren, versionierten API.

schritt 02→ nächster

Rollout

Führen Sie tausende parallele Rollouts aus; jeder Schritt verfolgt, jede Belohnung zugeordnet.

schritt 03↺ wiederholen

Trainieren

Tempera erforscht Post-Training-Methoden auf Ihren Daten und liefert das Modell, das am besten generalisiert.

API

Drei Aufrufe. Ein Loop

Komponieren Sie Umgebungen, Rollouts und Training in einer einzigen typisierten Oberfläche.

01_author.ts

import { tempera } from "@tempera/sdk";

// Definiere die Welt, in der dein Modell trainiert.
const env = await tempera.envs.create({
  name: "research-assistant",
  observation: { kind: "text" },
  action: {
    kind: "tool-use",
    tools: ["search", "shell", "browse"],
  },
  reward: { fn: "./rewards/helpfulness.ts" },
});

env.publish({ tag: "v1" });

Bereitstellung

Ihr Modell. Ihr Perimeter

Feinabgestimmte Modelle laufen dort, wo Ihre Daten leben. Wählen Sie das Isolationsmodell, das zu Ihrer Sicherheits- und Compliance-Haltung passt.

VPC · Single-Tenant

Eine dedizierte Control- und Data-Plane in Ihrem Cloud-Konto. Keine geteilten Ressourcen, keine geteilten Gewichte.

Läuft in Ihrer AWS-, GCP- oder Azure-VPC
Dedizierte GPUs und Inferenz-Endpunkte
Daten und Gewichte verlassen Ihr Konto nie

VPC · Multi-Tenant

Geteilte gemanagte Control-Plane mit pro Kunde isolierten Data-Planes. Schnelleres Onboarding, niedrigere TCO.

Tempera-gemanagte Control-Plane
Pro Mandant isolierte Inferenz
SOC 2-konforme Mandantengrenzen

On-Prem

Air-Gapped-Bereitstellung auf Ihrer Hardware für die am stärksten regulierten Umgebungen.

Läuft auf Ihren eigenen GPU-Clustern
Offline / Air-Gapped unterstützt
Bringen Sie Ihr eigenes KMS, Ihren IdP und Ihre Audit-Log-Senken mit

Karriere

Mach mit

Kleines Team, große Ideen, unendliche Mission.

Forschung

vollzeit · vor Ort in San Francisco

Forschen Sie zu Post-Training, Generalisierung, Weltmodellen und rekursiver Selbstverbesserung.

Bewerben → founders@tempera.dev

Forschungsinfrastruktur

vollzeit · vor Ort in San Francisco

Bauen Sie umfassende Scheduling-, verteilte Trainings- und Observability-Systeme, die Forschung ermöglichen.

Bewerben → founders@tempera.dev

Machine Learning

vollzeit · vor Ort in San Francisco

Bringen Sie Forschung in die Produktion.

Bewerben → founders@tempera.dev

Offene Bewerbung

vollzeit · vor Ort in San Francisco

Wir suchen ständig talentierte Menschen aus allen Disziplinen, die sich uns anschließen möchten.

Bewerben → founders@tempera.dev

Warteliste

Bringen Sie Ihre Daten. Liefern Sie ein Modell

Tragen Sie sich für die erste Kohorte in die Warteliste ein, oder schreiben Sie den Gründern direkt.

Auf die Warteliste founders@tempera.dev

Feinabgestimmte LLMs für UnternehmenFeinabgestimmte LLMs für Unternehmen

Trainieren Sie nach, was Frontier-Labs auslassen

Vom Reinforcement Learning zu echter Generalisierung

Frontier-Modelle

Interne Iteration

API-Endpunkte

Ergebnisse zurückführen

Der Post-Training-Loop, automatisiert

Gestalten

Rollout

Trainieren

Drei Aufrufe. Ein Loop

Ihr Modell. Ihr Perimeter

VPC · Single-Tenant

VPC · Multi-Tenant

On-Prem

Mach mit

Forschung

Forschungs­infrastruktur

Machine Learning

Offene Bewerbung

Bringen Sie Ihre Daten. Liefern Sie ein Modell

Feinabgestimmte LLMs für Unternehmen

Forschungsinfrastruktur