tempera
वेटलिस्ट

एंटरप्राइज़ के लिए फ़ाइन-ट्यून्ड LLMs

उन प्रोप्राइटरी डेटा और workflows पर छोटे, deploy-करने-योग्य मॉडल पोस्ट-ट्रेन करें जिन्हें frontier labs छोड़ देते हैं — वित्त, क़ानून, ऑपरेशंस, और उससे आगे।

फ़ाइन-ट्यूनिंग

जो frontier labs नहीं करते, उस पर पोस्ट-ट्रेन करें

Frontier RL environments आपके 10-Ks, ट्रेडिंग डेस्क, या underwriting playbooks को कवर नहीं करते। हम करते हैं — आपकी domain को एक ऐसे मॉडल में बदलते हैं जो सादे commercial LLM से आपके ज़रूरी काम पर आगे निकले।

R+0.73ppogrpodpo

Domain डेटा

प्रोप्राइटरी corpora, traces और tool calls सीधे training signal बन जाते हैं।

RSI

रिइन्फ़ोर्समेंट लर्निंग से असली सामान्यीकरण तक

हमारा मिशन है पोस्ट-ट्रेनिंग को रिइन्फ़ोर्समेंट लर्निंग से आगे, असली सामान्यीकरण तक ले जाना — ऐसे मॉडल जो आपकी domain पर सोचें, न कि सिर्फ़ academic benchmarks पर। हम रिकर्सिव एजेंटिक सेल्फ-इम्प्रूवमेंट के ज़रिए SOTA तरीकों को खोजते और बेहतर बनाते हैं।

लूप

स्वचालित पोस्ट-ट्रेनिंग लूप

तीन प्रिमिटिव्स, एक बंद लूप, मॉडल के सामान्यीकरण तक दोहराएँ।

स्टेप 01→ अगला

ऑथर

एक टाइप-सेफ़, वर्जन्ड API में एनवायरनमेंट, ऐक्शन, टूल्स और रिवॉर्ड्स परिभाषित करें।

स्टेप 02→ अगला

रोलआउट

हज़ारों समानांतर रोलआउट चलाएं; हर स्टेप ट्रेस होता है, हर रिवॉर्ड एट्रिब्यूट होता है।

स्टेप 03↺ दोहराएँ

ट्रेन

Tempera आपके डेटा पर पोस्ट-ट्रेनिंग मेथड्स खोजता है और सबसे बेहतर सामान्यीकरण करने वाला मॉडल शिप करता है।

API

तीन कॉल। एक लूप

एक टाइप्ड इंटरफ़ेस में एनवायरनमेंट्स, रोलआउट्स और ट्रेनिंग को जोड़ें।

import { tempera } from "@tempera/sdk";

// उस दुनिया को परिभाषित करें जिसमें आपका मॉडल ट्रेन करता है।
const env = await tempera.envs.create({
  name: "research-assistant",
  observation: { kind: "text" },
  action: {
    kind: "tool-use",
    tools: ["search", "shell", "browse"],
  },
  reward: { fn: "./rewards/helpfulness.ts" },
});

env.publish({ tag: "v1" });

Deployment

आपका मॉडल। आपका perimeter

फ़ाइन-ट्यून्ड मॉडल वहीं ship होते हैं जहाँ आपका डेटा है। अपनी security और compliance posture के अनुसार isolation मॉडल चुनें।

01

VPC · single-tenant

आपके cloud account में dedicated control और data plane। न shared compute, न shared weights।

  • आपके AWS / GCP / Azure VPC में चलता है
  • Dedicated GPUs और inference endpoints
  • डेटा और weights कभी आपके account से बाहर नहीं जाते
02

VPC · multi-tenant

Shared managed control plane, हर customer के लिए isolated data plane। तेज़ onboarding, कम TCO।

  • Tempera-managed control plane
  • हर tenant के लिए isolated inference
  • SOC 2-aligned tenant boundaries
03

On-prem

सबसे regulated environments के लिए आपके hardware पर air-gapped deployment।

  • आपके अपने GPU clusters पर चलता है
  • Offline / air-gapped supported
  • अपना KMS, IdP और audit log sinks लाएँ

करियर

हमसे जुड़ें

छोटी टीम, बड़े विचार, अनंत मिशन।

रिसर्च

फ़ुल-टाइम · San Francisco में in-person

पोस्ट-ट्रेनिंग, सामान्यीकरण, वर्ल्ड मॉडल्स और रिकर्सिव सेल्फ-इम्प्रूवमेंट पर शोध करें।

आवेदनfounders@tempera.dev

रिसर्च इन्फ़्रास्ट्रक्चर

फ़ुल-टाइम · San Francisco में in-person

रिसर्च को सशक्त बनाने वाले व्यापक शेड्यूलिंग, डिस्ट्रिब्यूटेड ट्रेनिंग सिस्टम्स और ऑब्ज़र्वेबिलिटी का निर्माण करें।

आवेदनfounders@tempera.dev

मशीन लर्निंग

फ़ुल-टाइम · San Francisco में in-person

रिसर्च को प्रोडक्शन में बदलें।

आवेदनfounders@tempera.dev

ओपन आवेदन

फ़ुल-टाइम · San Francisco में in-person

हम हमेशा सभी क्षेत्रों के प्रतिभाशाली लोगों का स्वागत करते हैं।

आवेदनfounders@tempera.dev

वेटलिस्ट

अपना डेटा लाएँ। एक मॉडल ship करें

पहली कोहोर्ट के लिए वेटलिस्ट में शामिल हों, या सीधे फ़ाउंडर्स को ईमेल करें।