Il Gateway AI: Scalare l'Inferenza Centralizzata Across Decentralized Teams
Meryem Arik discute perché le squadre di ingegneria moderne affrontano la "caos di inferenza" e come i gateway AI forniscono un livello di controllo critico. Spiega l'equilibrio tra l'autonomia delle squadre decentralizzate per scegliere i modelli migliori e il controllo centralizzato per la sicurezza, RBAC e il controllo dei costi. Esplora le soluzioni open-source come LiteLLM e Doubleword per semplificare la tua infra AI.
Bio
Meryem Arik è la co-fondatrice e CEO di Doubleword (precedentemente TitanML). Frequentemente parla a conferenze di livello, tra cui TEDx e QCon, condividendo le sue conoscenze sulla tecnologia di inferenza e l'AI aziendale. Meryem è stata riconosciuta come una Forbes 30 Under 30 per i suoi contributi al campo dell'AI.
Su la conferenza
QCon AI è un evento guidato dai praticanti focalizzato interamente sull'ingegneria richiesta per scalare questi carichi in modo sicuro. Fornisce accesso diretto ai playbooks architettonici e ai metri di fallimento che le organizzazioni peer utilizzano in produzione.
Commenti (0)
Accedi o Registrati per candidarti