Mostra HN: Superlog (YC P26) – Osservabilità che si installa da sola e risolve bug

Ciao HN, siamo Nico e Arseniy, fondatori di Superlog (https://superlog.sh). Stiamo costruendo uno strumento di osservabilità che si installa da solo e si ripara da solo, senza dover essere aperto. Ha un wizard che configura quotidianamente la registrazione e un agente che indaga gli errori e apre PR.

Demo breve: https://www.youtube.com/watch?v=xFhU9Mk247M.

In precedenti startup, abbiamo provato Sentry, Datadog, Grafana, Dash0, e nulla era abbastanza buono. La telemetria e l'allerting corretti richiedono ancora una quantità enorme di configurazione manuale. Abbiamo lottato per aggiungere registrazioni di buona qualità, quindi il debug era difficile, specialmente quando i codebase crescono a un ritmo più veloce. Nel frattempo, il fattore di prezzo di Datadog/Dash0 continuava a salire, e noi ancora passavamo ore di ingegneria per imparare, configurare e mantenere le nostre strumentazioni di osservabilità.

Con Sentry, ci siamo trovati sommersi da una corrente di allarmi nel nostro canale Slack, la maggior parte erano duplicati o mancavano di contesto, quindi la fatica degli allarmi/interruzioni costanti erano un vero problema. La notifica #ops è sempre stata la sensazione peggiore di una domenica mattina

Abbiamo visto troppo spesso che i server si esaurivano di memoria e disco, e tre metriche AWS ci davano tre valori diversi. La metà delle grafiche sui dashboard sono normalmente vuote o obsolete, e cliccare manualmente attraverso le UI, specialmente quando il team è piccolo, sembra un enorme spreco di tempo.

A un certo punto abbiamo capito che risolvere questo problema sarebbe stato più utile delle cose che stavamo lavorando, e avevamo l'expertise per farlo, poiché Arseniy aveva trascorso anni a Datadog, ricevendo pagamenti durante la notte per debuggare incidenti di produzione. Quindi abbiamo deciso di costruire una piattaforma che funzionasse: agente-primo, MCP-nativo, zero-configurazione.

Ecco come funziona Superlog: abbiamo un wizard che scandisce il tuo repository, e automaticamente lo strumenta con registrazioni, tracce e metriche via OpenTelemetry. Assicuriamo di evidenziare i principali modi di fallimento, il rendimento delle endpoint, l'uso per tenant e il costo LLM/allostream (per chiamata, tenant e modello).

Gli errori vengono improntati e raggruppati in incidenti, quindi vedi un unico problema, non mille duplicati. Quando ricevi una notifica da Superlog, vedi un riassunto di fallimento chiaro, la sua severità e impatto inferiti in anticipo.

Poi l'agente indaga e cerca di risolvere il problema. Se ha abbastanza contesto, produce un PR conciso e testato. Se non lo fa, pubblica le sue scoperte per l'investigazione del team, e automaticamente tira dentro gli ingegneri che potrebbero contribuire più contesto sulla base della documentazione, precedenti indagini e thread Slack.

In ogni caso, l'output è un PR pulito per incidente, pubblicato in Slack, che puoi mergere, ignorare o aprire come una sessione di Claude Code e modificare.

Tre cose che pensiamo siano diverse dagli altri fornitori di osservabilità:

(1) Risolviamo il dolore di configurazione. Il wizard strumenterà tutto con SDK OTel nativi, rispettando le convenzioni semantiche, con etichettatura di servizio e ambiente corretta. Stiamo lavorando anche su dashboard e allarmi automatici nativi, in modo che tu possa vedere cosa sta succedendo in un colpo d'occhio e non perda i modi di fallimento sottili.

(2) La nostra telemetria non decade. Il wizard esegue quotidianamente, e aggiunge registrazioni, allarmi e dashboard dove sono necessari. Non devi ricordarti di strumentare nuove funzionalità. La prossima volta che qualcosa si rompe, i dati che ti servono per debuggarlo sono già lì.

(3) Il nostro obiettivo è risolvere la fatica degli allarmi. Utilizziamo agenti per unire errori simili e raffinare i riassunti, dando informazioni rilevanti in anticipo. Abbiamo un setup di valutazione personalizzato che assicura che i riassunti siano densi e corretti, e la severità e l'impatto siano puntuali. Inoltre, diamo punteggi di fiducia per ogni metrica LLM-aumentata, in modo che le ipotesi sbagliate non vengano aumentate.

Importante: la telemetria di superlog è neutrale per fornitori, quindi conservi tutti i registri/metriche/tracce che installiamo. Il prezzo è sul sito. Siamo precoci, quindi aspettatevi bordi ruvidi e per favore diteci quando li trovate.

Mostra HN: Superlog (YC P26) – Osservabilità che si installa da sola e risolve bug

Mostra HN: Superlog (YC P26) – Osservabilità che si installa da sola e risolve bug

Commenti (0)