Zurück zu Nachrichten
DevOps

Zeige HN: Superlog (YC P26) – Beobachtung, die sich selbst installiert und Fehler behebt

19. Mai 2026Quelle

Zeige HN: Superlog (YC P26) – Beobachtung, die sich selbst installiert und Fehler behebt

Hallo HN, wir sind Nico und Arseniy, Gründer von Superlog (https://superlog.sh). Wir bauen ein Beobachtungstool, das sich selbst installiert und Fehler behebt, ohne dass es geöffnet werden muss. Es hat einen Wizard, der täglich die Registrierung konfiguriert und einen Agenten, der Fehler untersucht und PRs öffnet.

Kurze Demo: https://www.youtube.com/watch?v=xFhU9Mk247M.

In unseren vorherigen Startups haben wir Sentry, Datadog, Grafana, Dash0 ausprobiert, und nichts war gut genug. Die Telemetrie und die Alarmierung sind noch immer sehr zeitaufwändig. Wir haben Schwierigkeiten gehabt, gute Registrierungen zu erstellen, sodass das Debuggen schwierig war, besonders wenn die Codebases schneller wachsen. Inzwischen stieg der Preis von Datadog/Dash0 weiter an, und wir verbrachten immer noch Stunden, um unsere Beobachtungstools zu lernen, zu konfigurieren und zu warten.

Mit Sentry fanden wir uns in einer Flut von Alarmen in unserem Slack-Kanal wieder, die meisten waren Duplikate oder fehlten an Kontext, sodass die Alarmmüdigkeit/constanten Unterbrechungen ein echtes Problem waren. Die #ops-Notifikation war immer die schlimmste Empfindung am Samstagmorgen

Wir haben oft gesehen, dass Server sich aus der Speicher- und Festplatten-Memory ausliefen, und drei AWS-Metriken gaben uns drei verschiedene Werte. Die Hälfte der Grafiken auf den Dashboards waren normalerweise leer oder veraltet, und das Manuell Durchklicken durch die UIs, besonders wenn das Team klein ist, schien ein riesiger Zeitverschwendung zu sein.

In einem Punkt haben wir verstanden, dass das Löschen dieses Problems wertvoller wäre als das, was wir bisher gearbeitet haben, und wir hatten die Expertise dafür, da Arseniy Jahre bei Datadog verbracht hat, um in der Nacht zu debuggen, um Produktionsfehler zu beheben. Also haben wir beschlossen, eine Plattform zu bauen, die funktioniert: Agent-erster, MCP-nativer, ohne Konfiguration.

Hier ist, wie Superlog funktioniert: Wir haben einen Wizard, der deinen Repository scannet, und ihn automatisch mit Registrierungen, Tracen und Metriken via OpenTelemetry instrumentiert. Wir stellen sicher, dass die Hauptfehlermodi, die Endpunkt-Leistung, die Nutzung pro Tenant und der LLM/Stream-Kosten (per Aufruf, Tenant und Modell) hervorgehoben werden.

Die Fehler werden improntiert und in Vorfälle gruppiert, sodass du einen einzigen Fehler siehst, nicht tausend Duplikate. Wenn du eine Notifikation von Superlog erhältst, siehst du einen klaren Fehlerzusammenfassung, seine inferierte Schwere und Auswirkung im Voraus.

Dann untersucht der Agent und versucht, das Problem zu lösen. Wenn er genug Kontext hat, produziert er einen kurzen und getesteten PR. Wenn nicht, publiziert er seine Ergebnisse für das Untersuchungsteam, und zieht automatisch die Ingenieure herein, die mehr Kontext beisteuern können, basierend auf Dokumentation, vorherigen Untersuchungen und Slack-Threads.

In jedem Fall ist das Ergebnis ein sauberer PR pro Vorgang, der in Slack veröffentlicht wird, der du mergen, ignorieren oder als Claude-Code-Sitzung öffnen und anpassen kannst.

Drei Dinge, die wir glauben, sind anders als die anderen Beobachtungslieferanten:

(1) Wir lösen den Konfigurations-Schmerz. Der Wizard wird alles mit nativen OTel-SDKs instrumentieren, respektierend die semantischen Konventionen, mit korrekter Dienst- und Umgebungs-Labeling. Wir arbeiten auch an nativen automatischen Dashboards und Alarms, damit du sehen kannst, was passiert, und keine subtilen Fehlermodi verpasst.

(2) Unsere Telemetrie verfällt nicht. Der Wizard läuft täglich, und fügt Registrierungen, Alarms und Dashboards ein, wo sie benötigt werden. Du musst nicht daran denken, neue Funktionen zu instrumentieren. Die nächste Zeit, wenn etwas kaputt geht, sind die Daten, die du brauchst, um es zu debuggen, bereits da.

(3) Unser Ziel ist es, die Alarmmüdigkeit zu lösen. Wir verwenden Agenten, um ähnliche Fehler zu kombinieren und die Zusammenfassungen zu verbessern, um relevante Informationen im Voraus zu liefern. Wir haben einen benutzerdefinierten Bewertungs-Setup, der sicherstellt, dass die Zusammenfassungen dicht und korrekt sind, und die Schwere und Auswirkung genau sind. Wir geben auch Konfidenz-Scores für jede LLM-aufgerüstete Metrik, damit falsche Annahmen nicht gesteigert werden.

Wichtig: Die Telemetrie von Superlog ist neutral für Anbieter, also behältst du alle Registrierungen/Metriken/Tracen, die wir installieren. Der Preis ist auf der Seite. Wir sind früh, also erwarten wir rauhe Kanten und bitte sagt uns, wenn ihr sie findet.

Kommentare (0)

Login or Register to apply