MergeStat nutzt Open Source und SQL, um „Operational Analytics“ in die Softwareentwicklung zu bringen


Ein neues Open-Source-Startup will Softwareentwicklungsteams helfen, tiefere Einblicke in ihre Codebasis zu gewinnen, indem es SQL verwendet, um alle Datenquellen abzufragen, die sie im Softwareerstellungsprozess verwenden.

MergeStatwie das Startup genannt wird, ist bisher unter dem Radar geflogen, plant aber, zusätzlich ein kommerzielles Produkt auf den Markt zu bringen bestehendes Open-Source-Projektkündigte das Unternehmen heute eine Pre-Seed-Finanzierungsrunde in Höhe von 1,2 Millionen US-Dollar an und gab einige Einblicke, wo es sich befindet und wohin es in den kommenden Monaten gehen wird.

Zum Kontext können die Ursprünge von MergeStat bis Mitte 2020 zurückverfolgt werden, als die ersten sich dazu verpflichteten ein Projekt namens Gitqlite gemacht, was im Wesentlichen ein Experiment war, das SQLite und Git zusammenbrachte, um das Abfragen historischer Daten in Code-Repositories zu vereinfachen.

„Damals war ich sehr daran interessiert, die Geschichte des Quellcodes zu erforschen, um etwas über Legacy-Codebasen zu erfahren, in denen ich arbeitete“, erklärte Patrick DeVivo, Gründer und CEO von MergeStat, gegenüber TechCrunch. „Könnte der Git-Verlauf verwendet werden, um die besten Ansprechpartner für Fragen zu bestimmten Funktionen oder Teilen einer Codebasis zu ermitteln? Um „Experten“ in bestimmten Bereichen des Codes zu identifizieren und einen aggregierten Kontext darüber bereitzustellen, wer für welche Teile des Quellcodes verantwortlich war? Könnte es in ähnlicher Weise Bereiche mit hohem Risiko aufdecken, die von jemandem abhängig waren, der nicht mehr an einem Projekt arbeitet?“

Im Wesentlichen geht es darum, in die Code-Historie einzutauchen – dazu gehört das Abfragen grundlegender Elemente wie der Commit-Historie und das Anzeigen von Autoren-Metadaten über den Befehl „Git-Schuld“, aber die Absicht ist, weit darüber hinauszugehen und es Entwicklern zu ermöglichen, SQL zu nutzen, um Fragen zu stellen über den Code selbst.

„Operationelle Analytik“

Spulen wir bis April 2021 vor, und das kommerzielle Unternehmen MergeStat wurde offiziell gegründet, und DeVivo wird weiter locken José Lopez vom Cloud-Giganten Equinix als Chief Operating Officer (COO) sowie offizieller Mitbegründer.

„Dies hat uns dorthin geführt, wo wir heute stehen, wo unsere Mission darin besteht, operative Analysen für Softwareentwicklungsteams zu unterstützen“, sagte DeVivo. „Wenn es um die Erstellung oder den Versand von Software geht, möchten wir die Abfrage mit SQL ermöglichen.“

Im Wesentlichen funktioniert jedes Tool, das mit PostgreSQL funktioniert – einschließlich der meisten Tools für Business Intelligence (BI) und Datenvisualisierung – mit MergeStat. Die Plattform selbst umfasst eine Verwaltungsschnittstelle und eine PostgreSQL-Datenbank, wobei MergeStat Daten aus verschiedenen Software Development Lifecycle (SDLC)-Quellen in die PostgreSQL-Hauptdatenbank synchronisiert. Benutzer können diese Daten dann innerhalb der MergeStat-App abfragen oder sie mit einem Drittanbieter-Tool wie Grafana, Tableau oder Superset verbinden.

Aber welche Arten von Anwendungsfällen könnte MergeStat unterstützen? Nun, im Kern geht es darum, Erkenntnisse aus Informationen zu gewinnen, die möglicherweise über verschiedene Codebasen und Entwicklerteams verteilt sind. Wenn beispielsweise ein Manager in einem großen Unternehmen wissen möchte, wie viele Teams – und welche Teams – ein neues Tool eingeführt haben oder wie viele Codebasen eine bestimmte Version einer Programmiersprache oder Bibliothek verwenden, kann er diese Frage mit MergeStat stellen. Alternativ möchten sie möglicherweise alle Abhängigkeiten von Drittanbietern oder Konfigurationsdateiwerte extrahieren, und auch hier könnte MergeStat helfen.

Die Antworten auf solche Fragen zu kennen, ist von entscheidender Bedeutung, wenn ein Unternehmen ein großes Migrationsprojekt durchführt oder wenn es seine potenzielle Angriffsfläche ermittelt, in der es eine bekannte Schwachstelle in einer bestimmten Abhängigkeit gibt.

MergeStat in Aktion. Bildnachweis: MergeStat

Andere potenzielle Anwendungsfälle umfassen Auditing und Compliance, damit Unternehmen die richtigen Verfahren und Best Practices als Teil eines regulatorischen Rahmens befolgen können. Beispielsweise muss ein Dienstanbieter möglicherweise im Rahmen eines SOC 2-Audits nachweisen, dass er die Daten seiner Kunden ordnungsgemäß verwaltet – MergeStat kann verwendet werden, um diese Nachweise zu sammeln und vorzulegen, die zeigen, wer auf eine bestimmte Datei zugegriffen oder wer was geändert hat Code.

Wettbewerbslandschaft

Es sei darauf hingewiesen, dass es bereits möglich ist, Antworten auf diese Fragen zu erhalten, aber dies beinhaltet normalerweise einen manuellen Prozess, der mehrere Bildschirme und Tools umfasst, und das Kopieren von Text in Tabellenkalkulationen, was ein ressourcenintensiver Prozess sein kann. MergeStat automatisiert einen Großteil davon, indem es Ingenieuren ermöglicht, Fragen über SQL zu stellen und Antworten in Dashboards, Berichten und Warnungen über BI-Tools anzuzeigen.

„MergeStat kann diese Fragen kontinuierlich beantworten, während die Teams ihrer normalen Arbeit nachgehen – die zugrunde liegenden Daten, auf die MergeStat zugreift, ändern sich, um den aktualisierten Zustand widerzuspiegeln“, fügte DeVivo hinzu.

Beispieldaten für Pull Requests (PR), die über MergeStat abgeleitet wurden. Bildnachweis: MergeStat

Es gibt auch viele SaaS-Tools, die mindestens einen Teil dessen erfüllen, was MergeStat verspricht. Beispielsweise werden technische Metriken von LinearB oder Jellyfish abgedeckt, während die Codesuche eine Kernkomponente von Sourcegraph und GitHub selbst ist. Und im Audit- und Compliance-Bereich gibt es Drata, Vanta und Laika, die zur Beweiserhebung in GitHub integriert sind.

Während all dies einen Mehrwert bringt, setzt MergeStat darauf, dass viele technische Leiter keine vorgefertigten „konservierten“ Metriken und Diagramme zu subjektiven Konzepten wie „Geschwindigkeit“ oder „Produktivität“ wollen. MergeStat geht davon aus, dass viele den Zugriff auf die zugrunde liegenden Daten über den gesamten Lebenszyklus der Softwareentwicklung hinweg bevorzugen würden, mit der Flexibilität, sie auf eine Weise abzufragen, die für ihre spezifische Organisation und ihren Anwendungsfall relevant ist.

„Jede Organisation ist anders, und wir glauben, dass es zu besseren Ergebnissen führt, wenn man ihnen Tools gibt, mit denen sie mit ihren Daten arbeiten und spezifischere Fragen stellen können“, sagte DeVivo. „Wir positionieren uns als Dateninfrastrukturprodukt und glauben, dass es für Engineering-Organisationen im Allgemeinen nützlich ist, „untergeordneten“ Zugriff auf die Daten zu gewähren, die mit dem Erstellen und Versenden von Software verbunden sind, um sie zu operationalisieren.“

Open Source zu sein, ist natürlich auch ein großer Teil des Flexibilitätsversprechens von MergeStat. Es gibt Unternehmen die volle Kontrolle über ihre Daten und ihre Bereitstellung, während sie sie nach Belieben aufteilen können – lokal auf einem Laptop, wenn sie möchten –, um alles herauszufinden, bevor sie aufs Ganze gehen.

Was kommt als nächstes

Während MergeStat vorerst noch ein Open-Source-Projekt ist, ist das Unternehmen derzeit arbeiten an ein gehostetes Cloud-Produkt und eine unternehmensorientierte Inkarnation, die selbst gehostet oder in jeder Cloud nach Wahl des Kunden bereitgestellt werden kann. Vieles davon wird um ihn herum gebaut vor kurzem angekündigt „PostgreSQL-Ansatz“, bei dem Daten in einer Postgres-Datenbank synchronisiert werden, um Abfragen weiter nachgelagert zu ermöglichen.

Im Vorfeld seiner kommerziellen Einführung sagte MergeStat, dass es bereits mit „einer Reihe von Unternehmen“ in frühen Tests zusammenarbeitet, einschließlich des Teams von Equinix-Metalldas laut DeVivo derzeit eine selbst gehostete MergeStat-Instanz in 800 Repositories verwendet.

Die Pre-Seed-Runde von MergeStat wurde von OSS Capital angeführt, mit Beteiligung von Caffeinated Capital und einer Reihe von Angel-Investoren.

source-116

Leave a Reply