Sweep zielt darauf ab, grundlegende Entwicklungsaufgaben mithilfe großer Sprachmodelle zu automatisieren


Entwickler verbringen viel Zeit mit alltäglichen, sich wiederholenden Aufgaben – und überraschend wenig mit der eigentlichen Programmierung.

In der Entwicklerumfrage 2022 von Stack Overflow gaben 63 % der Befragten an, dass sie mehr als 30 Minuten pro Tag mit der Suche nach Antworten oder Lösungen für Probleme verbringen – was einem Zeitverlust von 333 bis 651 Stunden pro Woche bei einem Team von 50 Entwicklern entspricht. Ein separates Umfrage von Propeller Insights und Rollbar haben herausgefunden, dass über ein Drittel der Entwickler etwa ein Viertel ihrer Zeit damit verbringen, Fehler zu beheben, wobei etwas mehr als ein Viertel (26 %) bis zur Hälfte ihrer Zeit damit verbringt, Fehler zu beheben.

Der Trend frustrierte William Zeng und Kevin Lu. Anfang des Jahres gründeten sie – beide Veteranen von Roblox, dem aus Videospielen gewordenen sozialen Netzwerk – eine Plattform namens Fegen um Entwicklungsaufgaben wie High-Level-Debugging autonom zu erledigen.

„Wir haben Sweep gegründet, nachdem wir bei Roblox zusammengearbeitet hatten und uns ständig mit Softwareaufgaben beschäftigt hatten, von denen wir wussten, dass sie mit KI automatisiert werden könnten“, sagte Zeng, CEO von Sweep, in einem E-Mail-Interview mit TechCrunch. „Sweep ist wie ein KI-gestützter Junior-Entwickler für Softwareteams.“

TechCrunch berichtete zuvor über Sweep während des Sommer-Demo-Tages 2023 von Y Combinator. Doch seitdem hat das Startup eine neue Finanzierungsrunde abgeschlossen und 2 Millionen US-Dollar von Goat Capital, Replit-CEO Amjad Masad, Replit-Vizepräsident von AI Michele Catasta und Exceptional Capital zu einer Post-Money-Bewertung von 25 Millionen US-Dollar eingesammelt.

Mit Sweep können Entwickler eine Anfrage in natürlicher Sprache beschreiben – zum Beispiel „Debug-Protokolle zu meiner Datenpipeline hinzufügen“ – außerhalb einer IDE und generieren Sie den entsprechenden Code. Die Plattform kann diesen Code dann über einen Pull-Request in die entsprechende Codebasis pushen und Kommentare zum Pull-Request entweder von Code-Betreuern oder -Eigentümern bearbeiten – ein bisschen wie GitHub Copilot, aber autonomer.

„Sweep ermöglicht es Ingenieuren, schneller zu liefern“, sagte Zeng. „Wir kümmern uns um die technischen Schulden, die mit jeder Codeänderung entstehen, wie zum Beispiel die Verbesserung von Fehlerprotokollen und das Hinzufügen von Unit-Tests sowie die Umgestaltung ineffizienten Codes.“

Sweep, das auf das Schreiben von Python-Code spezialisiert ist, nutzt eine Kombination von KI-Modellen zur Codegenerierung. Dazu gehören GPT-4 von OpenAI, aber auch eine benutzerdefinierte „Code-Suchmaschine“ – was wichtig ist nicht Zeng ist auf Sweep-Kundendaten geschult – das hilft bei der Planung und Durchführung „repositoryweiter“ Codeänderungen.

„Wir haben unsere eigene Codesuchmaschine für Python entwickelt, die lexikalische und Vektorsuchtechniken nutzt“, fügte Zeng hinzu. Die lexikalische Suche sucht nach wörtlichen Übereinstimmungen – oder geringfügigen Abweichungen von – Teilen des Codes, während die Vektorsuche eher lose verwandten Code finden kann, der bestimmte Merkmale gemeinsam hat. „Wir verfügen über eine der besten verfügbaren Fähigkeiten zur Unit-Test-Generierung und werden Tests in Echtzeit ausführen und ausführen“, fuhr er fort.

In Zukunft plant Sweep, die Codegenerierungsfähigkeiten seiner Plattform mit StarCoder, dem Open-Source-Codegenerierungsmodell von Hugging Face und ServiceNow, zu verbessern.

Angesichts der Tendenz der KI, Fehler zu machen, bin ich jedoch etwas skeptisch, was die Zuverlässigkeit von Sweep auf lange Sicht angeht. Ein mit Stanford verbundenes Forschungsteam gefunden dass Ingenieure, die KI-Tools verwenden, mit größerer Wahrscheinlichkeit Sicherheitslücken in ihren Apps verursachen, da die Tools häufig Code generieren, der oberflächlich korrekt erscheint, aber Sicherheitsprobleme aufwirft.

Es gibt auch die Urheberrechtsfrage. Einige Code-generierende Modelle – nicht unbedingt die von StarCoder oder Sweep, aber andere – sind auf urheberrechtlich geschützten Code oder Code unter einer restriktiven Lizenz trainiert, und diese Modelle können diesen Code wiedergeben, wenn sie auf eine bestimmte Art und Weise dazu aufgefordert werden. Rechtsexperten argumentieren, dass diese Tools Unternehmen gefährden könnten, wenn sie unabsichtlich urheberrechtlich geschützte Vorschläge aus den Tools in ihre Produktionssoftware integrieren würden.

Die Lösung von Sweep fordert Benutzer dazu auf, den generierten Code selbst zu überprüfen und zu bearbeiten, bevor sie Änderungen an die Ziel-Master-Codebasis übertragen.

„Die größten Herausforderungen für KI-Entwicklertools liegen in der Zuverlässigkeit und der Verwaltung großer Codebasen“, sagte Zeng. „Wir nutzen unser Wissen über ältere und neuere Methoden, um Sweep robust zu machen.“

Sweep verlangt für seine Dienste einen hübschen Cent – ​​480 US-Dollar pro Sitzplatz und Monat. (Im Gegensatz dazu kosten die geschäftsorientierten Stufen für GitHub Copilot und Amazon CodeWhisperer etwa 20 US-Dollar pro Benutzer und Monat.) Aber das hat die Kunden offenbar nicht abgeschreckt. Zeng behauptet, dass Sweep mit einer eher bescheidenen Kriegskasse von insgesamt 2,8 Millionen US-Dollar über genügend Kapital von Kunden verfügt, um „die Jahre des Unternehmens zu überdauern“.

„Das neue Geld wird dazu dienen, unser Team im kommenden Jahr von zwei auf fünf Mitarbeiter zu erweitern“, fuhr er fort. „Wir werden uns weiterhin auf Python konzentrieren und uns in allen Bereichen der technischen Schulden verbessern, von Unit-Tests über Refactoring bis hin zur Bearbeitung übrig gebliebener Aufgaben im Code.“

source-116

Leave a Reply