Freeplay möchte Unternehmen dabei helfen, LLM-basierte Apps zu testen und zu erstellen


Freispielein Startup, das es Unternehmen ermöglicht, Apps zu entwickeln, damit zu experimentieren und zu testen, die auf generativen KI-Modellen, insbesondere textgenerierenden Modellen, basieren, ist heute mit 3,25 Millionen US-Dollar in einer von Conviction Ventures und Matchstick Ventures gemeinsam angeführten Seed-Runde aus dem Verborgenen hervorgegangen.

Freeplay wurde von ehemaligen Twitter-Mitarbeitern gegründet, darunter den ehemaligen Produkt- und Technikleitern der Twitter-Entwicklerplattform und des Unternehmensdatengeschäfts. Das Ziel von Freeplay ist es, Produktentwicklungsteams Werkzeuge an die Hand zu geben, um Prototypen zu erstellen und die Softwarefunktionen zu verbessern, die auf großen Sprachmodellen basieren – Modellen ähnlich wie ChatGPT oder Metas Lama 2.

„Für erfahrene Produktentwicklerteams, die möglicherweise neu in der KI sind, bieten wir eine Tool-Suite, die ihnen hilft, Best Practices zu übernehmen“, sagte Ian Cairns, Mitbegründer und CEO von Freeplay, in einem E-Mail-Interview mit TechCrunch. „Freeplay gibt diesen Teams die Sicherheit, LLMs in ihre Produkte zu integrieren und letztlich bessere Kundenerlebnisse zu liefern.“

Cairns und Eric Ryan haben Freeplay letztes Jahr gemeinsam gegründet. Sie lernten sich bei Gnip kennen, einem Unternehmen für die Aggregation von Social-Media-APIs, das Twitter 2014 übernommen hatte. Nach der Übernahme wechselten Cairns und Ryan zu Twitter, wo Cairns die Entwicklerplattform leitete und Ryan Senior Director of Engineering im Twitter-Büro in Boulder war.

Laut Cairns wurden er und Ryan durch die Herausforderungen, denen sich Unternehmen bei der Einführung von LLMs gegenübersahen, zur Einführung von Freeplay angespornt. Cairns und Ryan stellten fest, dass viele bestehende Observability-Tools Schwierigkeiten hatten, LLM-Ergebnisse im großen Maßstab zu verfolgen, während die Experimentierpraktiken nicht mit dem schnelllebigen Bereich der generativen KI Schritt hielten.

„Wir sahen, wie transformativ LLMs werden würden, wenn die Technologie vom Forschungsraum zum Produktionseinsatz überginge“, sagte Cairns. „Insbesondere viele der Business-to-Business-Software-as-a-Service-Unternehmen, mit denen wir jahrelang zusammengearbeitet hatten, hatten noch nie zuvor mit maschineller Lerntechnologie gebaut, und wir sahen den Bedarf an neuen Tools und neuen Entwicklungspraktiken, die dabei helfen Solche Unternehmen übernehmen LLMs und verbessern sich dann im Laufe der Zeit.“

Die Plattform von Freeplay kombiniert Entwicklerintegrationen mit einem webbasierten Dashboard. Über das Dashboard können Teams sehen, wie Benutzer mit einer KI-gestützten App interagieren, sowie Kennzahlen wie die geschätzten Kosten, die mit der Ausführung der App verbunden sind, und die durchschnittliche Latenz der App.

Über die Beobachtbarkeit hinaus bietet Freeplay anfängerfreundliche Funktionen, die es Benutzern ermöglichen, mit verschiedenen Eingabeaufforderungen zu experimentieren – z. B. Anweisungen für LLMs („Fragen so beantworten, dass ein Fünfjähriger sie verstehen kann“, „Mit Schritt-für-Schritt-Anweisungen antworten“ usw.). usw.) – und Modelle verschiedener Anbieter (z. B. OpenAI, Anthropic) in Live-Software austauschen. Freeplay bietet auch Tools zur Identifizierung und Implementierung benutzerdefinierter Bewertungen von LLMs und nutzt dabei das, was Cairns „Auto-Evaluatoren“ nennt (automatisierte Testtools, die von LLMs unterstützt werden) in Kombination mit Arbeitsabläufen zur menschlichen Kennzeichnung.

„Wir helfen Kunden beim Aufbau einer Feedbackschleife, um ihre LLM-Bewertungen zu optimieren“, sagte Cairns. „Zum Beispiel müssen Buchhalter möglicherweise Ergebnisse für eine KI-Buchhaltungsfunktion überprüfen, oder Ärzte und Wissenschaftler müssen möglicherweise Ergebnisse für Biotechnologie- oder Gesundheitsanwendungen überprüfen … Das hilft.“ [companies] Erstellen Sie einen hochwertigen Datensatz, der zu einem Aktivposten wird, um das Kundenerlebnis weiter zu optimieren und Kosten zu senken, unter anderem durch die Feinabstimmung von LLMs.“

Aber was unterscheidet Freeplay von der wachsenden Sammlung von Tools auf dem Markt zum Erstellen und Benchmarken von KI-gestützten Apps?

Es gibt auf generative KI ausgerichtete Observability-Plattformen wie Helicone sowie Plattformen zum Verfolgen und Teilen von Eingabeaufforderungen wie PromptLayer und LangSmith. Andernorts haben etablierte Public-Cloud-Anbieter wie AWS, Google Cloud und Azure Produkte auf den Markt gebracht, um die neuen Entwicklungsherausforderungen zu bewältigen, die sich aus generativer KI ergeben.

Cairns erkennt die Konkurrenz an. Er behauptet jedoch, dass sich die meisten Anbieter auf einen „engen Teil der Funktionalität“ konzentrieren und einzelne Entwickler ansprechen oder sich auf erfahrene Teams für maschinelles Lernen und Datenwissenschaft konzentrieren und dabei Organisationen mit unterschiedlichen Talenten und Hintergründen benachteiligen.

„Unser End-to-End-Toolset hilft Teams, sicher vom Prototyp bis zur Produktion zu gelangen und dann das Kundenerlebnis im Laufe der Zeit zu optimieren“, sagte Cairns. “SEs sind einige Tools entstanden, die sehr auf Entwickler ausgerichtet sind, aber nicht den Anforderungen funktionsübergreifender Teams gerecht werden, die insbesondere in größeren Unternehmen zusammenarbeiten. Andere konzentrieren sich auf einen engen Anwendungsfall, decken jedoch nicht den gesamten Entwicklungslebenszyklus ab. Freeplay vereint einen End-to-End-Workflow, der Entwicklern dennoch die Kontrolle gibt, die sie brauchen.“

Cairns behauptet, dass Freeplay bereits einige Erfolge erzielt habe, wobei die ersten Kunden „mehrere Hundert“ bis „mehrere Tausende“ Dollar pro Monat für den frühen Service zahlten. Mit dem Geld aus der Seed-Runde plant Freeplay, seine Belegschaft von 10 auf etwa 12 bis 15 bis Ende des Jahres zu vergrößern und „das Kernprodukt auf den Markt zu bringen“, sagt Cairns.

source-116

Leave a Reply