Wie können Firmen die Qualität der Antworten einer KI überwachen?
In der dynamischen Welt der Technologie treffen viele Unternehmen auf ein gemeinsames Hindernis: Die Einführung neuer KI-Software verläuft nicht immer reibungslos. Oft beschweren sich Benutzer nach der Implementierung über unlogische oder ungenaue Antworten.
Die Lösung für ein häufiges Problem
Eine Firma aus den USA – Braintrust – hat es sich zur Aufgabe gemacht, Unternehmen bei der Optimierung ihrer KI-Tools zu unterstützen. Braintrust bietet Software, die die Leistung von KI-Produkten bewertet und überwacht. So kann ein Unternehmen genau feststellen, wo es hakt, wenn Probleme auftreten. Bei richtiger Implementierung kann die „selbstberichtete Genauigkeit“ von KI-Produkten in wenigen Wochen von unter 40 % auf über 80 % steigen.
Trotz seines jungen Alters hat Braintrust bereits eine beeindruckende Kundenbasis, darunter Unicorns wie Airtable, Brex, Instacart und Stripe. Die Zahl der Kunden hat sich in den letzten drei Monaten verdoppelt, und viele zahlen inzwischen Zehntausende, manchmal sogar über 100.000 US-Dollar für die Dienstleistungen des Unternehmens. Mit einer Finanzierungsrunde von 36 Millionen US-Dollar, angeführt von dem a16z-Partner Martin Casado, strebt Braintrust nun an, seine Reichweite über die Silicon Valley hinaus zu erweitern.
Flexibilität durch ein Composable System
Braintrust arbeitet mit einem Software Development Kit (SDK), das in die IT-Infrastruktur eines Unternehmens integriert wird. Erste Nutzer wie Notion und Zapier nutzten die Bewertungen, um die Leistung ihrer KI-Tools besser zu verstehen. Durch justierbare Faktoren wie benutzerdefinierte Eingaben oder den Wechsel von OpenAI’s GPT-4 zu Anthropic’s Claude konnten genauere Resultate erzielt werden. Zukünftig wird es für Unternehmen immer wichtiger, Tools wie Braintrust von Anfang an zu integrieren, um eine kontinuierliche Überwachung und Anpassung zu gewährleisten.
Die unterstreicht den Composable Ansatz in der KI. Durch Kombination von Modellen, Optimierung der Prompts und Überwachung der Antworten werden Ergebnisse immer besser und zielgenau für Ihr Unternehmen.
Ein Blick in die Zukunft
Die Geschichte von Braintrust zeigt, wie Flexibilität und ein sogenannter composable Ansatz im KI-Bereich entscheidend sein können. Durch das Anpassen und Abstimmen von Komponenten können Unternehmen ihre Innovationskraft stärken und ihre Kernprodukte reibungslos mit experimentellen, modellbasierten Ergänzungen verbinden.
Es liegt auf der Hand, dass die Welt der Large Language Models (LLMs) und generativer KI-Technologien weiterhin in Bewegung ist. Unternehmen, die flexibel auf Veränderungen reagieren und einen composable Ansatz verfolgen, werden in dieser sich entwickelnden Landschaft besser navigieren können.