Die Pinecone-Vektordatenbank kann jetzt eine hybride semantische Schlüsselwortsuche verarbeiten


Wann Tannenzapfen Anfang letzten Jahres eine Vektordatenbank angekündigt, baute es etwas, das speziell für maschinelles Lernen entwickelt wurde und sich an Data Scientists richtete. Die Idee war, dass Sie diese Daten in einem Format abfragen könnten, das Maschinen verstehen, was es viel schneller macht.

Ursprünglich handelte es sich dabei um semantische Suchen, bei denen Benutzer nach Bedeutung statt nach bestimmten Wörtern suchen konnten. Es stellte sich jedoch heraus, dass es bei der Inbetriebnahme von Pinecone Anwendungsfälle gab, in denen bestimmte Schlüsselwörter eine Rolle spielten, und heute gab das Unternehmen bekannt, dass es jetzt möglich ist, Suchen durchzuführen, die sowohl semantische als auch Schlüsselwortsuchen kombinieren, wie Firmengründer und CEO Edo Liberty es nennt hybride Suche.

„Wir haben viel zu diesem Thema geforscht und festgestellt, dass die hybride Suche tatsächlich besser ist [in many cases]. Es ist besser in dem Sinne, dass, wenn Sie beide semantische Suche kombinieren können, dies die tiefe NLP-Codierung von Sätzen ist, die den Kontext und die Bedeutung usw. erhält, aber Sie können dies auch mit bestimmten Schlüsselwörtern anreichern … die Kombination dieser beiden endet deutlich besser“, sagte Liberty gegenüber TechCrunch.

Er sagt sogar, dass sich die beiden gut ergänzen, insbesondere in Fällen, in denen branchenspezifische Begriffe eine Rolle spielen. Dies könnte so etwas wie ein Arzt sein, der nach Schlüsselwörtern zu einer bestimmten Krankheit sucht. In diesen Fällen kann der medizinische Kontext bessere Ergebnisse liefern, indem eine Frage und einige spezifische Schlüsselwörter zu einer bestimmten Krankheit kombiniert werden.

Er sagt, dass die Schlüsselwörter nie Vorrang vor der semantischen Frage haben, die der Benutzer stellt, aber sie liefern einige zusätzliche Informationen, um aussagekräftigere Ergebnisse zu liefern.

„Vielleicht wissen Sie genau, wonach Sie suchen, und Sie können möglicherweise zusätzlichen Pep geben, wenn Sie Ihre semantische Suche schlüsselwortbewusst machen – und das hilft tatsächlich sehr. Deshalb möchte ich die guten Seiten der Keyword-Suche nicht wegwerfen [by relying completely on semantic search]. Ich möchte nicht, dass die Schlüsselwörter im Vordergrund stehen, aber ich möchte sie auch nicht vollständig ignorieren“, sagte er.

Wie Liberty uns anlässlich der 28-Millionen-Dollar-Serie A des Unternehmens im vergangenen Jahr sagte, ist die Suche zu einem großen Anwendungsfall für das Unternehmen geworden.

„Die überwiegende Verwendung der Vektordatenbanken ist die Suche, und zwar die Suche im weitesten Sinne des Wortes. Es geht um das Durchsuchen von Dokumenten, aber Sie können sich die Suche als allgemeine Informationsbeschaffung, Entdeckung, Empfehlung, Erkennung von Anomalien und so weiter vorstellen“, sagte er damals.

Pinecone wurde 2019 gegründet und hat 38 Millionen US-Dollar gesammelt. pro Crunchbase.

source-116

Leave a Reply