Home Tech AWS twierdzi, że dzięki S3 Vectors GA zaoszczędził 90% kosztów wektorowych i...

AWS twierdzi, że dzięki S3 Vectors GA zaoszczędził 90% kosztów wektorowych i nazywa to „uzupełnieniem” – analitycy różnią się co do tego, co to oznacza dla wektorowych baz danych

10
0

Wektorowe bazy danych stały się niezbędnym fundamentem technologicznym u zarania ery sztucznej inteligencji współczesnej generacji.

Jednak w ciągu ostatniego roku zmieniło się to, że wektory, czyli numeryczne reprezentacje danych wykorzystywane przez LLM, w coraz większym stopniu stają się po prostu kolejnym rodzajem danych w różnego rodzaju różnych bazach danych. Teraz Amazon Web Services (AWS) robi kolejny krok w kierunku wszechobecności wektorów dzięki ogólnej dostępności wektorów Amazon S3.

Amazon S3 to usługa przechowywania obiektów w chmurze AWS, powszechnie stosowana przez organizacje każdej wielkości do przechowywania wszystkich typów danych. Najczęściej S3 jest również używany jako podstawowy komponent do wdrażania jezior danych i Lakehouse. Amazon S3 Vectors dodaje teraz natywne możliwości przechowywania wektorów i wyszukiwania podobieństw bezpośrednio do przechowywania obiektów S3. Zamiast potrzeby oddzielnej bazy danych wektorów, organizacje mogą przechowywać wstawki wektorów w S3 i wysyłać do nich zapytania na potrzeby wyszukiwania semantycznego, aplikacji do generowania rozszerzonego wyszukiwania (RAG) i przepływów pracy agentów sztucznej inteligencji bez przenoszenia danych do wyspecjalizowanej infrastruktury

Usługę wprowadzono po raz pierwszy w lipcu i początkowo oferowano 50 milionów wektorów w jednym indeksie. W wersji GA AWS radykalnie zwiększył tę liczbę do 2 miliardów wektorów w jednym indeksie i do 20 bilionów wektorów na wiadro pamięci S3.

Według AWS użytkownicy utworzyli ponad 250 000 indeksów wektorowych i wprowadzili ponad 40 miliardów wektorów w ciągu czterech miesięcy od uruchomienia wersji zapoznawczej. Skalowanie wraz z wprowadzeniem GA umożliwia teraz organizacjom konsolidację całych zbiorów danych wektorowych w pojedyncze indeksy zamiast fragmentowania ich w całej infrastrukturze. Wprowadzenie GA wstrząsa także działem danych w przedsiębiorstwie, zapewniając nowe, gotowe do produkcji podejście do wektorów, które może potencjalnie zakłócić rynek specjalnie zbudowanych wektorowych baz danych.

Dolewam oliwy do ognia konkurencji, AWS roszczenia że usługa S3 Vector może pomóc organizacjom „zmniejszyć całkowite koszty przechowywania wektorów i zapytań nawet o 90% w porównaniu do specjalistycznych rozwiązań baz danych wektorowych”.

AWS pozycjonuje S3 Vector jako komplementarny, a nie konkurencyjny w stosunku do wektorowych baz danych

Choć Amazon S3 Vectors zapewnia potężny zestaw funkcji wektorowych, odpowiedź na pytanie, czy zastępuje potrzebę posiadania dedykowanej bazy danych wektorów, jest nieco zniuansowana — i zależy od tego, kogo spytasz.

Pomimo agresywnych deklaracji kosztów i radykalnej poprawy skali, AWS pozycjonuje S3 Vectors jako uzupełniający poziom pamięci masowej, a nie bezpośredni zamiennik wyspecjalizowanych wektorowych baz danych.

„Klienci wybierają, czy chcą używać wektorów S3, czy wektorowej bazy danych, w zależności od potrzeb aplikacji w zakresie opóźnień” – powiedziała VentureBeat Mai-Lan Tomsen Bukovec, wiceprezes ds. technologii w AWS.

Bukovec zauważył, że można o tym myśleć jako o „warstwie wydajności” opartej na potrzebach aplikacji organizacji. Zauważyła, że ​​wektorowa baza danych, taka jak Amazon OpenSearch, jest dobrym rozwiązaniem, jeśli aplikacja wymaga superszybkiego czasu reakcji i małych opóźnień.

„Ale w przypadku wielu typów operacji, takich jak tworzenie warstwy semantycznej umożliwiającej zrozumienie istniejących danych lub rozszerzanie pamięci agenta o znacznie większy kontekst, S3 Vectors świetnie się sprawdza”.

Pytanie, czy S3 i jego niedroga obiektowa pamięć masowa w chmurze zastąpią typ bazy danych, również nie jest nowością dla specjalistów zajmujących się danymi. Bukovec dokonał analogii do dzisiejszego sposobu, w jaki firmy korzystają z jezior danych.

„Spodziewam się, że pamięć wektorowa będzie ewoluować podobnie do danych tabelarycznych w jeziorach danych, gdzie klienci w dalszym ciągu będą korzystać z transakcyjnych baz danych, takich jak Amazon Aurora, do określonych typów obciążeń i równolegle korzystać z S3 do przechowywania aplikacji i analiz, ponieważ profil wydajności działa, a ze względu na wzrost danych potrzebują trwałości, skalowalności, dostępności i opłacalności S3”.

Jak zapotrzebowanie i wymagania klientów ukształtowały usługi Amazon S3 Vector

W ciągu pierwszych kilku miesięcy przeglądu AWS dowiedział się, czego naprawdę chcą i potrzebują prawdziwi użytkownicy biznesowi w zakresie przechowywania danych wektorowych.

„Otrzymaliśmy wiele bardzo pozytywnych opinii na temat wersji zapoznawczych, a klienci powiedzieli nam, że chcą mieć możliwości, ale na znacznie wyższym poziomie i z mniejszymi opóźnieniami, aby móc używać S3 jako podstawowej pamięci wektorowej dla większości szybko rozwijającej się pamięci wektorowej” – powiedział Bukovec.

Dzięki ulepszonemu skalowaniu opóźnienie zapytań zostało skrócone do około 100 milisekund lub mniej w przypadku częstych zapytań, a rzadkie zapytania kończą się w czasie krótszym niż jedna sekunda. AWS zwiększyło maksymalną liczbę wyników wyszukiwania na zapytanie z 30 do 100, a wydajność zapisu obsługuje teraz do 1000 transakcji PUT na sekundę w przypadku aktualizacji pojedynczych wektorów.

Przypadki użycia, które zyskują na popularności, obejmują wyszukiwanie hybrydowe, rozszerzanie pamięci agenta i tworzenie warstwy semantycznej na istniejących danych.

Bukovec zauważył, że jeden z klientów korzystających z wersji próbnej, March Networks, używa wektorów S3 do analizy wideo i zdjęć na dużą skalę.

„Ekonomia przechowywania wektorów i profile opóźnień oznaczają, że March Networks może w ekonomiczny sposób przechowywać miliardy wstawek wektorów” – stwierdziła. „Nasza wbudowana integracja z Amazon Bedrock oznacza, że ​​łatwo jest włączyć pamięć wektorową do generatywnych strumieni AI i wideo”.

Dostawcy wektorowych baz danych zwracają uwagę na braki w wydajności

Dostawcy wyspecjalizowanych wektorowych baz danych podkreślają znaczące luki w wydajności pomiędzy ich ofertami a podejściem AWS skupiającym się na pamięci masowej.

Dostawcy dedykowanych wektorowych baz danych, m.in StożekMiędzy innymi Weaviate, Qdrant i Chroma opracowały wdrożenia produkcyjne z zaawansowanymi algorytmami indeksowania, aktualizacjami w czasie rzeczywistym i dedykowaną optymalizacją zapytań dla obciążeń wrażliwych na opóźnienia.

Na przykład Pinecone nie postrzega Amazon S3 Vectors jako konkurencyjnego wyzwania dla swojej bazy danych wektorowych.

„Przed pierwszym wprowadzeniem Amazon S3 Vectors zostaliśmy poinformowani o projekcie i nie sądziliśmy, że stosunek ceny do wydajności będzie w dużym stopniu bezpośrednio konkurencyjny” – powiedział VentureBeat Jeff Zhu, wiceprezes ds. produktu w Pinecone. „Jest to szczególnie prawdziwe teraz w przypadku naszych dedykowanych węzłów odczytu, gdzie na przykład nasz duży klient z rynku e-commerce niedawno porównał przypadek użycia poleceń z wektorami 1,4B i osiągnął 5,7 tys. QPS przy 26 ms p50 i 60 ms p99”.

Analitycy są podzieleni co do przyszłości wektorowych baz danych

Premiera ponownie ożywia debatę na temat tego, czy wyszukiwanie wektorowe pozostaje samodzielną kategorią produktów, czy też staje się funkcją udostępnianą przez główne platformy chmurowe poprzez integrację pamięci masowej.

„Od jakiegoś czasu było jasne, że Vector to funkcja, a nie produkt” – napisał Corey Quinn, główny ekonomista chmury w The Duckbill Group wiadomość w X (dawniej Twitter) w odpowiedzi na zapytanie VentureBeat. „Teraz mówi wszystko, reszta wkrótce”.

Analityk Constellation Research, Holger Mueller, również postrzega Amazon S3 Vectors jako konkurencyjne zagrożenie dla niezależnych dostawców wektorowych baz danych.

„Teraz wracamy do dostawców wektorów, aby upewnić się, że są zaawansowani i lepsi” – Mueller powiedział VentureBeat. „W oprogramowaniu biznesowym pakiety zawsze wygrywają.”

Mueller podkreślił także zaletę podejścia AWS do eliminowania przenoszenia danych. Zaznaczył, że wektory są narzędziem, które pomaga LLM zrozumieć dane biznesowe. Prawdziwym wyzwaniem jest utworzenie wektorów, co obejmuje sposób przenoszenia danych i częstotliwość. Dodając obsługę wektorów do S3, gdzie przechowywane są już duże ilości danych biznesowych, można rozwiązać problem przenoszenia danych.

„CxO podoba się to podejście, ponieważ nie wymaga przenoszenia danych do utworzenia wektora” – powiedział Mueller.

Starszy wiceprezes firmy Gartner, Ed Anderson, widzi rozwój AWS dzięki nowym usługom, ale nie spodziewa się, że będzie to oznaczać koniec wektorowych baz danych. Zauważył, że organizacje korzystające z S3 do przechowywania obiektów mogą zwiększyć wykorzystanie S3 i prawdopodobnie wyeliminować potrzebę stosowania baz danych dedykowanych dostawców. Zwiększy to wartość dla klientów S3, jednocześnie zwiększając ich zależność od pamięci masowej S3.

Nawet przy takim potencjale wzrostu AWS, wektorowe bazy danych są nadal potrzebne, przynajmniej na razie.

„Amazon S3 Vectors będzie cenny dla klientów, ale nie wyeliminuje potrzeby stosowania wektorowych baz danych, zwłaszcza gdy przypadki użycia wymagają usług danych o małych opóźnieniach i wysokiej wydajności” – Anderson powiedział VentureBeat.

Wydaje się, że sam AWS podziela ten uzupełniający pogląd, sygnalizując jednocześnie stałą poprawę wydajności.

„Jesteśmy dopiero na początku zarówno skali, jak i wydajności S3 Vectors” – powiedział Bukovec. „Tak jak poprawiliśmy wydajność odczytu i zapisu danych w S3 we wszystkim, od plików wideo po pliki Parquet, zrobimy to samo w przypadku wektorów”.

Co to oznacza dla przedsiębiorstw

Oprócz debaty na temat tego, czy wektorowe bazy danych przetrwają jako samodzielne produkty, architekci korporacyjni natychmiast stają przed decyzjami dotyczącymi sposobu wdrożenia przechowywania wektorów dla produkcyjnych obciążeń AI.

Struktura poziomu wydajności zapewnia jaśniejszą ścieżkę decyzyjną architektom biznesowym oceniającym opcje przechowywania wektorowego.

S3 Vectors działa w przypadku obciążeń tolerujących opóźnienie 100 ms: wyszukiwanie semantyczne dużych kolekcji dokumentów, systemy pamięci agentów, analizy wsadowe dotyczące wektorów osadzania i pobieranie kontekstu RAG w tle. Ekonomia staje się przekonująca na dużą skalę dla organizacji, które już zainwestowały w infrastrukturę AWS.

Specjalistyczne wektorowe bazy danych są nadal potrzebne w przypadkach zastosowań wrażliwych na opóźnienia: silniki rekomendacji działające w czasie rzeczywistym, wysokoprzepustowe wyszukiwanie obsługujące tysiące jednoczesnych zapytań, interaktywne aplikacje, w których użytkownicy czekają na synchronizację wyników, oraz obciążenia, w przypadku których spójność wydajności przewyższa koszty.

W przypadku organizacji obsługujących oba typy obciążeń podejście hybrydowe odzwierciedla sposób, w jaki przedsiębiorstwa już korzystają z jezior danych, wdrażając wyspecjalizowane wektorowe bazy danych dla zapytań o krytycznym znaczeniu dla wydajności, a jednocześnie wykorzystując wektory S3 do przechowywania danych na dużą skalę i operacji mniej wrażliwych na czas.

Kluczowym pytaniem nie jest to, czy wymienić istniejącą infrastrukturę, ale jak zaprojektować pamięć wektorową na wszystkich poziomach wydajności w oparciu o wymagania dotyczące obciążenia.

Enlace de origen