Kiedy pisałem po raz pierwszy “Bazy wektorowe: Syndrom błyszczącego przedmiotu i przypadek zaginionego jednorożca“ w marcu 2024 r. w branży zapanował szum. Bazy danych wektorowych są ustawione jako następna wielka rzecz — niezbędna warstwa infrastruktury w erze sztucznej inteligencji. Popłynęły miliardy dolarów z przedsiębiorczości, programiści spieszyli się z integracją rozwiązań osadzonych w swoich projektach, a analitycy z zapartym tchem śledzili rundy finansowania Stożek, Splot, Chrom, smok i kilkanaście innych.
Obietnica była odurzająca: wreszcie sposób wyszukiwania według znaczenia, a nie delikatnych słów kluczowych. Po prostu przenieś swoją wiedzę biznesową do handlu wektorowego, podłącz LLM i obserwuj, jak dzieje się magia.
Tyle że magia nigdy się nie zmaterializowała.
Dwa lata później sprawdzenie rzeczywistości już nadszedł: 95% organizacji, które zainwestowały w inicjatywy gen AI, nie widzi zerowych wymiernych zysków. Wiele ostrzeżeń, które wówczas podałem – dotyczących ograniczeń wektorów, zatłoczonego krajobrazu dostawców i ryzyka związanego z traktowaniem wektorowych baz danych jako złotego środka – sprawdziło się niemal dokładnie zgodnie z przewidywaniami.
Prognoza 1: Zaginiony jednorożec
Następnie zastanawiałem się, czy Pinecone — dziecko z plakatu tej kategorii — osiągnie status jednorożca lub stanie się „zaginionym jednorożcem” świata baz danych. Dziś odpowiedź na to pytanie została udzielona w najbardziej wymowny sposób: to Šišarka podobno bada sprzedażktóra stara się przebić przez zaciętą konkurencję i odpływ klientów.
Tak, Pinecone zbudował duże kręgi i podpisał logo namiotów. Ale w praktyce zróżnicowanie było niewielkie. Gracze open source, tacy jak Milvus, Qdrant i Chroma, podcinają je pod względem kosztów. Istniejący producenci, tacy jak Postgres (z pgWektor) i Elasticsearch po prostu dodały obsługę wektorów jako funkcję. A klienci coraz częściej pytali: „Po co wprowadzać zupełnie nową bazę danych, skoro mój istniejący stos już wystarczająco dobrze współpracuje z wektorami?”
Rezultat: szyszka, niegdyś wyceniana na miliard dolarów, teraz szuka domu. Rzeczywiście zaginiony jednorożec. We wrześniu 2025 r. Pinecon mianował Ashutosha jako CEO, a założyciel Edo Liberty na stanowisko Chief Scientist. Czas jest wymowny: zmiana przywództwa następuje w obliczu rosnącej presji i pytań o jego długoterminową niezależność.
Prognoza 2: Same wektory zawiodą
Argumentowałem również, że wektorowe bazy danych same w sobie nie są ostatecznym rozwiązaniem. Jeśli Twój przypadek użycia wymaga precyzji – jak wyszukiwanie „błądu 221” w instrukcji – wyszukiwanie czysto wektorowe z radością sprawdziłoby się jako „błąd 222” jako „wystarczająco blisko”. Ładny w wersji demonstracyjnej, katastrofalny w produkcji.
To napięcie między podobieństwem a trafnością okazało się zabójcze dla mitu wektorowych baz danych jako maszyn uniwersalnych.
„Firmy na własnej skórze przekonały się, że semantyka ≠ jest poprawna”.
Twórcy, którzy szczęśliwie zastąpili wyszukiwanie leksykalne wektorami, szybko ponownie wprowadzili… wyszukiwanie leksykalne połączone z wektorami. Zespoły, które oczekiwały, że wektory „po prostu będą działać”, ostatecznie filtrowały metadane, rerankingowcy i ręcznie dostosowane reguły. Do 2025 r. konsensus będzie jasny: wektory mają potężną moc, ale tylko jako część zestawu hybrydowego.
Prognoza 3: Zatłoczone pole staje się towarem
Eksplozja start-upów zajmujących się bazami danych wektorowych nigdy nie była trwała. Weaviate, Milvus (przez Zilliz), Chroma, Vespa, Qdrant — każdy z nich twierdził, że ma subtelne wyróżniki, ale dla większości klientów wszyscy robili to samo: przechowywali wektory i pobierali najbliższych sąsiadów.
Dziś bardzo niewielu z tych graczy przebija się. Rynek jest rozdrobniony, utowarowiony i pod wieloma względami wchłonięty przez istniejące firmy. Wyszukiwanie wektorów jest teraz funkcją pola wyboru na platformach danych w chmurze, a nie samodzielną fosą.
Jak wtedy pisałem: odróżnienie jednego wektora DB od drugiego będzie coraz większym wyzwaniem. To wyzwanie stało się jeszcze trudniejsze. Miasto, Margo, LanceDB, PostgresSQL, Fala ciepła MySQL, Wyrocznia 23c, Azure SQL, Cassandra, Redisa, Neo4j, Pojedynczy sklep, Elastyczne wyszukiwanie, Otwórz wyszukiwanie, Apache Solr… lista jest długa.
Nowa rzeczywistość: Hybrid i GraphRAG
Ale to nie jest tylko historia upadku – to historia ewolucji. Z popiołów wektorowego szumu wyłaniają się nowe paradygmaty, które łączą w sobie to, co najlepsze z wielu podejść.
Wyszukiwanie hybrydowe: słowo kluczowe + wektor jest teraz ustawieniem domyślnym w przypadku poważnych zastosowań. Firmy nauczyły się, że potrzebna jest zarówno precyzja, jak i niejasność, dokładność i semantyka. Narzędzia takie jak Apache Solr, Elasticsearch, pgVector i własne „kaskadowe pobieranie” Pinecone obsługują to.
WykresRAG: Najpopularniejsze słowo końca roku 2024/2025. to GraphRAG — rozszerzona generacja wyszukiwania wspomaganego wykresami. Łącząc wektory z grafami wiedzy, GraphRAG koduje relacje między bytami, które osadzając się spłaszczają. Wypłata jest dramatyczna.
Punkty odniesienia i dowody
-
Blog AI Amazona podaje punkty odniesienia z Lettriagdzie hybrydowy GraphRAG zwiększył dokładność odpowiedzi z ~50% do ponad 80% na testowych zbiorach danych w finansach, opiece zdrowotnej, przemyśle i prawie.
-
The Ławka GraphRAG benchmark (wydany w maju 2025 r.) zapewnia rygorystyczną ocenę GraphRAG w porównaniu z podstawowym RAG poprzez zadania wnioskowania, zapytania z wieloma przeskokami i wyzwania domeny.
-
Jakiś Ocena OpenReview RAG w porównaniu z GraphRAG odkryli, że każde podejście ma zalety w zależności od zadania, ale kombinacje hybrydowe często dają najlepsze wyniki.
-
Relacjonuje blog FalkorDB że gdy ważna jest precyzja schematu (domeny strukturalne), GraphRAG może przewyższać pobieranie wektorów o współczynnik ~ 3,4x w niektórych testach porównawczych.
Rozwój GraphRAG podkreśla ważniejszy punkt: w odzyskiwaniu nie chodzi o żaden błyszczący przedmiot. Chodzi o budowę systemy odzyskiwania — warstwowe, hybrydowe, kontekstowe potoki, które dostarczają LLM właściwe informacje, z odpowiednią precyzją, we właściwym czasie.
Co to oznacza, idąc dalej
Werdykt jest taki: wektorowe bazy danych nigdy nie były cudem. Stanowiły krok – ważny – w ewolucji poszukiwań i odzyskiwania. Ale to nie jest i nigdy nie było zakończenie gry.
Zwycięzcami w tej przestrzeni nie będą ci, którzy sprzedają wektory jako samodzielną bazę danych. To oni włączą wyszukiwanie wektorowe w szersze ekosystemy, integrując wykresy, metadane, reguły i inżynierię kontekstową w spójne platformy.
Innymi słowy: Unicorn nie jest bazą danych wektorowych. Jednorożec to mnóstwo do pobrania.
Patrząc w przyszłość: co dalej
-
Ujednolicone platformy danych będą obejmować wektor + wykres: Oczekuj, że główni dostawcy baz danych i rozwiązań chmurowych będą oferować zintegrowane zestawy pobierania (wektor + wykres + pełny tekst) jako wbudowane funkcje.
-
„Inżynieria wynalazków” wyłoni się jako odrębna dyscyplina: W miarę dojrzewania MLO, dojrzewać będzie także praktyka osadzania poprawek, rankingów hybrydowych i tworzenia wykresów.
-
Metamodele uczą się lepiej zadawać zapytania: Przyszłe LLM mogą uczyć się aby określić, której metody wyszukiwania użyć dla zapytania, dynamicznie dostosowując wagę.
-
Czasowy i multimodalny GraphRAG: Naukowcy już rozszerzają GraphRAG, aby uwzględniał czas (T-GRAG) i ujednolicone multimodalnie (np. łączenie obrazów, tekstu, wideo).
-
Otwarte testy porównawcze i warstwy abstrakcji: Narzędzia takie jak Test porównawczyQED (do testów porównawczych RAG) i GraphRAG-Bench popchną społeczność w stronę bardziej sprawiedliwych, porównywalnie mierzonych systemów.
Od świetnych obiektów po niezbędną infrastrukturę
Cykl historii bazy danych wektorowych przebiega klasyczną ścieżką: wszechobecnym cyklem szumu, po którym następuje introspekcja, korekta i dojrzewanie. W roku 2025 wyszukiwanie wektorowe nie będzie już błyszczącym obiektem, za którym wszyscy ślepo podążają – stanie się teraz kluczowym elementem bardziej wyrafinowanej, wieloaspektowej architektury wyszukiwania.
Początkowe ostrzeżenia były słuszne. Czysty wektor ma nadzieję często opierać się na ławicach precyzji, złożoności relacyjnej i ograniczeń przedsiębiorstwa. A jednak technologia ta nigdy nie została zmarnowana: zmusiła branżę do ponownego przemyślenia wyszukiwania, łącząc strategie semantyczne, leksykalne i relacyjne.
Jeśli miałbym napisać kontynuację w 2027 r., podejrzewam, że określiłaby ona wektorowe bazy danych nie jako jednorożce, ale jako starszą infrastrukturę – podstawową, ale przyćmioną przez inteligentniejsze warstwy orkiestracji, adaptacyjne kontrolery pobierania i dynamicznie wybierające systemy AI Kto wyszukiwarka pasuje do zapytania.
Odtąd prawdziwa bitwa nie toczy się między wektorami a słowami kluczowymi — liczy się agencja, łączenie i dyscyplina w budowaniu potoków wyszukiwania, które niezawodnie opierają sztuczną inteligencję genu na faktach i wiedzy dziedzinowej. To jednorożec, na którego musimy teraz upolować.
Amit Verma jest szefem inżynierii i laboratoriów AI w firmie Neuron7.
Przeczytaj więcej w naszym autorzy gościnni. Możesz też rozważyć przesłanie własnego posta! Sprawdź nasze wytyczne tutaj.



