Tech

Dlaczego wyszukiwarka plików Google może zastąpić stosy szmat do samodzielnego montażu w przedsiębiorstwie

Do tej pory przedsiębiorstwa zdały sobie sprawę, że generowanie rozszerzonego wyszukiwania (RAG) umożliwia aplikacjom i agentom znajdowanie najlepszych i najbardziej świadomych informacji w przypadku zapytań. Jednak typowe konfiguracje RAG mogą stanowić wyzwanie inżynieryjne i wykazują także niepożądane cechy.

Aby rozwiązać ten problem, Google’a udostępniło narzędzie do wyszukiwania plików w interfejsie API Gemini, w pełni zarządzany system RAG, „który abstrakcyjnie potok pobierania”. Wyszukiwanie plików usuwa większość narzędzi i kolekcji aplikacji związanych z konfiguracją potoku RAG, więc inżynierowie nie muszą łączyć takich elementów, jak rozwiązania pamięci masowej i narzędzia do osadzania.

Narzędzie to stanowi bezpośrednią konkurencję dla produktów firmy RAG OpenAI, AWS-a I Microsoftuktóre mają również na celu uproszczenie architektury RAG. Google twierdzi jednak, że jego oferta wymaga mniejszej orkiestracji i jest bardziej samowystarczalna.

„Wyszukiwanie plików to prosty, zintegrowany i skalowalny sposób na wykorzystanie danych Gemini w celu dostarczenia odpowiedzi, które są dokładniejsze, trafniejsze i możliwe do sprawdzenia” – stwierdził Google w wpis na blogu.

Przedsiębiorstwa mogą bezpłatnie uzyskać dostęp do niektórych funkcji wyszukiwania plików, takich jak przechowywanie i generowanie osadzań, w czasie wysyłania zapytań. Użytkownicy zaczną płacić za osadzanie, gdy pliki te zostaną zaindeksowane według ryczałtowej stawki 0,15 dolara za 1 milion tokenów.

Model Google Gemini Embedding, który z biegiem czasu stał się najlepszy model do montażu w teście Massive Text Embedding Benchmark umożliwia wyszukiwanie plików.

Przeglądanie plików i zintegrowane doświadczenia

Google twierdzi, że wyszukiwarka plików działa „obsługując za Ciebie złożoność RAG”.

Wyszukiwanie plików zarządza przechowywaniem plików, strategiami udostępniania i osadzaniem. Programiści mogą wywoływać funkcję File Search w ramach istniejącego interfejsu generateContent API, co według Google ułatwia przyjęcie tego narzędzia.

Wyszukiwanie plików korzysta z wyszukiwania wektorowego, aby „zrozumieć znaczenie i kontekst zapytania użytkownika”. W idealnym przypadku znajdzie odpowiednie informacje, aby odpowiedzieć na zapytanie z dokumentów, nawet jeśli zapytanie zawiera nieprawidłowe słowa.

Ta funkcja ma wbudowane cytaty wskazujące określone części dokumentu użytego do wygenerowania odpowiedzi, a także obsługuje różne formaty plików. Należą do nich pliki PDF, Docx, txt, JSON i „wiele typów plików popularnych języków programowania” – twierdzi Google.

Ciągłe eksperymenty RAG

Przedsiębiorstwa mogły już rozpocząć tworzenie rurociągów RAG, kładąc podwaliny pod swoich agentów AI, aby mogli naprawdę pobierać dokładne dane i podejmować świadome decyzje.

Ponieważ RAG odgrywa kluczową rolę w utrzymaniu dokładności i uzyskiwaniu dostępu do wglądu w swoje operacje, organizacje muszą szybko uzyskać wgląd w ten potok. RAG może być problemem inżynieryjnym, ponieważ koordynacja wielu narzędzi może być skomplikowana.

Tworzenie „tradycyjnych” potoków RAG oznacza, że ​​organizacje muszą skompilować i dostroić program do pozyskiwania i analizowania plików, w tym dzielenia na porcje, generowania osadzania i aktualizacji. Następnie muszą zawrzeć umowę z wektorową bazą danych, np Stożekokreśl logikę pobierania i umieść wszystko w oknie kontekstowym modelu. Dodatkowo na życzenie mogę dodać cytaty źródłowe.

Wyszukiwanie plików ma na celu uproszczenie tego wszystkiego, chociaż konkurencyjne platformy oferują podobne funkcje. z OpenAI Asystent API umożliwia programistom korzystanie z funkcji wyszukiwania plików, kierując agenta do odpowiednich dokumentów w celu uzyskania odpowiedzi. Przedstawiamy Bedrock AWS usługa zarządzana poprzez automatyzację danych w grudniu.

Chociaż wyszukiwarka plików jest podobna do innych platform, oferta Google obejmuje wszystkie, a nie tylko niektóre elementy tworzenia potoku RAG.

Phaser Studio, twórca platformy Beam do generowania gier opartej na sztucznej inteligencji, poinformował na blogu Google, że korzystał z narzędzia File Search do przeglądania swojej biblioteki liczącej 3000 plików.

„Wyszukiwanie plików pozwala nam natychmiast znaleźć odpowiedni materiał, niezależnie od tego, czy jest to fragment kodu dla próbek znaczników, szablony gatunków czy wytyczne architektoniczne z naszego korpusu mózgowego Phasera” – powiedział Richard Davey, dyrektor ds. technicznych Phaser. „Rezultat jest taki, że pomysły, których prototypowanie kiedyś zajmowało kilka dni, teraz można wdrożyć w ciągu kilku minut”.

Od czasu ogłoszenia kilku użytkowników wyraziło zainteresowanie korzystaniem z tej funkcji.

Enlace de origen