Tech

Programiści mogą teraz dodawać aktualne dane z Map Google do wyników aplikacji AI obsługiwanych przez Gemini

Google dodaje nową funkcję dla zewnętrznych programistów budujących modele AI Gemini, które prawdopodobnie nie zostaną wkrótce udostępnione takim konkurentom, jak ChatGPT OpenAI, Claude Anthropic i rosnąca gama chińskich opcji open source: uziemienie z Mapami Google.

Ta wtyczka umożliwia programistom połączenie możliwości myślenia modeli AI Gemini firmy Google z aktualnymi danymi geoprzestrzennymi z Map Google, umożliwiając aplikacjom dostarczanie szczegółowych odpowiedzi związanych z lokalizacją na zapytania użytkowników – takie jak godziny pracy, recenzje czy atmosfera miejsca.

Korzystając z danych z ponad 250 milionów lokalizacji, programiści mogą teraz tworzyć bardziej inteligentne i wrażliwe na lokalizację doświadczenia.

Jest to szczególnie przydatne w zastosowaniach, w których ważna jest bliskość, dostępność w czasie rzeczywistym lub personalizacja specyficzna dla lokalizacji — takich jak wyszukiwanie lokalne, usługi dostawcze, nieruchomości i planowanie podróży.

Gdy znana jest lokalizacja użytkownika, programiści mogą przekazać żądaniu szerokość i długość geograficzną, aby poprawić jakość odpowiedzi.

Dzięki ścisłej integracji danych Map w czasie rzeczywistym i danych historycznych z interfejsem API Gemini, Google umożliwia aplikacjom generowanie świadomych, specyficznych dla lokalizacji odpowiedzi z dokładnością do faktów i głębią kontekstu, jaką można uzyskać dzięki infrastrukturze mapowania.

Połączenie sztucznej inteligencji i inteligencji geoprzestrzennej

Nowa funkcja jest dostępna w Google AI Studio, gdzie programiści mogą wypróbować wersję demonstracyjną na żywo obsługiwaną przez Gemini Live API. Modele obsługujące uziemienie w Mapach Google obejmują:

  • Bliźnięta 2.5 Pro

  • Gemini 2.5 Flash

  • Gemini 2.5 Flash-Lite

  • Błysk Gemini 2.0

Podczas jednej z demonstracji użytkownik poprosił o rekomendacje dotyczące włoskiej restauracji w Chicago.

Korzystając z danych Map, asystent wyszukał najwyżej oceniane opcje i wyjaśnił błędnie wpisaną nazwę restauracji, zanim zlokalizował właściwe miejsce z prawidłowymi danymi firmy.

Programiści mogą także pobrać token kontekstu, aby osadzić widżet Map Google w interfejsie użytkownika aplikacji. Ten interaktywny komponent wyświetla zdjęcia, recenzje i inne znane treści, które zwykle można znaleźć w Mapach Google.

Integracją zarządza generateContent metoda w interfejsie API Gemini, do której programiści dołączają googleMaps jako narzędzie. Mogę także włączyć widżet Mapy, ustawiając parametr w żądaniu. Widget wyświetlany przy użyciu zwróconego tokena kontekstu może zapewnić warstwę wizualną obok tekstu wygenerowanego przez sztuczną inteligencję.

Przypadki użycia w różnych branżach

Narzędzie uziemiające Mapy zaprojektowano z myślą o szerokiej gamie praktycznych zastosowań:

  • Generowanie planu podróży: Aplikacje podróżnicze mogą tworzyć szczegółowe plany dzienne z informacjami o trasie, czasie i lokalizacji.

  • Spersonalizowane rekomendacje lokalne: Platformy nieruchomości mogą wyświetlać reklamy w pobliżu obiektów przyjaznych dzieciom, takich jak szkoły i parki.

  • Szczegółowe zapytania lokalizacyjne: Aplikacje mogą dostarczać określonych informacji, np. czy kawiarnia oferuje miejsca do siedzenia na świeżym powietrzu, korzystając z opinii społeczności i metadanych map.

Zachęcamy programistów do włączania tego narzędzia tylko wtedy, gdy ma to znaczenie kontekst geograficzny, aby zoptymalizować wydajność i koszty.

Według dokumentacji dewelopera ceny zaczynają się od 25 dolarów za 1000 zapytań — to ogromna suma dla tych, którzy wysyłają dużo zapytań.

Połączenie wyszukiwania i map w celu uzyskania lepszego kontekstu

Programiści mogą używać Grounding w Mapach Google razem z Grounding w wyszukiwarce Google w tym samym żądaniu.

Podczas gdy narzędzie Mapy dostarcza danych opartych na faktach, takich jak adresy, godziny otwarcia i oceny, narzędzie Wyszukiwanie dodaje szerszy kontekst z treści internetowych, takich jak wiadomości lub wykazy wydarzeń.

Na przykład, gdy pytasz o muzykę na żywo na Beale Street, połączone narzędzia podają szczegółowe informacje o miejscu z Map i czasie wydarzenia z wyszukiwarki.

Według Google wewnętrzne testy pokazują, że jednoczesne użycie obu narzędzi prowadzi do znacznej poprawy jakości odpowiedzi.

Personalizacja i elastyczność programisty

Doświadczenie zostało stworzone z myślą o personalizacji. Programiści mogą dostosowywać komunikaty systemowe, wybierać pomiędzy różnymi modelami Gemini i konfigurować ustawienia głosowe, aby dostosować interakcje.

Aplikację demonstracyjną w Google AI Studio można również remiksować, umożliwiając programistom testowanie pomysłów, dodawanie funkcji i iterację projektów w elastycznym środowisku programistycznym.

Interfejs API zwraca uporządkowane metadane — w tym linki źródłowe, identyfikatory witryn i zakresy cytatów — których programiści mogą używać do tworzenia osadzonych cytatów lub weryfikowania wyników generowanych przez sztuczną inteligencję.

Wspiera to przejrzystość i zwiększa zaufanie do aplikacji dostępnych dla użytkownika. Google wymaga również, aby źródła oparte na Mapach były wyraźnie wymienione i powiązane ze źródłem za pomocą ich identyfikatora URI.

Uwagi dotyczące implementacji dla twórców sztucznej inteligencji

Zespołom technicznym integrującym tę funkcję Google zaleca:

  • Przekazywanie kontekstu lokalizacji użytkownika, jeśli jest znany, w celu uzyskania lepszych wyników.

  • Wyświetlaj natywne linki do Map Google bezpośrednio pod odpowiednią treścią.

  • Włączenie narzędzia tylko wtedy, gdy zapytanie wyraźnie zawiera kontekst geograficzny.

  • Monitoruj opóźnienia i wyłączaj uziemienie, gdy wydajność jest krytyczna.

Uziemienie za pomocą Map Google jest obecnie dostępne na całym świecie, chociaż jest zakazane na kilku terytoriach (w tym w Chinach, Iranie, Korei Północnej i na Kubie) i nie jest dozwolone w sytuacjach awaryjnych.

Dostępność i dostęp

Uziemienie z Mapami Google jest teraz ogólnie dostępne poprzez API Gemini.

W tej wersji Google w dalszym ciągu rozszerza możliwości interfejsu API Gemini, umożliwiając programistom tworzenie aplikacji opartych na sztucznej inteligencji, które rozumieją otaczający ich świat i reagują na niego.

Enlace de origen