Tech

Ta nowa technika sztucznej inteligencji tworzy konsumentów „cyfrowych bliźniaków” i może zabić tradycyjną branżę ankiet

Nowy Praca badawcza Opublikowany po cichu w zeszłym tygodniu opis przełomowej metody, która pozwala dużym modelom językowym (LLMS) symulować zachowanie ludzkiego konsumenta z oszałamiającą dokładnością, co może zmienić kształt większej liczby miliardów dolarów Branża badań rynku. Technika ta obiecuje stworzyć armię syntetycznych konsumentów, którzy będą w stanie zapewnić nie tylko rzeczywiste oceny produktów, ale także jakościowe wyjaśnienia za nimi, na skalę i szybkość obecnie nieosiągalną.

Firmy od lat próbowały wykorzystać sztuczną inteligencję do badania rynku, ale zastraszały ją podstawowymi niedociągnięciami: gdy prosiły o ocenę liczbową w skali od 1 do 5, produkty LLM otrzymywały nierealistyczne i słabo rozproszone odpowiedzi. Nowa gazeta”,Llm -s odtwarzają zamiar kupowania ludzi poprzez semantyczne podobieństwo wyjścia z ocen Likerta„Wysłana na serwer przed drukiem ARXIV 9 października proponuje eleganckie rozwiązanie, które całkowicie omija ten problem.

Międzynarodowy zespół badaczy pod przewodnictwem Benjamina F. Maiera opracował metodę, którą nazywa Ocena podobieństwa semantycznego (SSR). Zamiast prosić o numer, SSR szuka wzoru na bogatą, tekstową opinię o produkcie. Tekst ten zostaje następnie przekształcony w wektor numeryczny – „inkorporacja” – jego podobieństwo mierzone jest według zestawu predefiniowanych stwierdzeń referencyjnych. Na przykład odpowiedź „Absolutnie kupiłbym to, właśnie tego szukam” byłaby semantycznie bliższa stwierdzeniu referencyjnemu dla oceny „5” niż stwierdzeniu „1”.

Wyniki są uderzające. Został przetestowany na ogromnym zestawie danych w świecie rzeczywistym od wiodącej korporacji zajmującej się higieną osobistą. Produkt zawiera 57 badań produktów i 9300 odpowiedzi na ludziach – metoda SR osiągnęła 90% wiarygodności testów na ludziach. Co istotne, rozkład wygenerowanych ocen AI statystycznie mimo wszystko miał prawie ludzką płytę. Autorzy stwierdzają: „To pudełko umożliwia skalowalne symulacje badań konsumenckich przy jednoczesnym zachowaniu tradycyjnych wskaźników i możliwości interpretacji badania”.

Rozwiązanie na czas, ponieważ sztuczna inteligencja zagraża integralności ankiety

Rozwój ten następuje w krytycznym momencie, ponieważ sztuczna inteligencja coraz bardziej zagraża integralności tradycyjnych tablic internetowych z ankietami. Analiza 2024 Wydział Szkoły Podyplomowej Stanforda Podkreślił narastający problem badaczy wykorzystujących chatboty do generowania odpowiedzi. Odpowiedzi te są generowane jako „podejrzanie piękne”, nadmiernie werbalne i brakuje im „warczenia” i autentyczności prawdziwych ludzkich opinii, co doprowadziło do tego, co badacze nazwali danymi „homogenizacyjnymi”, które mogą maskować poważne problemy, takie jak dyskryminacja lub wady produktów.

Badania Maiera oferują zupełnie inne podejście: zamiast walczyć o czyszczenie zanieczyszczonych danych, tworzą kontrolowane środowisko do generowania od podstaw syntetycznych danych o wysokiej lojalności.

„Widzimy przejście od obrony do obrażania” – powiedział analityk niezwiązany z badaniem. „Praca Stanforda pokazała chaos wynikający z niekontrolowanego zanieczyszczenia ludzkich danych przez sztuczną inteligencję. Ta nowa praca pokazuje porządek i użyteczność kontrolowanej sztucznej inteligencji, która tworzy własne zbiory danych. Dla głównego inspektora danych jest to różnica między oczyszczeniem zanieczyszczonej studni a dotknięciem świeżej wiosny”.

Od tekstu do intencji: skok techniczny w stronę syntetycznego konsumenta

Techniczna ważność nowej metody zależy od jakości instalacji tekstowej, co jest koncepcją analizowaną w pracy z 2022 roku. Nauka o danych EPJ. W badaniach tych wymagano ścisłych ram „konstrukcji ważności”, aby zapewnić, że instalacja tekstu – liczbowe reprezentacje tekstu – naprawdę „mierzy to, co powinna”.

Sukces Metoda SSR Sugeruje to, że jego instalacja skutecznie rejestruje odcienie intencji zakupu. Aby ta nowa technika została powszechnie zaakceptowana, firmy będą musiały zostać przekonane, że podstawowe modele nie tylko tworzą prawdopodobny tekst, ale także kopiują go do punktów w solidny i znaczący sposób.

Podejście to stanowi także znaczący postęp w stosunku do poprzednich badań, które skupiały się głównie na wykorzystaniu instalacji tekstu do analizy i przewidywania ocen istniejących badań internetowych. I Studia 2022Na przykład ocenili modele takie jak Bert i Word2vec pod kątem przewidywania wyników badań na stronach sklepów detalicznych, ujawniając, że nowsze modele, takie jak Bert, lepiej sprawdzały się w powszechnym zastosowaniu. Nowe badania wykraczają poza analizę istniejących danych i generują nowe, przewidywalne spostrzeżenia, zanim produkt w ogóle trafi na rynek.

Dawn cyfrową grupę fokusową

Dla decydentów technicznych konsekwencje są głębokie. Możliwość uruchomienia „cyfrowego bliźniaka” docelowego segmentu konsumenckiego oraz koncepcja testowania produktu, odmiany kopiowania lub pakowania reklam w ciągu kilku godzin mogłaby drastycznie przyspieszyć cykle innowacji.

Jak zauważono w pracy, ci syntetyczni respondenci przekazują również „bogate informacje jakościowe wyjaśniające ich oceny”, oferując skarbnicę danych potrzebnych do opracowywania produktów, które są zarówno skalowalne, jak i interpretowane. Chociaż ERA jest przedmiotem zainteresowania grup tylko dla człowieka, który jest daleki od ukończenia, badanie to dostarcza najbardziej przekonujących dowodów, ale ich syntetyczni koledzy są gotowi do pracy.

Jednak uzasadnienie biznesowe wykracza poza szybkość i skalę. Weź pod uwagę ekonomię: tradycyjny panel badawczy mający na celu uruchomienie produktu krajowego może kosztować dziesiątki tysięcy dolarów i trwać tygodniami w terenie. Symulacja oparta na SSR może zapewnić porównywalne informacje w ułamku czasu, niewielkim kosztem i z możliwością natychmiastowego powtórzenia na podstawie ustaleń. Dla firm z kategorii, które szybko poruszają się po szerokiej kategorii konsumpcyjnej – gdzie okno pomiędzy koncepcją a półką może określić wiodącą pozycję na rynku pod względem szybkości.

Istnieją oczywiście ostrzeżenia. Metoda została potwierdzona na produktach higieny osobistej; Jego skuteczność w przypadku złożonych decyzji dotyczących zakupu produktów B2B, produktów luksusowych lub produktów specyficznych kulturowo pozostaje niepotwierdzona. I chociaż praca pokazuje, że SSR może powtórzyć połączone zachowania ludzkie, nie twierdzi, że przewiduje indywidualne wybory konsumenckie. Technika ta działa na poziomie populacji, a nie na poziomie osoby – różnica jest niezwykle istotna w zastosowaniach takich jak marketing spersonalizowany.

Jednak nawet przy tych ograniczeniach badania są obrazem. Chociaż ERA jest przedmiotem zainteresowania grup tylko dla człowieka, który jest daleki od ukończenia, ta praca dostarcza najbardziej przekonujących dowodów, ale ich syntetyczni koledzy są gotowi do pracy. Pytanie nie brzmi już, czy sztuczna inteligencja może symulować uczucia konsumentów, ale czy firmy będą w stanie działać wystarczająco szybko, aby skorzystać z niej, zanim zrobią to konkurenci.

Enlace de origen