Zimą 2022 roku, gdy świat technologii został zahipnotyzowany nagłym, wybuchowym pojawieniem się ChatGPT OpenAI, Benjamina Alariego stoję przed ważnym wyborem. Jego prawniczy startup technologiczny, Niebieski Jmiał szanowany biznes zbudowany na sztucznej inteligencji minionej epoki, obsługując setki firm księgowych z modelami predykcyjnymi. Ale uderzyło w sufit.
Alari, A profesor stały prawa podatkowego NA Uniwersytet w Torontopostrzegał pojawiające się, podatne na błędy, ale potężne możliwości dużych modeli językowych nie jako ciekawostkę, ale jako przyszłość. Podjął ryzykowną decyzję: zmienić całą swoją firmę, którą mozolnie budowano przez prawie dekadę, i odbudować ją od podstaw w oparciu o tę niesprawdzoną technologię.
Ten zakład opłacił się znakomicie. Od tego czasu Blue J po cichu zabezpieczył Seria D za 122 miliony dolarów runda finansowania współprowadzona przez Dąb HC/FT I Szafirowe przedsięwzięciaszacując wycenę spółki na ponad 300 milionów dolarów. To posunięcie przekształciło Blue J z niszowego gracza w jedną z najszybciej rozwijających się kanadyjskich firm zajmujących się technologiami prawniczymi, zwiększając jej przychody około dwunastokrotnie i przyciągając codziennie od 10 do 15 nowych klientów.
Firma obsługuje obecnie ponad 3500 organizacji, w tym światowego giganta księgowego KPMG i kilka firm z listy Fortune 500. Zajmuje się krytycznym wąskim gardłem w branży usług profesjonalnych: poważnym i rosnącym niedoborem talentów. W USA jest o 340 000 mniej księgowych niż pięć lat temua biorąc pod uwagę, że w ciągu następnej dekady oczekuje się, że 75% obecnych CPA odejdzie na emeryturę, firmy desperacko poszukują narzędzi, które mogą zwiększyć produktywność pozostałych specjalistów.
„To, co kiedyś zajmowało specjalistom podatkowym 15 godzin ręcznego wyszukiwania, teraz dzięki Blue J można wykonać w około 15 sekund” – powiedział Alarie, dyrektor generalny firmy, w ekskluzywnym wywiadzie dla VentureBeat. „Ta wartość – możemy wykorzystać godziny pracy i zamienić je w sekundy pracy – to jest główny czynnik napędzający tę sytuację”.
Kiedy biografia dziekana była błędna: moment, który zmienił wszystko
Alarie doskonale pamięta styczeń 2023 r., kiedy dziekan wydziału prawa odwiedził jego biuro z życzeniami noworocznymi. Zapytał ją o ChatGPT i skłonił sztuczną inteligencję do jej opisania. ChatGPT niezawodnie generowane bio. Niektóre szczegóły były prawidłowe. Inne były całkowicie fikcyjne.
„Powiedziała: «OK, to naprawdę przerażające. To jest złe i ma konsekwencje»” – powiedziała Alarie. Jednak ten moment pozornej porażki go nie powstrzymał. Zamiast tego skrystalizowało jego wiarę.
Pierwsza wersja firmy, wprowadzona na rynek w 2015 r., wykorzystywała nadzorowane uczenie maszynowe do tworzenia modeli predykcyjnych, które mogłyby przewidzieć wyniki sądów w konkretnych kwestiach podatkowych. Chociaż był zaawansowany technicznie, miał zasadniczą wadę: nie mógł odpowiedzieć na wszystkie pytania badawcze dotyczące podatków.
„Wyzwanie polegało na tym, że nie mógł odpowiedzieć na każde pytanie w ankiecie podatkowej, co było tak naprawdę świętym Graalem” – powiedział Alarie. Klienci pokochali to narzędzie, gdy odnosiło się do ich problemu, ale szybko je porzucali, gdy nie odnosiło się do niego. Przychody wyniosły około 2 milionów dolarów rocznie.
Pomimo notorycznych halucynacji ChatGPT, Alarie przekonał swoje kierownictwo, aby stało się osią. „Byłem przekonany, że jeśli będziemy dalej podążać tą ścieżką, nie będziemy w stanie rozwiązać naszego ograniczenia numer jeden” – powiedział. „Duże modele językowe wydawały się obiecującym kierunkiem”.
Dał swojemu zespołowi sześć miesięcy na dostarczenie działającego produktu.
Od 90 sekund odpowiedzi na 3 miliony zapytań: jak Blue J oswoił halucynacje AI
Do sierpnia 2023 r. Niebieski J był gotowy do startu. To, co wypuścili, było, według uczciwej oceny Alaria, „super gównem”. System potrzebował 90 sekund na reakcję. Około połowa odpowiedzi zawierała problemy. The Wynik promotora netto zarejestrowany w wieku zaledwie 20 lat.
Tym, co przekształciło ten wadliwy produkt w dzisiejszą platformę – z czasem reakcji mierzonym w sekundach, wskaźnikiem niezadowolenia wynoszącym zaledwie jedno na 700 zapytań i wynikiem NPS w połowie lat 80. – było nieustające skupienie się na trzech strategicznych filarach.
Po pierwsze, są to treści zastrzeżone na masową skalę. Niebieski J zabezpieczone wyłączne licencje z Analitycy podatkowi (noty podatkowe) I IBFDglobalny organ podatkowy z siedzibą w Amsterdamie, obejmujący ponad 220 jurysdykcji. „Jesteśmy jedyną platformą na świecie, która pobiera najlepsze informacje podatkowe w USA z not podatkowych i najlepsze informacje podatkowe na całym świecie z IBFD” – powiedział Alarie.
Po drugie, jest to głęboka ludzka wiedza. Blue J zatrudnia ekspertów podatkowych pod kierownictwem Susan Masseyktóry spędził 13 lat w Biuro Głównego Radcy Administracji Skarbowej jako kierownik urzędu skarbowego. Jej zespół stale testuje sztuczną inteligencję i poprawia jej wydajność.
Trzecie to bezprecedensowe koło zamachowe powrotne. Dzięki ponad 3 milionom zapytań dotyczących badań podatkowych przetworzonych w 2025 r. Blue J gromadzi niezrównane dane. Każde zapytanie generuje informację zwrotną, która przepływa z powrotem do systemu.
Tygodniowe wskaźniki aktywnych użytkowników wahają się od 75% do 85%, w porównaniu do 15% do 25% w przypadku tradycyjnych platform. „Wskaźnik dobroczynności jest taki, jakbyśmy byli pięciokrotnie częściej wykorzystywani” – zauważył Alarie.
W ramach partnerstwa Blue Ja dotyczącego wczesnego dostępu z OpenAI
Niebieski J utrzymuje niezwykle bliskie relacje z OpenAI co okazało się kluczowe dla jego sukcesu. „Mamy bardzo dobre relacje z OpenAI i uzyskujemy wcześniejszy dostęp do ich modeli” – powiedział Alarie. „To ścisła współpraca. Dajemy im wiele wysokiej jakości informacji zwrotnych na temat wydajności różnych wersji nadchodzących modeli”.
Te opinie okazały się cenne, ponieważ firma Blue J opracowała pytania egzaminacyjne, które Alarie nazywa „ważnymi ekologicznie” – zaczerpnięte z rzeczywistych zapytań specjalistów podatkowych, a prawidłowe odpowiedzi zostały określone przez zespół ekspertów Blue J. Pomaga to OpenAI poprawić wydajność w złożonych zadaniach wnioskowania.
Firma testuje modele wszystkich głównych dostawców — OpenAI, antropiczny, Bliźnięta Google’ai alternatywy typu open source — stale oceniając, która działa najlepiej. „Niekoniecznie jesteśmy w 100% związani z jakimś konkretnym dostawcą” – wyjaśnił. „Nieustannie testujemy”.
To podejście pomaga Niebieski J prowadzić wymagający model biznesowy: pobierać opłatę w wysokości około 1500 USD za stanowisko rocznie za nieograniczoną liczbę zapytań, ponosząc jednocześnie zmienne koszty obliczeniowe. „Z góry zobowiązaliśmy się, że zapewnimy im naprawdę dobrą obsługę klienta, nieograniczoną liczbę odpowiedzi na badania podatkowe za stałą cenę” – powiedział Alarie. „Absorbujemy dużą część tego ryzyka”.
Konkurencja między dostawcami podstawowych modeli wywiera presję na obniżenie cen interfejsów API, podczas gdy konserwatywne modelowanie użytkowania firmy Blue J okazało się dokładne. Zatrzymanie przychodów brutto przekracza 99%, a zatrzymanie przychodów netto sięga 130% – co jest uważane za najlepsze w swojej klasie dla firm SaaS.
Zatrudniamy Thomson Reuters i LexisNexis przy 75% tygodniowym zaangażowaniu
Niebieski J stoi w obliczu konkurencji ze strony uznanych wydawców, takich jak Thomsona Reutera, LexisNexisI Bloombergai wszystkie ogłoszone możliwości sztucznej inteligencji w latach 2023 i 2024. Jednak wskaźniki zaangażowania Blue Ja sugerują, że nabrało to znacznego rozpędu – liczba użytkowników wzrosła z zaledwie 200 użytkowników w 2021 r. do ponad 3500 organizacji obecnie.
Codzienne aktualizacje okazały się kluczowe. Podczas gdy sam kodeks podatkowy zmienia się tylko wtedy, gdy Kongres podejmuje działania, ekosystem stale ewoluuje poprzez regulacje IRS, nowe orzeczenia i sprawy sądowe. Wszystkie 50 stanów regularnie zmienia swoje przepisy podatkowe.
„Sytuacja zmienia się dosłownie każdego dnia” – powiedziała Alarie. „Każdego dnia aktualizujemy informacje i dotyczy to tylko Stanów Zjednoczonych. Zajmujemy się Kanadą, opisujemy Wielką Brytanię. Aspiracje w tej sprawie są naprawdę globalne”.
Ambicje Alariego wykraczają poza budowanie udanego startupu. Jako autor wielokrotnie nagradzanej książki „Wyjątkowość prawna” i współpracownik wydziału przy ul Instytut Sztucznej Inteligencji Vectorod lat zastanawia się nad długoterminowym wpływem sztucznej inteligencji na prawo.
W artykułach naukowych publikowanych w Tax Notes w 2023 r I w 2024 ropisał rozwój generatywnej sztucznej inteligencji, przewidując, że „klienci staną się znacznie bardziej wyrafinowani” i że sztuczna inteligencja popchnie ludzkich ekspertów do pełnienia strategicznych ról o wyższej wartości zamiast rutynowych badań.
Plan Blue Ja o wartości 122 milionów dolarów: od badań podatkowych do „globalnej wiedzy podatkowej”
The Finansowanie serii Dco pozwoliło zgromadzić łączny kapitał do ponad 133 milionów dolarów, będzie motorem agresywnej ekspansji geograficznej i produktowej. Blue J działa już w USA, Kanadzie i Wielkiej Brytanii, a planuje docelowo objąć ponad 220 jurysdykcji w ramach partnerstwa IBFD.
Przyszłe możliwości mogą obejmować automatyczne generowanie notatek, wypełnianie formularzy podatkowych, tworzenie dokumentów i historię rozmów utrzymującą kontekst w trakcie sesji – przekształcając Blue J z narzędzia badawczego w to, co Alarie opisuje jako „warstwę operacyjną globalnej wiedzy podatkowej”.
Pomimo sukcesu Blue J działa w obszarze, w którym błędy mają poważne konsekwencje. Problem halucynacji nie został wyeliminowany — został zminimalizowany poprzez staranną inżynierię, zarządzanie treścią i nadzór człowieka. Firma Blue J nauczyła swoje modele, aby zamiast zmyślać, przyznawały się do sytuacji, w których nie potrafią odpowiedzieć na pytanie.
Firma staje w obliczu ryzyka ekonomicznego, jeśli spirala kosztów obliczeniowych lub wzorce wykorzystania przekraczają przewidywania. Pojawiają się bardziej subtelne pytania dotyczące profesjonalnej oceny: czy w miarę zwiększania się wydajności systemów sztucznej inteligencji użytkownicy będą zadowalać się wynikami bez wystarczającej krytycznej oceny?
Od 15 godzin do 15 sekund: czego AI firmy Blue J uczy każdą branżę
Transformacja Blue J oferuje lekcje wykraczające poza oprogramowanie podatkowe. Gotowość firmy do porzucenia zastrzeżonej technologii sprzed ośmiu lat i odbudowania firmy na początkowo chwiejnych podstawach wymagała zarówno odwagi, jak i skalkulowanego podejmowania ryzyka.
Decyzja opłaciła się nie dlatego, że generatywna sztuczna inteligencja z natury była lepsza od nadzorowanego uczenia maszynowego we wszystkich wymiarach, ale dlatego, że rozwiązała prawdziwy problem: kompleksowość, a nie precyzję w wąskich dziedzinach. Specjaliści podatkowi nie potrzebowali 95% dokładności w 5% pytań. Potrzebowali wystarczająco dobrej dokładności w przypadku 100% pytań.
Poprawa NPS z 20 do 84 w ciągu nieco ponad dwóch lat odzwierciedla nieustanne iteracje oparte na masowym gromadzeniu danych. Partnerstwa w zakresie treści stworzyły zróżnicowanie, którego czysta technologia nie byłaby w stanie odtworzyć. Zespół ekspertów podatkowych zapewnił wiedzę dziedzinową niezbędną do zapewnienia rzetelności.
Co najważniejsze, Blue J zdał sobie sprawę, że prawdziwą konkurencją nie są inne start-upy AI ani nawet uznani wydawcy. To był stary sposób działania – 15 godzin ręcznych badań, instytucjonalna wiedza zamknięta w głowach odchodzących na emeryturę specjalistów.
„Ludzie pytają: «Co robi Blue J? Udzielają lepszych odpowiedzi na pytania podatkowe. OK, myślę, że tego potrzebujemy»” – pomyślał Alarie.
Ponieważ sztuczna inteligencja zmienia zawód po zawodzie, ta jasność celu może być ważniejsza niż zaawansowanie technologiczne. Przyszłość nie należy do tych, którzy budują najbardziej zaawansowaną sztuczną inteligencję, ale do tych, którzy wykorzystują ją najskuteczniej do rozwiązywania problemów, z którymi faktycznie boryka się człowiek.
Dla profesora prawa podatkowego, który zaczynał sfrustrowany nieefektywnymi metodami badawczymi, zbudowanie firmy wartej 300 milionów dolarów oznacza odważny punkt końcowy. Dla tysięcy profesjonalistów, którzy obecnie odpowiadają na złożone pytania w 15 sekund zamiast 15 godzin, reprezentuje to przyszłość ich zawodu, a nadchodzi ona szybciej, niż większość się spodziewa.
Postaw na ChatGPT, wciąż mając halucynacje biografie, stało się potwierdzeniem, że czasami najbardziej ryzykownym posunięciem jest nie ruszanie się w ogóle.



