Googlowanie? Mamy od tego agenta.

28 stycznia Google puściło w świat nową, „przełomową” funkcję Auto Browse. Na ten moment usługa jest dostępna wyłącznie w Stanach Zjednoczonych i tylko dla subskrybentów Googlowych pakietów AI Pro oraz AI Ultra. Komunikatów dotyczących dostępności w kolejnych krajach i dla szerszej publiczności – na razie brak.

Źródło: Google

Auto Browse: co to jest i w czym ma wyręczać?

Najnowsza funkcja oferowana w przeglądarce Chrome to nic innego jak agent AI oparty na najnowszym modelu językowym od Googla, Gemini 3. Zasada działania? Agent zamiast mówić nam co mamy robić, po prostu przejmuje kontrolę i robi to za nas. Jak mówi Google, to ma zapoczątkować nową erę korzystania z internetu, wyręczając nas w:

  • planowaniu podróży: research cen hoteli i lotów dla różnych terminów, żeby znaleźć bardziej budżetowy moment na wyjazd
  • umawianiu wizyt
  • wypełnianiu żmudnych formularzy online
  • zbieraniu dokumentów podatkowych
  • zbieraniu wycen od fachowców, np. hydraulika i elektryka
  • sprawdzaniu, czy rachunki są opłacone
  • składaniu rozliczeń wydatków
  • zarządzaniu subskrypcjami
  • oraz w zadaniach „bardziej skomplikowanych”, np.: analiza zdjęcia inspiracji, wyszukanie podobnych rzeczy, dodanie ich do koszyka w ramach budżetu i nawet z próbą użycia kodów rabatowych
  • a jeśli dasz zgodę: obsługa zadań wymagających logowania dzięki wsparciu Google Password Manager.

Auto Browse uruchamia się z poziomu bocznego panelu Gemini w Google Chrome: po wpisaniu polecenia agent otwiera osobną kartę i sam przechodzi przez kolejne kroki zadania. Gdy dochodzi do momentu wymagającego interwencji człowieka (np. potwierdzenia), Chrome wyświetla powiadomienie u góry okna, a zadanie można w dowolnym momencie przerwać lub przejąć ręcznie.

Istnieją też konkretne ograniczenia: funkcja działa tylko na komputerze, wymaga najnowszego Chrome i włączenia Gemini, jest dostępna w USA (18+) na prywatnym koncie z AI Pro/Ultra, nie działa w Incognito ani na kontach szkolnych czy biznesowych, a na deser dochodzą limity liczby zadań (20 dziennie dla AI Pro i 200 dla AI Ultra).

Parę „ale” i żadne z nich nie jest drobne

Największym znakiem zapytania i zagrożeniem przy narzędziach typu „agent” bez wątpienia jest bezpieczeństwo. Narzędzia tego typu są podatne na prompt injection – atak, w którym to strona internetowa „podszeptuje” agentowi własne instrukcje (często ukryte w treści lub kodzie), żeby ten zignorował polecenie użytkownika i zrobił coś innego: kliknął nie ten link, wyciągnął dane, zmienił ustawienia, utknął w pętli albo wykonał niechcianą akcję. WIRED dodaje, że te potencjalne luki nie są jeszcze w pełni przebadane przez zewnętrznych badaczy.

Źródło: Google

Jak widać na powyższym obrazku, Gemini zatrzymuje się przed finalizacją płatności i prosi użytkownika o przejęcie/zgodę – bez tego zakup się nie domyka. Tak przynajmniej ma to wyglądać, jak jest w praktyce – jeszcze nie wiemy. Zabezpieczenia brzmią uspokajająco, ale nie rozwiązują sedna problemu: jeśli narzędzie ma sens dopiero wtedy, kiedy dostaje dostęp do kont, danych i procesu zakupowego, to zaufanie staje się warunkiem wejścia. Czy ja osobiście zaufałabym agentowi? Nie, nie oddałabym mu żadnego researchu, który miałby wpływać na moje życie (np. podróż), a co dopiero dostępu do mojej karty.

„Auto”, ale pod kontrolą i z nadzorem

Agent potrafi przeklikać wieloetapowe zadania, ale w kluczowych momentach i tak potrzebuje człowieka, jak wspomina redaktorka WIRED, korzystając z narzędzia, w czacie na stałe pojawiają się dopiski: “Use Gemini carefully and take control if needed,” oraz „You are responsible for Gemini’s actions during tasks.” Realna zmiana polega więc na tym, że zamiast klikać wszystko samodzielnie, trzeba pilnować, co i dlaczego klika bot.

W tym samym tekście testy dwóch podstawowych scenariuszy – zakupu biletów na koncert i skórzanej kurtki – pokazują, że warto mieć wątpliwości co do „ludzkiego rozsądku” (no właśnie, ludzkiego) i jakości researchu. Przy biletach agent doprowadza proces do końca, ale wybiera miejsca jedno za drugim, a nie obok siebie. Z kolei przy kurtkach „research” sprowadza się do wrzucenia pierwszych kilku propozycji z brzegu – bez realnego pogłębienia tematu, porównania jakości czy sensownego uzasadnienia wyboru.

Źródło: WIRED

A na co to komu?

Jak widać na powyższym screenshocie, sentyment internautów krąży między „nie ufam” a „nie działa”, a więc bez zaskoczeń. I trudno się dziwić: wspominane wcześniej zaufanie do bota jest tu warunkiem zerowym, bo jeśli i tak trzeba sprawdzać każdy krok agenta, cała „oszczędność czasu” znika.

No i jest jeszcze ostatni znak zapytania: dlaczego akurat te produkty? Jeśli agent ma robić research i proponować wybory, a użytkownik nie dostaje pełnego wglądu w logikę kierującą selekcją ofert, naturalnie pojawia się podejrzenie o wpływ rankingów, afiliacji i płatnych ekspozycji. Czy to co widzę to rzeczywiście najlepsza opcja, za którą stoi dogłębny research, czy może agent podsuwa mi opcję, za którą ktoś zapłacił?

Już na sam koniec – przeglądanie internetu to bardzo ludzka rzecz. Nie oddałabym żadnemu agentowi tego researchu, w którym szukam dobrego termosu, a kończę kupując markery na promocji w Pepco! Make internet human again!

Źródła:
https://blog.google/products-and-platforms/products/chrome/gemini-3-auto-browse/
https://www.wired.com/story/google-chrome-auto-browse/
https://www.wired.com/story/google-chrome-auto-browse-hands-on/?_sp=a53c5ed1-703f-481a-b9c7-1b6f4d8bfa7c.1770113306756
https://www.zdnet.com/home-and-office/work-life/google-chrome-auto-browse/

Źródło grafiki:
https://www.tomsguide.com/ai/google-gemini/google-is-putting-gemini-ai-right-in-the-chrome-address-bar-heres-how-it-will-work