Zacznij za darmo Umów spotkanie

User Agent – co to?

User Agent (UA) to identyfikator wysyłany przez aplikacje i przeglądarki w każdym żądaniu HTTP do serwera. Zawiera informacje o urządzeniu i środowisku, które składa zapytanie. W kontekście web scrapingu wiedza o UA pozwala skuteczniej maskować działania i unikać blokad. Dowiedz się, czym jest UA, jak go zmieniać i dlaczego jest to kluczowe w profesjonalnym pozyskiwaniu danych z sieci.

Czym jest User Agent?

User Agent to ciąg znaków (tzw. string), który serwer otrzymuje wraz z każdym żądaniem (np. otwarciem strony internetowej). Pozwala on rozpoznać:

  • Aplikację wysyłającą zapytanie (np. przeglądarka Chrome, Firefox, Safari).
  • Rodzaj urządzenia (komputer stacjonarny, smartfon, tablet).
  • System operacyjny (Windows, macOS, Linux, Android, iOS).

Ta informacja bywa kluczowa dla właścicieli stron, którzy w zależności od UA mogą np. modyfikować wygląd witryny czy blokować dostęp określonym klientom.

Dlaczego warto manipulować User Agentem podczas scrapowania danych?

Podczas web scrapingu, czyli zautomatyzowanego pobierania danych ze stron internetowych, właściwe zarządzanie User Agentem jest niezbędne, aby:

  1. Unikać blokad – witryny mogą odrzucać zapytania pochodzące z podejrzanych lub domyślnych UA związanych z bibliotekami (np. „Python-requests”).
  2. Symulować różne środowiska – można „udawać” ruch z popularnych przeglądarek desktopowych, urządzeń mobilnych czy tabletów.
  3. Zachować wiarygodność – wiele stron automatycznie identyfikuje i blokuje boty, jeśli wykryje, że ich UA jest nieprawidłowy lub powtarzalny.

Maskowanie User Agent

Maskowanie (ang. spoofing) to proces polegający na ręcznej lub automatycznej zmianie UA w celu:

  • Ominięcia filtrów – wiele stron blokuje zapytania z nietypowymi ciągami UA, typowymi dla narzędzi do scrapingu.
  • Losowania różnych identyfikatorów – rotowanie UA sprawia, że każdy kolejny request może wyglądać jak pochodzący od innego użytkownika.
  • Symulowania urządzeń – dzięki temu można testować i pobierać treści przewidziane np. dla telefonów komórkowych czy starszych wersji przeglądarek.

Automatyczne przeglądarki

Aby pozyskiwać dane nawet z zaawansowanych stron (obsługujących dużo JavaScriptu czy dynamicznych elementów), profesjonaliści często używają automatów symulujących przeglądarki, takich jak:

  • Puppeteer (z Chromedriver)
  • Playwright (obsługuje Chromium, Firefox, WebKit)
  • Selenium (kompatybilne z Chrome, Firefox, Safari i innymi)

Dzięki nim można nie tylko zmieniać UA, ale też wykonywać operacje, jakie robiłby rzeczywisty użytkownik, np. klikać w elementy na stronie, wypełniać formularze czy czekać na załadowanie dynamicznej treści.

Techniki zmiany i podawania innego User Agent

  1. Manualne ustawianie nagłówka
    Można ustawić nagłówek User-Agent w wielu językach programowania i bibliotekach HTTP. W praktyce sprowadza się to do podania ciągu znaków, który ma imitować rzeczywistą przeglądarkę czy urządzenie.

  2. Konfiguracja w przeglądarkach automatycznych
    Narzędzia takie jak Puppeteer czy Selenium oferują metody pozwalające określić UA przed załadowaniem strony. Wystarczy wybrać dowolny ciąg zgodny z popularną przeglądarką (np. Chrome na Windows 10), by witryna zobaczyła nasz bot jako normalnego internautę.

  3. Biblioteki do rotacji i randomizacji
    W profesjonalnym scrapingu stosuje się często gotowe listy UA, z których losowo wybiera się identyfikator przed każdym zapytaniem. W połączeniu z odpowiednią infrastrukturą proxy może to znacznie utrudnić wykrycie bota.

Przykładowe User Agenty

Poniżej kilka przykładowych ciągów UA, które można wykorzystywać, by symulować różne urządzenia i przeglądarki:

  • Chrome na Windows 10 (64-bit)
    Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36

  • Firefox na Windows 10 (64-bit)
    Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:109.0) Gecko/20100101 Firefox/109.0

  • Safari na macOS
    Mozilla/5.0 (Macintosh; Intel Mac OS X 13_1) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/16.0 Safari/605.1.15

  • Chrome na Android
    Mozilla/5.0 (Linux; Android 12; Pixel 6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.5359.79 Mobile Safari/537.36

  • Safari na iPhone
    Mozilla/5.0 (iPhone; CPU iPhone OS 16_2 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/16.0 Mobile/15E148 Safari/604.1

Rozbiór przykładowego UA

Weźmy na przykład User Agent dla Chrome na Windows 10 (64-bit):
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36

  • Mozilla/5.0 – to pozostałość z dawnych czasów, kiedy większość przeglądarek opisywała się jako „Mozilla” w celu zachowania zgodności z serwerami.
  • (Windows NT 10.0; Win64; x64) – informacja o systemie operacyjnym (Windows 10), architekturze 64-bitowej (Win64) i procesorze (x64).
  • AppleWebKit/537.36 – nazwa i wersja silnika renderującego, pierwotnie stworzonego przez Apple dla Safari. Chrome oraz inne przeglądarki oparte na WebKit lub Blink często zachowują tę informację w UA.
  • (KHTML, like Gecko) – wstawka sygnalizująca kompatybilność ze starszym standardem renderowania (Gecko to silnik Firefox).
  • Chrome/108.0.0.0 – właściwa nazwa przeglądarki (Chrome) wraz z numerem wersji (108.0.0.0).
  • Safari/537.36 – końcowe nawiązanie do Safari, dzięki któremu strony interpretują UA jako zbliżony do Safari (co także wzmacnia kompatybilność).

Najczęstsze pytania i odpowiedzi (FAQ)

1. Czy zmiana User Agenta wystarczy, aby nie zostać zablokowanym podczas scrapingu?
Nie zawsze. Zmiana UA to tylko jeden z elementów strategii maskowania. Serwery często sprawdzają też adresy IP, ciasteczka, zachowanie użytkownika (ruch myszki, klikanie w elementy), a nawet analizują czas pomiędzy kolejnymi żądaniami. Stosowanie rotacji IP i symulowanie prawdziwej interakcji z witryną może być równie ważne.

2. Czy mogę użyć dowolnego UA, np. przypisanego do innej przeglądarki lub systemu?
Tak, technicznie możesz wstawić niemal dowolny ciąg znaków jako UA. W praktyce warto używać powszechnie spotykanych i aktualnych ciągów, by uniknąć wzbudzania podejrzeń, że ruch jest nienaturalny.

3. Jak często należy rotować User Agenta?
Zależy to od charakteru witryny i intensywności scrapingu. Przy dużej liczbie zapytań do tego samego serwera rotacja co kilka–kilkanaście żądań może pomóc w zmniejszeniu ryzyka wykrycia.

4. Czy używanie automatycznych przeglądarek zawsze gwarantuje dostęp do wszystkich danych?
W większości przypadków tak, bo automatyczne przeglądarki (np. Puppeteer) potrafią obsłużyć JavaScript i dynamiczne ładowanie elementów. Jednak niektóre witryny mogą mieć dodatkowe systemy zabezpieczeń (CAPTCHA, zaawansowane skrypty wykrywające boty), które i tak trzeba ominąć.

5. Czy zmiana UA jest legalna?
W większości jurysdykcji sama zmiana nagłówka UA nie jest nielegalna. Jednak sposób wykorzystania pobranych danych może podlegać różnym regulacjom prawnym. Zawsze warto zapoznać się z regulaminem strony i lokalnymi przepisami, żeby uniknąć potencjalnych problemów.

Podsumowanie

User Agent stanowi kluczowy element komunikacji pomiędzy programem (przeglądarką czy narzędziem do scrapingu) a serwerem. W kontekście profesjonalnego pozyskiwania danych:

  • Umożliwia ominięcie filtrów blokujących żądania pochodzące od oczywistych botów.
  • Pozwala symulować różne środowiska (desktopy, urządzenia mobilne), co bywa przydatne przy analizie zawartości stron responsywnych lub mobilnych.
  • Daje większą kontrolę nad przebiegiem zbierania danych, zwłaszcza gdy łączy się go z przeglądarkami automatycznymi, obsługą JavaScriptu i metodami rotacji proxy.
SŁOWNIK

Słownik ekspertów PriceSafari

Techniczny Słownik PriceSafari to zbiór kluczowych terminów z e‑handlu, programowania i web scrapingu. Regularnie aktualizowany, odzwierciedla najnowsze zmiany i trendy w tych dynamicznych branżach.

Wszytkie wpisy
Mateusz Werner - CEO | Lead Developer | .NET w PriceSafari
Mateusz Werner LinkedIn - Mateusz Werner - CEO | Lead Developer | .NET w PriceSafari

CEO | Lead Developer | C#

Jakub Ostrowski - Sales | Key Account Manager w PriceSafari
Jakub Ostrowski LinkedIn - Jakub Ostrowski - Sales | Key Account Manager w PriceSafari

Sales | Key Account Manager

Łukasz Siarka - NO Engineer | Network Operations w PriceSafari
Łukasz Siarka LinkedIn - Łukasz Siarka - NO Engineer | Network Operations w PriceSafari

Infrastructure | NO

Michał Siarka - Data Analyst | R w PriceSafari
Michał Siarka LinkedIn - Michał Siarka - Data Analyst | R w PriceSafari

Data Analyst | R

PriceSafari

Monitoring cen PriceSafari

PriceSafari to narzędzie automatyzujące monitoring cen produktów w sieci. Zbieramy dane z marketplace'ów, porównywarek cenowych i e-sklepów tak często, jak tego potrzebujesz. Spojrzenie na cały rynek z jednego panelu pozwoli Ci strategicznie zarządzać cenami własnych produktów, maksymalizować zyski i wyprzedzać konkurentów.

Porozmawiajmy
BEZPŁATNA KONSULTACJA & DEMO

Spotkajmy się i porozmawiajmy

Zostaw nam swoje dane kontaktowe, a my skontaktujemy się z Tobą, aby ustalić dogodny termin spotkania online. Podczas rozmowy pokażemy Ci panel aplikacji PriceSafari i rozpoczniemy darmowy monitoring cen Twoich produktów. Gwarantujemy, że wdrożenie naszego programu będzie przełomową zmiana w Twojej firmie.

Gdzie chcesz monitorować ceny?
Monitoring cen na Google
Google
Monitoring cen na Ceneo
Ceneo
Monitoring cen na Allegro
Allegro
Ile SKU chcesz monitorować?
500 SKU
Jak często odświeżać dane?
1 raz dziennie
Przybliżony koszt na miesiąc PLN Netto
Szybka wycena
Wycenimy rozwiązanie w 5 minut. Przygotujemy darmowe konto demo już w kilka godzin.
Telefon 791 855 755 Formularz
Informacja
Zadzwoń, lub skorzystaj z formularza.
Zadzwoń