#ga4 #googleanalytics #notset
(not sety) w raportach GA4 – analiza przypadku
Jeśli korzystasz z Google Analytics 4 – zapewne niejednokrotnie spotkałeś się z tajemniczą wartością oznaczoną jako (not set). Czym ona jest i jakie są te podstawowe i te mniej oczywiste powody jej powstawania? W tym artykule rozprawimy się z tym tematem – bazując na rzeczywistych przypadkach z naszej codziennej pracy.
Co to jest (not set)?
Wartość (not set) w raportach GA4 jest tzw. symbolem zastępczym dla brakującej wartości. Oznacza to, że brakuje konkretnych danych dla danego wymiaru w określonym kontekście (powstaje luka w danych, dla której system podaje wartość (not set)). W przypadku GA4, może to wystąpić, gdy nie ma żadnych informacji dotyczących określonego wymiaru w danym zdarzeniu lub sesji.
Ale, czy wszystkie (not set) powinny stanowić powód do niepokoju?
Istnieje kilka głównych powodów pojawiania się (not set) w raportach GA4.
GA4 używa (not set), gdy nie otrzymuje żadnych informacji o konkretnym wymiarze, przykład: filtrowanie wymiarów związanych z aplikacją w momencie, gdy używamy GA4 do mierzenia danych tylko z witryn – wówczas wartość (not set) nie powinna nas dziwić. Są jednak przypadki gdy niezidentyfikowana wartość parametru czy zdarzenia stanowi bardzo duży odsetek. Wówczas mamy do czyniania z niską jakością zbieranych danych.
TLTR:
- (not set) oznacza, że GA4 nie ma wartości dla tego danego wymiaru w tym konkretnym kontekście
- często (not set) występuje w przypadku wdrożenia Measurement Protocol / server-side tagging (SGTM)
- część (not set) wynika z bugów Google
- narzędzia i rozszerzenia dotyczące prywatności użytkowników również mogą wpływać na (not set)
- istnieją przypadki, dla których wartości (not set) są wynikiem błędnej konfiguracji narzędzia
[WAŻNY UPDATE]
W ostatnim czasie (przełom czerwca i lipca) Google potwierdził wystąpienie globalnego problemu, który może wpływać na zwiększony odsetek wartości (not set) – głównie w przypadku raportów kampanii Google Ads i DV360.
Zakres problemów, nad którymi obecnie pracuje Google:
- zwiększony odsetek wartości (not set) i “Unassigned” w raportach kampanii
- zwiększony odsetek przypisanego udziału dla kanału bezpośredniego
- błędne klasyfikacje w przypisywaniu kanałów na podstawie wartości GCLID/DCLID
Jeśli więc w swoich raportach dot. kampanii lub grupy kanałów spotkałeś się ostatnio z podobnym problemem – i wykluczasz opisane w artykule błędy w konfiguracji – prawdopodobnie na Twoim koncie również jest globalny błąd.
To, w jakim stopniu dany problem dotyczy Twojego konta możesz sprawdzić w wybranych zestawieniach.
Poniżej przykład raportu, który pokazuje do jakiej grupy kanałów zostały przypisane przychody google/cpc (oraz jaka jest tego skala):
Inny raport pokaże nam w jakim stopniu wartości (not set) dla parametru kampanii Google Ads pogłębiły się w danych okresach czasu:
Śledzimy temat na bieżąco. Wrócimy z kolejnym update.
Tymczasem…
Analiza przypadku
Przejdźmy do analizy przypadku i zastanówmy się, jakie sytuacje najczęściej powodują brak danych dotyczących wymiarów. Poniżej przedstawiamy przykłady najczęstszych przypadków napotkanych w praktyce – dla najbardziej popularnych raportów. Jeśli identyfikujesz się z danym przypadkiem – zweryfikuj czy luki w raportach nie są spowodowane podanymi przykładami:
- (not set) w raportach ruchu sesja – źródło/medium
- błędna implementacja Measurement Protocol (błędne wysyłanie session_id – parametr musi zawierać wartość sesji, która została już prześledzona przez GA4 na stronie internetowej (po stronie klienta). Jeśli programista losowo wygeneruje session_id, źródło/medium będzie oznaczone jako (not set))
- brak zdarzenia session_start – zazwyczaj bardzo mały odsetek sesji, występuje głównie przy server-side tagging (SGTM)
- brakujące / błędnie ustawione parametry UTM – (not set) na poziomie sesja – źródło/medium lub na poziomie kampanii (by uniknąć błędów w UTM zalecamy skorzystanie z dedykowanych narzędzi, np. Campaign URL Builder: https://bit.ly/3RFhiTG zgodnie z najlepszą praktyką, o której piszemy tutaj)
- nieprawidłowe przesyłanie danych między domenami (cross-domain tracking) – brak / błędne przekazywanie informacji o sesji i źródle
- ustawienia prywatności w przeglądarkach – niektóre przeglądarki mogą blokować przesyłanie danych z powodu ustawień prywatności, takich jak blokowanie plików cookie lub innych śledzących technologii
- (not set) dla kampanii Google Ads
- brakujące / błędne połączenie usługi GA4 z Google Ads
- brak włączonego auto-tagowania w Google Ads (rekomendowane)
- brakujące / błędnie ustawione parametry UTM (przy wyłączonej opcji auto-tagowania – nierekomendowane)
- jednoczesne używanie tagowania ręcznego i automatycznego
- nieprawidłowe kliknięcia (https://bit.ly/4eMIJoF)
- (not set) w wymiarze strona docelowa
- rozpoczęcie sesji innym eventem niż page_view (sesja jest traktowana jako sesja z nieustaloną stroną wejścia i strona docelowa jest równa (not set)).Przykłady to:
- użytkownik odchodzi od komputera, zostawia otwartą stronę i powraca po automatycznym zakończeniu sesji. Wykonuje akcję, np. scroll czy kliknięcie i rozpoczyna nową sesję, w której page_view nie jest pierwszym eventem.
- integracje typu Calendly, które generują sesje, ale nie generują odsłon.
- rozpoczęcie sesji innym eventem niż page_view (sesja jest traktowana jako sesja z nieustaloną stroną wejścia i strona docelowa jest równa (not set)).Przykłady to:
- (not set) dla wymiaru page_location
- z reguły bug GA4
- może wystąpić gdy adresy URL na stronie przekroczą liczbę 500 znaków (więcej o limitach danych w GA4: https://bit.ly/45TCR8Q)
- (not set) w parametrze page_title
- brakujący <tytuł> na stronach HTML
- uruchomienie kodów GA4 przed załadowaniem sekcji <title> w HTML
- (not set) dla wymiaru content group
- brak / błędna konfiguracja parametru content_group
- zapis niezgodny z dokumentacją (case-sensitive)
- przesyłanie pustej wartości do parametru (np. z elementu DOM)
- błędne (z reguły zbyt późne) wyzwalanie kodu zawierającego parametr page_type
- brak możliwości mierzenia content_group dla zdarzeń first_visit
- brak / błędna konfiguracja parametru content_group
- (not set) dla wartości language
- brak przesyłania parametru language dla wszystkich zdarzeń przy wdrożeniu Measurement Protocol
- ukrywanie / modyfikowanie języka przeglądarki przez użytkownika (np. za pomocą rozszerzeń / wtyczek)
- usuwanie parametru ul (user language) w przypadku tagowania server_side
- (not set) dla wymiaru country (i innych wymiarów geograficznych)
- brak możliwości śledzenia danych parametrów przez Measurement Protocol
- anonimizacja IP – brak dokładności w identyfikowaniu lokalizacji użytkownika
- usuwanie / nadpisywanie adresów IP w przypadku tagowania server_side
- zapory typu VPN
- (not set) dla raportu zdarzeń / danych produktów
- brak konsekwencji we wdrażaniu śledzenia e-commerce – niezarejestrowanie tych samych parametrów na każdym etapie ścieżki użytkownika
- niepoprawne wartości parametrów – niezgodne z wdrożonym dataLayer
- brak zarejestrowania wymiarów niestandardowych w GA4 pomimo zbierania ich w GTM (wymiary niestandardowe nie działają wstecz)
- błędy w konfiguracji GTM – błędne uruchamianie tagów lub brakujące wyzwalacze
- audience triggers (zdarzenia ustawiane z poziomu grup odbiorców GA4) – zdarzenia te często nie są przypisywane do żadnej z sesji
- (not set) ograniczone do użytkownika
- błędna / brak konfiguracji User-ID – wartości (not set) np. w raportach dotyczących zalogowanych użytkowników
- często bug GA4
- warto ustawić właściwości użytkownika nie tylko w tagu konfiguracyjnym, ale również we wszystkich tagach zdarzeń
- warto ustawić wymiar niestandardowy ograniczony do zdarzenia (dla wszystkich tagów)
- (not set) dla raportu technologia (przeglądarka i system operacyjny)
- jeśli liczba unikalnych użytkowników z wartością (not set) przekracza 5-10% – warto weryfikować dalej czy ruch nie pochodzi od botów (przydatne będą tu raporty np. źródła, nazwy hosta zestawione ze współczynnikami odrzuceń)
Jak radzić sobie z (not set)?
Aby zminimalizować odsetek wartości (not set) w raportach GA4, należy dokładnie przeanalizować swoje wdrożenie i upewnić się, że wszystkie parametry są poprawnie przesyłane. Debugowanie za pomocą narzędzi takich jak Eksploracje w GA4 może pomóc zlokalizować problemy i znaleźć rozwiązania.
Warto również śledzić wszystkie zmiany w swojej witrynie lub aplikacji, aby szybko reagować na ewentualne problemy z przesyłaniem danych do GA4. Skorzystać z dokumentacji GA4 i innych materiałów szkoleniowych pozwoli lepiej zrozumieć działanie platformy i uniknąć potencjalnych pułapek.
Całkowita eliminacja wartości (not set) w raportach GA4 nie jest możliwa, ale kluczowe jest dokładne zrozumienie skali problemu, przyczyn ich pojawiania się oraz systematyczne podejmowanie działań mających na celu ich ograniczenie. Zbyt duży odsetek wartości (not set) niestety świadczyć będzie o niskiej jakości naszych danych, a to skutkuje wyciąganiem nieadekwatnych wniosków i podejmowaniem nietrafnych decyzji.