Pomoc Rosetta - Ulepszona

Rosetta - Narzędzie do analizy tekstowej

Co to jest Rosetta?

Rosetta to zaawansowane narzędzie analityczne, które pomaga w odkrywaniu wartościowych informacji z danych tekstowych, takich jak komentarze klientów, opinie, czy odpowiedzi na pytania otwarte w ankietach. Wykorzystuje modele językowe AI do automatycznej analizy i kategoryzacji tekstów, umożliwiając szybkie identyfikowanie trendów, problemów i możliwości.

Dla kogo jest Rosetta

Rosetta została zaprojektowana z myślą o szerokim gronie użytkowników, którzy potrzebują efektywnie analizować dane tekstowe. Idealnie sprawdzi się dla:

Jakościowców: Do szybkiego przetwarzania dużych zbiorów opinii, recenzji, odpowiedzi z ankiet.
Kierowników: Do zrozumienia feedbacku użytkowników na temat produktów i usług.
Liderów: Do identyfikacji kluczowych problemów i obszarów do poprawy w komunikacji z klientami.
Działów HR: Do analizy ankiet pracowniczych i zrozumienia nastrojów w organizacji.
Marketingowców: Do śledzenia opinii o kampaniach i marce w internecie.

Niezależnie od branży, jeśli pracujesz z tekstami i chcesz wydobyć z nich cenne wnioski, Rosetta jest narzędziem dla Ciebie.

Główne funkcje:

Import danych

Obsługa plików CSV i Excel, z wykrywaniem kodowania i separatorów.

Filtrowanie

Elastyczne filtrowanie, grupowanie i segmentacja danych.

Analiza AI

Integracja z modelami AI do analizy semantycznej tekstów.

Wizualizacje

Wykresy trendu, rozkładów i porównań wyników analizy.

Strukturyzacja JSON

Definiowanie własnych schematów JSON dla wyników analizy.

Eksport

Eksport wyników w różnych formatach (Excel, CSV, PDF, JSON).

Wskazówka

Rosetta najlepiej sprawdza się przy analizie tekstów o podobnej tematyce i strukturze. Przed uruchomieniem pełnej analizy na dużym zbiorze danych, zalecamy przetestowanie ustawień na mniejszej próbce, aby dostosować parametry i schemat wyników.

Kroki przeprowadzania analizy

Obsługiwane formaty plików:

CSV - z różnymi separatorami (przecinek, średnik, tabulator)
Excel - formaty XLSX i XLS z obsługą wielu arkuszy

Typy analizy:

Z gradacją - grupowanie danych według wybranego okresu czasu (dzień, tydzień, miesiąc) i analizowanie trendów.
Bez gradacji - analiza każdego wiersza danych oddzielnie, idealne do analizowania indywidualnych przypadków.

Opcje dodatkowe:

Kodowanie znaków - wybór odpowiedniego kodowania dla plików CSV (UTF-8, ISO-8859-2, Windows-1250)
Separator - wybór separatora dla plików CSV (przecinek, średnik, tabulator, pionowa kreska)
Wybór arkusza - dla plików Excel z wieloma arkuszami

Wskazówka

W przypadku problemów z kodowaniem polskich znaków w plikach CSV, spróbuj różnych opcji kodowania. Najczęściej używane to UTF-8 (standard) oraz Windows-1250 (typowy dla plików z Microsoft Excel).

Typy kolumn:

Kolumna z datą - wybierana dla analizy z gradacją, służy do grupowania danych w czasie. Rosetta automatycznie rozpoznaje popularne formaty dat.
Kolumny filtrów (max 5) - kolumny, które posłużą do filtrowania i segmentacji danych. Najlepiej wybierać kolumny kategoryczne z umiarkowaną liczbą unikalnych wartości.
Kolumny komentarzy (max 3) - kolumny zawierające teksty do analizy przez AI. Mogą to być komentarze klientów, opinie, opisy problemów, itp.
Kolumny dodatkowe - kolumny, których wartości zostaną doklejone do komentarzy w formacie "nagłówek:wartość". Przydatne do dodania kontekstu do analizowanych tekstów.

Automatyczne wykrywanie:

Rosetta automatycznie sugeruje odpowiednie kolumny na podstawie zawartości pliku:

Kolumny dat - wykrywane na podstawie nazwy i formatu zawartości
Kolumny komentarzy - wykrywane na podstawie długości tekstu i zawartości
Kolumny filtrów - wykrywane na podstawie liczby unikalnych wartości

Wskazówka

Wybierając kolumny komentarzy, kieruj się zasadą, że powinny zawierać teksty o podobnej strukturze i zakresie tematycznym. Możesz wybrać kilka kolumn komentarzy, które zostaną połączone podczas analizy.

Zakładki ustawień:

Filtry - wybór wartości z wybranych kolumn filtrujących. Możesz użyć filtrów do skupienia analizy na konkretnych segmentach danych.
AI - konfiguracja modelu AI, promptu systemowego i struktury wyników. Tutaj możesz dostosować, jak AI ma interpretować i analizować teksty.
Podgląd - podgląd przefiltrowanych danych i statystyk przed rozpoczęciem analizy.
Opcje dodatkowe - dodatkowe ustawienia analizy, takie jak pomijanie pustych komentarzy czy generowanie wykresów.

Konfiguracja grupowania danych (dla analizy z gradacją):

Zakres dat - określenie okresu analizowanych danych. Możesz wybrać predefiniowane zakresy lub ustawić własny.
Gradacja - wybór sposobu grupowania danych w czasie: dziennie, tygodniowo, miesięcznie, kwartalnie, rocznie lub niestandardowo.
Kolumna do grupowania - opcjonalne dodatkowe grupowanie danych według wybranej kolumny (np. zespół, konsultant, kategoria).

Wskazówka

Przy konfiguracji filtrów sprawdź, ile danych pozostaje po zastosowaniu filtrów, korzystając z zakładki "Podgląd". Optymalna liczba komentarzy w jednej grupie to 20-100 - zbyt mała liczba może dać mało wiarygodne wyniki, a zbyt duża może przekroczyć limity kontekstu AI.

W tym kroku:

Przygotowanie danych - dane są filtrowane i grupowane według wybranych kryteriów.
Wysyłanie do API AI - komentarze z każdej grupy są wysyłane do modelu AI w celu analizy.
Przetwarzanie odpowiedzi - odpowiedzi AI są przetwarzane i formatowane zgodnie z wybranym schematem JSON.
Generowanie wykresów - na podstawie wyników analizy tworzone są wykresy i wizualizacje.

Monitoring postępu:

Lista operacji - wyświetla aktualny stan każdego etapu analizy
Pasek postępu - pokazuje ogólny postęp analizy
Szczegółowe liczniki - informują o przetworzonych grupach, zapytaniach do AI i zużyciu tokenów
Dziennik operacji - szczegółowy log wykonywanych czynności

Uwaga

Analiza dużych zbiorów danych może trwać dłuższy czas i generować koszty związane z wykorzystaniem API OpenAI. W przypadku dużych analiz, zalecamy:

Podzielenie analizy na mniejsze partie
Używanie modeli GPT-4o Mini dla wstępnych testów
Monitorowanie zużycia tokenów w panelu analizy

Zakładki wyników:

Tabela - tabelaryczne zestawienie wyników analizy dla każdej grupy. Możliwość wyszukiwania i filtrowania.
Wykresy - interaktywne wizualizacje wyników, w tym:
- Wykres główny - konfigurowalne podsumowanie wyników
- Trendy w komentarzach - częstotliwość najważniejszych tematów
- Trend czasowy - zmiana sentymentu lub liczby mocnych/słabych stron w czasie
Podsumowanie - automatycznie wygenerowane podsumowanie całej analizy:
- Ogólne wnioski z analizy
- Lista najważniejszych mocnych stron
- Lista najważniejszych słabych stron
- Rekomendacje działań
Eksport - możliwość wyeksportowania wyników w różnych formatach:
- Excel - dla dalszej analizy danych
- CSV - dla kompatybilności z różnymi narzędziami
- PDF - dla raportów i prezentacji
- JSON - dla integracji z innymi systemami

Zapisywanie i wczytywanie analizy:

Możesz zapisać kompletną analizę do pliku JSON i wczytać ją później, co pozwala na kontynuowanie pracy lub udostępnianie analizy innym osobom bez konieczności ponownego wykonywania wszystkich kroków i generowania kosztów API.

Wskazówka

Podczas eksportu do PDF, zaznacz opcje "Podsumowanie" oraz "Wykresy", aby utworzyć kompaktowy raport z najważniejszymi ustaleniami i wizualizacjami, idealny do prezentacji wyników analizy.

Konfiguracja AI i schematu JSON

1. Prompt (System message)

Prompt to instrukcja dla modelu AI, która określa, jak ma interpretować i analizować komentarze. Dobrze skonstruowany prompt jest kluczowy dla uzyskania wysokiej jakości analizy.

Elementy skutecznego promptu:

Rola - określenie perspektywy, z jakiej AI ma analizować dane (np. "Jako analityk komentarzy klientów...")
Zadanie - jasne określenie, co AI ma zrobić (np. "...przeanalizuj poniższe komentarze i zidentyfikuj kluczowe problemy...")
Kontekst - dodatkowe informacje o danych (np. "...komentarze pochodzą z ankiety satysfakcji klientów działu obsługi...")
Format - informacja o wymaganym formacie odpowiedzi (np. "...odpowiedz w formacie zgodnym z podanym schematem...")
Wskazówki - szczegóły dotyczące tego, na co zwrócić uwagę (np. "...zwróć szczególną uwagę na problemy związane z czasem oczekiwania, jakością obsługi i funkcjonalnością produktu...")

Przykładowy prompt:

Jako analityk komentarzy klientów, przeanalizuj poniższe opinie. Odpowiadaj po polsku.
Zidentyfikuj główne mocne i słabe strony, a także zaproponuj rekomendacje dla firmy.
Szczególną uwagę zwróć na kwestie związane z jakością obsługi, czasem realizacji 
i funkcjonalnością produktów.
Odpowiedź podaj w formacie JSON zgodnym z dostarczonym schematem.

2. Schemat JSON

Schemat JSON definiuje strukturę wyników analizy. Pozwala to na uzyskanie spójnych, ustrukturyzowanych odpowiedzi, które można łatwo przetwarzać i prezentować.

Struktura schematu JSON:

type - typ głównego obiektu (zawsze "object")
properties - definicje poszczególnych pól w wynikowym JSON
required - lista wymaganych pól

Dla każdego pola można zdefiniować:

type - typ danych (string, number, array, object, boolean)
description - opcjonalny opis pola, który może pomóc modelowi AI
items - dla tablic, określa typ elementów tablicy
properties - dla zagnieżdżonych obiektów, ich struktura
enum - dla typu "string", lista dozwolonych wartości

Podstawowy schemat JSON:

{
  "type": "object",
  "properties": {
    "mocne_strony": {
      "type": "array",
      "description": "Lista kluczowych pozytywnych aspektów wymienionych w komentarzach.",
      "items": { "type": "string" }
    },
    "slabe_strony": {
      "type": "array",
      "description": "Lista głównych problemów i negatywnych aspektów.",
      "items": { "type": "string" }
    },
    "rekomendacje": {
      "type": "array",
      "description": "Konkretne sugestie działań lub usprawnień.",
      "items": { "type": "string" }
    }
  },
  "required": ["mocne_strony", "slabe_strony", "rekomendacje"]
}

Zaawansowany schemat JSON z sentymentem i kategoriami:

{
  "type": "object",
  "properties": {
    "ogolne_podsumowanie": {
      "type": "string",
      "description": "Krótkie, 2-3 zdaniowe podsumowanie głównych wniosków z analizowanych komentarzy."
    },
    "sentyment_ogolny": {
      "type": "string",
      "description": "Ogólny wydźwięk komentarzy.",
      "enum": ["Pozytywny", "Neutralny", "Negatywny", "Mieszany"]
    },
    "glowne_tematy": {
      "type": "array",
      "description": "Lista 3-5 głównych tematów poruszanych w komentarzach, wraz z ich sentymentem.",
      "items": {
        "type": "object",
        "properties": {
          "temat": { "type": "string" },
          "sentyment_tematu": { "type": "string", "enum": ["Pozytywny", "Neutralny", "Negatywny"] },
          "liczba_wzmianek_przyblizona": { "type": "number", 
          "description": "Szacunkowa liczba komentarzy dotyczących tego tematu."}
        },
        "required": ["temat", "sentyment_tematu"]
      }
    },
    "cytaty_kluczowe": {
        "type": "array",
        "description": "2-3 reprezentatywne cytaty ilustrujące główne wnioski 
        (zachowaj oryginalną pisownię).",
        "items": { "type": "string" }
    },
    "sugestie_dzialan": {
      "type": "array",
      "description": "Lista konkretnych, możliwych do wdrożenia sugestii działań.",
      "items": { "type": "string" }
    }
  },
  "required": ["ogolne_podsumowanie", "sentyment_ogolny", "glowne_tematy"]
}

Najlepsze praktyki

Testuj swój prompt i schemat JSON na małej próbce komentarzy (np. 5-10) używając funkcji "Test promptu" w Rosetcie, aby szybko iterować i optymalizować ustawienia.
Używaj gotowych szablonów jako punktu wyjścia, a następnie dostosuj je do swoich specyficznych potrzeb i rodzaju danych.
Schemat JSON powinien precyzyjnie odzwierciedlać strukturę informacji, których szukasz. Dodawanie `description` do pól w schemacie może pomóc modelowi lepiej zrozumieć oczekiwania.
Jeśli wyniki nie są zadowalające, spróbuj przeformułować prompt, dodać więcej przykładów (few-shot prompting, jeśli to możliwe) lub uprościć/uszczegółowić schemat JSON.

Przykłady i przypadki użycia

Poniższe przykłady pokazują, jak skonfigurować Rosettę do różnych zastosowań. Możesz użyć ich jako punktu wyjścia do własnych analiz, dostosowując parametry do swoich konkretnych potrzeb. Pamiętaj, aby dostosować nazwy kolumn do tych w Twoim pliku.

Przykład 1: Analiza opinii klientów (Obsługa Klienta)

Scenariusz:

Analiza komentarzy klientów z ankiety satysfakcji po kontakcie z działem obsługi klienta. Celem jest identyfikacja mocnych/słabych stron obsługi i trendów w czasie.

Konfiguracja:

Typ analizy: Z gradacją (np. Miesięcznie)
Kolumna daty: "DataKontaktu"
Kolumny komentarzy: "OpiniaPoKontakcie", "DodatkoweUwagi"
Kolumny filtrów: "KanalKontaktu" (np. telefon, email, czat), "TypSprawy"

Prompt:

Jesteś analitykiem specjalizującym się w opiniach klientów dotyczących obsługi. 
                                Przeanalizuj poniższe komentarze. Odpowiadaj po polsku.
Twoim zadaniem jest zidentyfikowanie:
1. Głównych mocnych stron obsługi (np. szybkość, uprzejmość, kompetencje).
2. Głównych słabych stron obsługi 
(np. długi czas oczekiwania, nierozwiązany problem, niekompetencja).
3. Kluczowych kategorii problemów/pochwał 
(np. "Czas odpowiedzi", "Kompetencje konsultanta", "Jakość rozwiązania", "Proces obsługi").
4. Ogólnego sentymentu (Pozytywny, Neutralny, Negatywny, Mieszany).
5. Konkretnych rekomendacji usprawnień.
Zwróć szczególną uwagę na powtarzające się wzorce. 
Odpowiedź podaj w formacie JSON zgodnym z dostarczonym schematem.

Schemat JSON:

{
  "type": "object",
  "properties": {
    "sentyment_ogolny": { "type": "string", "enum": 
    ["Pozytywny", "Neutralny", "Negatywny", "Mieszany"] },
    "mocne_strony_obslugi": { "type": "array", "items": { "type": "string" } },
    "slabe_strony_obslugi": { "type": "array", "items": { "type": "string" } },
    "kategorie_tematyczne": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "kategoria": { "type": "string" },
          "liczba_wzmianek": { "type": "number" },
          "sentyment_kategorii": { "type": "string", "enum": 
          ["Pozytywny", "Neutralny", "Negatywny"] }
        },
        "required": ["kategoria", "liczba_wzmianek", "sentyment_kategorii"]
      }
    },
    "rekomendacje_dzialan": { "type": "array", "items": { "type": "string" } }
  },
  "required": ["sentyment_ogolny", "mocne_strony_obslugi", 
  "slabe_strony_obslugi", "kategorie_tematyczne", "rekomendacje_dzialan"]
}

Przykład 2: Analiza zgłoszeń błędów (Produkt Cyfrowy)

Scenariusz:

Analiza zgłoszeń błędów i problemów technicznych zgłaszanych przez użytkowników aplikacji mobilnej. Celem jest kategoryzacja błędów i identyfikacja najpilniejszych do naprawy.

Konfiguracja:

Typ analizy: Bez gradacji (każde zgłoszenie osobno lub grupowane np. tygodniowo)
Kolumny komentarzy: "OpisProblemu", "KrokiDoReprodukcji"
Kolumny dodatkowe: "WersjaAplikacji", "SystemOperacyjny", "ModelUrzadzenia" (te dane zostaną dołączone do promptu)
Kolumny filtrów: "PriorytetZgloszenia", "StatusNaprawy", "ModulAplikacji"

Prompt:

Jako analityk QA, przeanalizuj poniższe zgłoszenie błędu w aplikacji. 
                                Odpowiadaj po polsku.
Na podstawie opisu problemu, kroków reprodukcji oraz dodatkowych informacji 
(wersja aplikacji, OS, urządzenie):
1. Zidentyfikuj główną kategorię błędu (np. UI/UX, Wydajność, Awaria, Funkcjonalność X).
2. Określ potencjalną przyczynę źródłową (jeśli możliwa do wywnioskowania).
3. Oceń powagę błędu (Krytyczny, Wysoki, Średni, Niski).
4. Zaproponuj kroki weryfikacji dla testera.
Odpowiedź podaj w formacie JSON.

Schemat JSON:

{
  "type": "object",
  "properties": {
    "kategoria_bledu": { "type": "string", "description": 
    "Np. UI/UX, Wydajność, Awaria, Logika biznesowa, Funkcjonalność Płatności" },
    "potencjalna_przyczyna": { "type": "string", "description": "Krótki opis możliwej przyczyny." },
    "ocena_powagi": { "type": "string", "enum": ["Krytyczny", "Wysoki", "Średni", "Niski"] },
    "sugerowane_kroki_weryfikacji": { "type": "array", "items": { "type": "string" } },
    "dodatkowe_obserwacje": { "type": "string", "description": "Wszelkie inne istotne obserwacje."}
  },
  "required": ["kategoria_bledu", "ocena_powagi"]
}

Przykład 3: Analiza ankiet pracowniczych (HR)

Scenariusz:

Analiza odpowiedzi na pytania otwarte z corocznej ankiety zaangażowania pracowników. Celem jest zrozumienie nastrojów, identyfikacja obszarów do poprawy i mocnych stron organizacji.

Konfiguracja:

Typ analizy: Z gradacją (np. Rocznie, jeśli porównujemy rok do roku) lub Bez gradacji (jeśli analizujemy jedną ankietę)
Kolumny komentarzy: "CoCiSiePodobaWPracy", "CoMozemyPoprawic", "DodatkoweSugestie"
Kolumny filtrów: "Dzial", "StazPracy", "PoziomStanowiska"

Prompt:

Jesteś specjalistą HR analizującym wyniki ankiety pracowniczej. 
                                Przeanalizuj poniższe komentarze. Odpowiadaj po polsku.
Twoim celem jest zrozumienie ogólnych nastrojów oraz zidentyfikowanie kluczowych tematów.
1. Podsumuj ogólny wydźwięk komentarzy 
(Pozytywny, Raczej pozytywny, Neutralny, Raczej negatywny, Negatywny).
2. Wymień 3-5 głównych mocnych stron organizacji wymienianych przez pracowników.
3. Wymień 3-5 głównych obszarów do poprawy wskazywanych przez pracowników.
4. Zidentyfikuj 3-5 kluczowych tematów/kategorii poruszanych w komentarzach 
(np. Rozwój, Wynagrodzenie, Atmosfera, Zarządzanie, Komunikacja).
5. Zaproponuj 2-3 ogólne rekomendacje dla działu HR.
Odpowiedź podaj w formacie JSON.