Rosetta - Narzędzie do analizy tekstowej

Co to jest Rosetta?

Rosetta to zaawansowane narzędzie analityczne, które pomaga w odkrywaniu wartościowych informacji z danych tekstowych, takich jak komentarze klientów, opinie, czy odpowiedzi na pytania otwarte w ankietach. Wykorzystuje modele językowe AI do automatycznej analizy i kategoryzacji tekstów, umożliwiając szybkie identyfikowanie trendów, problemów i możliwości.

Dla kogo jest Rosetta

Rosetta została zaprojektowana z myślą o szerokim gronie użytkowników, którzy potrzebują efektywnie analizować dane tekstowe. Idealnie sprawdzi się dla:

  • Jakościowców: Do szybkiego przetwarzania dużych zbiorów opinii, recenzji, odpowiedzi z ankiet.
  • Kierowników: Do zrozumienia feedbacku użytkowników na temat produktów i usług.
  • Liderów: Do identyfikacji kluczowych problemów i obszarów do poprawy w komunikacji z klientami.
  • Działów HR: Do analizy ankiet pracowniczych i zrozumienia nastrojów w organizacji.
  • Marketingowców: Do śledzenia opinii o kampaniach i marce w internecie.

Niezależnie od branży, jeśli pracujesz z tekstami i chcesz wydobyć z nich cenne wnioski, Rosetta jest narzędziem dla Ciebie.

Główne funkcje:
Import danych

Obsługa plików CSV i Excel, z wykrywaniem kodowania i separatorów.

Filtrowanie

Elastyczne filtrowanie, grupowanie i segmentacja danych.

Analiza AI

Integracja z modelami AI do analizy semantycznej tekstów.

Wizualizacje

Wykresy trendu, rozkładów i porównań wyników analizy.

Strukturyzacja JSON

Definiowanie własnych schematów JSON dla wyników analizy.

Eksport

Eksport wyników w różnych formatach (Excel, CSV, PDF, JSON).

Wskazówka

Rosetta najlepiej sprawdza się przy analizie tekstów o podobnej tematyce i strukturze. Przed uruchomieniem pełnej analizy na dużym zbiorze danych, zalecamy przetestowanie ustawień na mniejszej próbce, aby dostosować parametry i schemat wyników.

Kroki przeprowadzania analizy

Obsługiwane formaty plików:
  • CSV - z różnymi separatorami (przecinek, średnik, tabulator)
  • Excel - formaty XLSX i XLS z obsługą wielu arkuszy
Typy analizy:
  • Z gradacją - grupowanie danych według wybranego okresu czasu (dzień, tydzień, miesiąc) i analizowanie trendów.
  • Bez gradacji - analiza każdego wiersza danych oddzielnie, idealne do analizowania indywidualnych przypadków.
Opcje dodatkowe:
  • Kodowanie znaków - wybór odpowiedniego kodowania dla plików CSV (UTF-8, ISO-8859-2, Windows-1250)
  • Separator - wybór separatora dla plików CSV (przecinek, średnik, tabulator, pionowa kreska)
  • Wybór arkusza - dla plików Excel z wieloma arkuszami
Wskazówka

W przypadku problemów z kodowaniem polskich znaków w plikach CSV, spróbuj różnych opcji kodowania. Najczęściej używane to UTF-8 (standard) oraz Windows-1250 (typowy dla plików z Microsoft Excel).

Typy kolumn:
  • Kolumna z datą - wybierana dla analizy z gradacją, służy do grupowania danych w czasie. Rosetta automatycznie rozpoznaje popularne formaty dat.
  • Kolumny filtrów (max 5) - kolumny, które posłużą do filtrowania i segmentacji danych. Najlepiej wybierać kolumny kategoryczne z umiarkowaną liczbą unikalnych wartości.
  • Kolumny komentarzy (max 3) - kolumny zawierające teksty do analizy przez AI. Mogą to być komentarze klientów, opinie, opisy problemów, itp.
  • Kolumny dodatkowe - kolumny, których wartości zostaną doklejone do komentarzy w formacie "nagłówek:wartość". Przydatne do dodania kontekstu do analizowanych tekstów.
Automatyczne wykrywanie:

Rosetta automatycznie sugeruje odpowiednie kolumny na podstawie zawartości pliku:

  • Kolumny dat - wykrywane na podstawie nazwy i formatu zawartości
  • Kolumny komentarzy - wykrywane na podstawie długości tekstu i zawartości
  • Kolumny filtrów - wykrywane na podstawie liczby unikalnych wartości
Wskazówka

Wybierając kolumny komentarzy, kieruj się zasadą, że powinny zawierać teksty o podobnej strukturze i zakresie tematycznym. Możesz wybrać kilka kolumn komentarzy, które zostaną połączone podczas analizy.

Zakładki ustawień:
  • Filtry - wybór wartości z wybranych kolumn filtrujących. Możesz użyć filtrów do skupienia analizy na konkretnych segmentach danych.
  • AI - konfiguracja modelu AI, promptu systemowego i struktury wyników. Tutaj możesz dostosować, jak AI ma interpretować i analizować teksty.
  • Podgląd - podgląd przefiltrowanych danych i statystyk przed rozpoczęciem analizy.
  • Opcje dodatkowe - dodatkowe ustawienia analizy, takie jak pomijanie pustych komentarzy czy generowanie wykresów.
Konfiguracja grupowania danych (dla analizy z gradacją):
  • Zakres dat - określenie okresu analizowanych danych. Możesz wybrać predefiniowane zakresy lub ustawić własny.
  • Gradacja - wybór sposobu grupowania danych w czasie: dziennie, tygodniowo, miesięcznie, kwartalnie, rocznie lub niestandardowo.
  • Kolumna do grupowania - opcjonalne dodatkowe grupowanie danych według wybranej kolumny (np. zespół, konsultant, kategoria).
Wskazówka

Przy konfiguracji filtrów sprawdź, ile danych pozostaje po zastosowaniu filtrów, korzystając z zakładki "Podgląd". Optymalna liczba komentarzy w jednej grupie to 20-100 - zbyt mała liczba może dać mało wiarygodne wyniki, a zbyt duża może przekroczyć limity kontekstu AI.

W tym kroku:
  • Przygotowanie danych - dane są filtrowane i grupowane według wybranych kryteriów.
  • Wysyłanie do API AI - komentarze z każdej grupy są wysyłane do modelu AI w celu analizy.
  • Przetwarzanie odpowiedzi - odpowiedzi AI są przetwarzane i formatowane zgodnie z wybranym schematem JSON.
  • Generowanie wykresów - na podstawie wyników analizy tworzone są wykresy i wizualizacje.
Monitoring postępu:
  • Lista operacji - wyświetla aktualny stan każdego etapu analizy
  • Pasek postępu - pokazuje ogólny postęp analizy
  • Szczegółowe liczniki - informują o przetworzonych grupach, zapytaniach do AI i zużyciu tokenów
  • Dziennik operacji - szczegółowy log wykonywanych czynności
Uwaga

Analiza dużych zbiorów danych może trwać dłuższy czas i generować koszty związane z wykorzystaniem API OpenAI. W przypadku dużych analiz, zalecamy:

  • Podzielenie analizy na mniejsze partie
  • Używanie modeli GPT-4o Mini dla wstępnych testów
  • Monitorowanie zużycia tokenów w panelu analizy

Zakładki wyników:
  • Tabela - tabelaryczne zestawienie wyników analizy dla każdej grupy. Możliwość wyszukiwania i filtrowania.
  • Wykresy - interaktywne wizualizacje wyników, w tym:
    • Wykres główny - konfigurowalne podsumowanie wyników
    • Trendy w komentarzach - częstotliwość najważniejszych tematów
    • Trend czasowy - zmiana sentymentu lub liczby mocnych/słabych stron w czasie
  • Podsumowanie - automatycznie wygenerowane podsumowanie całej analizy:
    • Ogólne wnioski z analizy
    • Lista najważniejszych mocnych stron
    • Lista najważniejszych słabych stron
    • Rekomendacje działań
  • Eksport - możliwość wyeksportowania wyników w różnych formatach:
    • Excel - dla dalszej analizy danych
    • CSV - dla kompatybilności z różnymi narzędziami
    • PDF - dla raportów i prezentacji
    • JSON - dla integracji z innymi systemami
Zapisywanie i wczytywanie analizy:

Możesz zapisać kompletną analizę do pliku JSON i wczytać ją później, co pozwala na kontynuowanie pracy lub udostępnianie analizy innym osobom bez konieczności ponownego wykonywania wszystkich kroków i generowania kosztów API.

Wskazówka

Podczas eksportu do PDF, zaznacz opcje "Podsumowanie" oraz "Wykresy", aby utworzyć kompaktowy raport z najważniejszymi ustaleniami i wizualizacjami, idealny do prezentacji wyników analizy.

Konfiguracja AI i schematu JSON

1. Prompt (System message)

Prompt to instrukcja dla modelu AI, która określa, jak ma interpretować i analizować komentarze. Dobrze skonstruowany prompt jest kluczowy dla uzyskania wysokiej jakości analizy.

Elementy skutecznego promptu:
  • Rola - określenie perspektywy, z jakiej AI ma analizować dane (np. "Jako analityk komentarzy klientów...")
  • Zadanie - jasne określenie, co AI ma zrobić (np. "...przeanalizuj poniższe komentarze i zidentyfikuj kluczowe problemy...")
  • Kontekst - dodatkowe informacje o danych (np. "...komentarze pochodzą z ankiety satysfakcji klientów działu obsługi...")
  • Format - informacja o wymaganym formacie odpowiedzi (np. "...odpowiedz w formacie zgodnym z podanym schematem...")
  • Wskazówki - szczegóły dotyczące tego, na co zwrócić uwagę (np. "...zwróć szczególną uwagę na problemy związane z czasem oczekiwania, jakością obsługi i funkcjonalnością produktu...")
Przykładowy prompt:
Jako analityk komentarzy klientów, przeanalizuj poniższe opinie. Odpowiadaj po polsku.
Zidentyfikuj główne mocne i słabe strony, a także zaproponuj rekomendacje dla firmy.
Szczególną uwagę zwróć na kwestie związane z jakością obsługi, czasem realizacji 
i funkcjonalnością produktów.
Odpowiedź podaj w formacie JSON zgodnym z dostarczonym schematem.
2. Schemat JSON

Schemat JSON definiuje strukturę wyników analizy. Pozwala to na uzyskanie spójnych, ustrukturyzowanych odpowiedzi, które można łatwo przetwarzać i prezentować.

Struktura schematu JSON:
  • type - typ głównego obiektu (zawsze "object")
  • properties - definicje poszczególnych pól w wynikowym JSON
  • required - lista wymaganych pól

Dla każdego pola można zdefiniować:

  • type - typ danych (string, number, array, object, boolean)
  • description - opcjonalny opis pola, który może pomóc modelowi AI
  • items - dla tablic, określa typ elementów tablicy
  • properties - dla zagnieżdżonych obiektów, ich struktura
  • enum - dla typu "string", lista dozwolonych wartości
Podstawowy schemat JSON:
{
  "type": "object",
  "properties": {
    "mocne_strony": {
      "type": "array",
      "description": "Lista kluczowych pozytywnych aspektów wymienionych w komentarzach.",
      "items": { "type": "string" }
    },
    "slabe_strony": {
      "type": "array",
      "description": "Lista głównych problemów i negatywnych aspektów.",
      "items": { "type": "string" }
    },
    "rekomendacje": {
      "type": "array",
      "description": "Konkretne sugestie działań lub usprawnień.",
      "items": { "type": "string" }
    }
  },
  "required": ["mocne_strony", "slabe_strony", "rekomendacje"]
}
Zaawansowany schemat JSON z sentymentem i kategoriami:
{
  "type": "object",
  "properties": {
    "ogolne_podsumowanie": {
      "type": "string",
      "description": "Krótkie, 2-3 zdaniowe podsumowanie głównych wniosków z analizowanych komentarzy."
    },
    "sentyment_ogolny": {
      "type": "string",
      "description": "Ogólny wydźwięk komentarzy.",
      "enum": ["Pozytywny", "Neutralny", "Negatywny", "Mieszany"]
    },
    "glowne_tematy": {
      "type": "array",
      "description": "Lista 3-5 głównych tematów poruszanych w komentarzach, wraz z ich sentymentem.",
      "items": {
        "type": "object",
        "properties": {
          "temat": { "type": "string" },
          "sentyment_tematu": { "type": "string", "enum": ["Pozytywny", "Neutralny", "Negatywny"] },
          "liczba_wzmianek_przyblizona": { "type": "number", 
          "description": "Szacunkowa liczba komentarzy dotyczących tego tematu."}
        },
        "required": ["temat", "sentyment_tematu"]
      }
    },
    "cytaty_kluczowe": {
        "type": "array",
        "description": "2-3 reprezentatywne cytaty ilustrujące główne wnioski 
        (zachowaj oryginalną pisownię).",
        "items": { "type": "string" }
    },
    "sugestie_dzialan": {
      "type": "array",
      "description": "Lista konkretnych, możliwych do wdrożenia sugestii działań.",
      "items": { "type": "string" }
    }
  },
  "required": ["ogolne_podsumowanie", "sentyment_ogolny", "glowne_tematy"]
}
Najlepsze praktyki
  • Testuj swój prompt i schemat JSON na małej próbce komentarzy (np. 5-10) używając funkcji "Test promptu" w Rosetcie, aby szybko iterować i optymalizować ustawienia.
  • Używaj gotowych szablonów jako punktu wyjścia, a następnie dostosuj je do swoich specyficznych potrzeb i rodzaju danych.
  • Schemat JSON powinien precyzyjnie odzwierciedlać strukturę informacji, których szukasz. Dodawanie `description` do pól w schemacie może pomóc modelowi lepiej zrozumieć oczekiwania.
  • Jeśli wyniki nie są zadowalające, spróbuj przeformułować prompt, dodać więcej przykładów (few-shot prompting, jeśli to możliwe) lub uprościć/uszczegółowić schemat JSON.

Przykłady i przypadki użycia

Poniższe przykłady pokazują, jak skonfigurować Rosettę do różnych zastosowań. Możesz użyć ich jako punktu wyjścia do własnych analiz, dostosowując parametry do swoich konkretnych potrzeb. Pamiętaj, aby dostosować nazwy kolumn do tych w Twoim pliku.

Przykład 1: Analiza opinii klientów (Obsługa Klienta)
Scenariusz:

Analiza komentarzy klientów z ankiety satysfakcji po kontakcie z działem obsługi klienta. Celem jest identyfikacja mocnych/słabych stron obsługi i trendów w czasie.

Konfiguracja:
  • Typ analizy: Z gradacją (np. Miesięcznie)
  • Kolumna daty: "DataKontaktu"
  • Kolumny komentarzy: "OpiniaPoKontakcie", "DodatkoweUwagi"
  • Kolumny filtrów: "KanalKontaktu" (np. telefon, email, czat), "TypSprawy"
Prompt:
Jesteś analitykiem specjalizującym się w opiniach klientów dotyczących obsługi. 
                                Przeanalizuj poniższe komentarze. Odpowiadaj po polsku.
Twoim zadaniem jest zidentyfikowanie:
1. Głównych mocnych stron obsługi (np. szybkość, uprzejmość, kompetencje).
2. Głównych słabych stron obsługi 
(np. długi czas oczekiwania, nierozwiązany problem, niekompetencja).
3. Kluczowych kategorii problemów/pochwał 
(np. "Czas odpowiedzi", "Kompetencje konsultanta", "Jakość rozwiązania", "Proces obsługi").
4. Ogólnego sentymentu (Pozytywny, Neutralny, Negatywny, Mieszany).
5. Konkretnych rekomendacji usprawnień.
Zwróć szczególną uwagę na powtarzające się wzorce. 
Odpowiedź podaj w formacie JSON zgodnym z dostarczonym schematem.
Schemat JSON:
{
  "type": "object",
  "properties": {
    "sentyment_ogolny": { "type": "string", "enum": 
    ["Pozytywny", "Neutralny", "Negatywny", "Mieszany"] },
    "mocne_strony_obslugi": { "type": "array", "items": { "type": "string" } },
    "slabe_strony_obslugi": { "type": "array", "items": { "type": "string" } },
    "kategorie_tematyczne": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "kategoria": { "type": "string" },
          "liczba_wzmianek": { "type": "number" },
          "sentyment_kategorii": { "type": "string", "enum": 
          ["Pozytywny", "Neutralny", "Negatywny"] }
        },
        "required": ["kategoria", "liczba_wzmianek", "sentyment_kategorii"]
      }
    },
    "rekomendacje_dzialan": { "type": "array", "items": { "type": "string" } }
  },
  "required": ["sentyment_ogolny", "mocne_strony_obslugi", 
  "slabe_strony_obslugi", "kategorie_tematyczne", "rekomendacje_dzialan"]
}
Przykład 2: Analiza zgłoszeń błędów (Produkt Cyfrowy)
Scenariusz:

Analiza zgłoszeń błędów i problemów technicznych zgłaszanych przez użytkowników aplikacji mobilnej. Celem jest kategoryzacja błędów i identyfikacja najpilniejszych do naprawy.

Konfiguracja:
  • Typ analizy: Bez gradacji (każde zgłoszenie osobno lub grupowane np. tygodniowo)
  • Kolumny komentarzy: "OpisProblemu", "KrokiDoReprodukcji"
  • Kolumny dodatkowe: "WersjaAplikacji", "SystemOperacyjny", "ModelUrzadzenia" (te dane zostaną dołączone do promptu)
  • Kolumny filtrów: "PriorytetZgloszenia", "StatusNaprawy", "ModulAplikacji"
Prompt:
Jako analityk QA, przeanalizuj poniższe zgłoszenie błędu w aplikacji. 
                                Odpowiadaj po polsku.
Na podstawie opisu problemu, kroków reprodukcji oraz dodatkowych informacji 
(wersja aplikacji, OS, urządzenie):
1. Zidentyfikuj główną kategorię błędu (np. UI/UX, Wydajność, Awaria, Funkcjonalność X).
2. Określ potencjalną przyczynę źródłową (jeśli możliwa do wywnioskowania).
3. Oceń powagę błędu (Krytyczny, Wysoki, Średni, Niski).
4. Zaproponuj kroki weryfikacji dla testera.
Odpowiedź podaj w formacie JSON.
Schemat JSON:
{
  "type": "object",
  "properties": {
    "kategoria_bledu": { "type": "string", "description": 
    "Np. UI/UX, Wydajność, Awaria, Logika biznesowa, Funkcjonalność Płatności" },
    "potencjalna_przyczyna": { "type": "string", "description": "Krótki opis możliwej przyczyny." },
    "ocena_powagi": { "type": "string", "enum": ["Krytyczny", "Wysoki", "Średni", "Niski"] },
    "sugerowane_kroki_weryfikacji": { "type": "array", "items": { "type": "string" } },
    "dodatkowe_obserwacje": { "type": "string", "description": "Wszelkie inne istotne obserwacje."}
  },
  "required": ["kategoria_bledu", "ocena_powagi"]
}
Przykład 3: Analiza ankiet pracowniczych (HR)
Scenariusz:

Analiza odpowiedzi na pytania otwarte z corocznej ankiety zaangażowania pracowników. Celem jest zrozumienie nastrojów, identyfikacja obszarów do poprawy i mocnych stron organizacji.

Konfiguracja:
  • Typ analizy: Z gradacją (np. Rocznie, jeśli porównujemy rok do roku) lub Bez gradacji (jeśli analizujemy jedną ankietę)
  • Kolumny komentarzy: "CoCiSiePodobaWPracy", "CoMozemyPoprawic", "DodatkoweSugestie"
  • Kolumny filtrów: "Dzial", "StazPracy", "PoziomStanowiska"
Prompt:
Jesteś specjalistą HR analizującym wyniki ankiety pracowniczej. 
                                Przeanalizuj poniższe komentarze. Odpowiadaj po polsku.
Twoim celem jest zrozumienie ogólnych nastrojów oraz zidentyfikowanie kluczowych tematów.
1. Podsumuj ogólny wydźwięk komentarzy 
(Pozytywny, Raczej pozytywny, Neutralny, Raczej negatywny, Negatywny).
2. Wymień 3-5 głównych mocnych stron organizacji wymienianych przez pracowników.
3. Wymień 3-5 głównych obszarów do poprawy wskazywanych przez pracowników.
4. Zidentyfikuj 3-5 kluczowych tematów/kategorii poruszanych w komentarzach 
(np. Rozwój, Wynagrodzenie, Atmosfera, Zarządzanie, Komunikacja).
5. Zaproponuj 2-3 ogólne rekomendacje dla działu HR.
Odpowiedź podaj w formacie JSON.
Schemat JSON:
{
  "type": "object",
  "properties": {
    "ogolny_wydzwiek": { "type": "string", "enum": ["Pozytywny", "Raczej pozytywny",
    "Neutralny", "Raczej negatywny", "Negatywny"] },
    "mocne_strony_organizacji": { "type": "array", "items": { "type": "string" } },
    "obszary_do_poprawy": { "type": "array", "items": { "type": "string" } },
    "kluczowe_tematy_w_komentarzach": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "temat": { "type": "string" },
          "czestotliwosc_wzmianek": { "type": "string", "enum": 
          ["Wysoka", "Średnia", "Niska"] }
        },
        "required": ["temat", "czestotliwosc_wzmianek"]
      }
    },
    "rekomendacje_dla_hr": { "type": "array", "items": { "type": "string" } }
  },
  "required": ["ogolny_wydzwiek", "mocne_strony_organizacji", "obszary_do_poprawy", 
  "kluczowe_tematy_w_komentarzach"]
}

Nie działa mi!

Problem: Błąd podczas wczytywania pliku CSV

Możliwe przyczyny i rozwiązania:

  • Nieprawidłowe kodowanie znaków: Spróbuj zmienić kodowanie w ustawieniach importu. Dla plików z polskimi znakami najczęściej używane są UTF-8, Windows-1250, ISO-8859-2.
  • Nieprawidłowy separator kolumn: Upewnij się, że wybrany separator (przecinek, średnik, tabulator) odpowiada temu, który jest używany w pliku. Otwórz plik w notatniku, aby sprawdzić.
  • Niespójna liczba kolumn w wierszach: Plik CSV powinien mieć taką samą liczbę separatorów w każdym wierszu. Sprawdź, czy znaki separatora nie występują wewnątrz danych tekstowych bez odpowiedniego cytowania.
  • Uszkodzony plik lub nietypowa struktura: Otwórz plik w programie arkusza kalkulacyjnego (Excel, Google Sheets), zapisz ponownie jako CSV i spróbuj wczytać.
Problem: Błąd podczas wczytywania pliku Excel

Możliwe przyczyny i rozwiązania:

  • Nieobsługiwany format lub wersja: Upewnij się, że używasz formatu XLSX lub XLS. Starsze formaty lub pliki z makrami (XLSM) mogą sprawiać problemy.
  • Skomplikowana struktura arkusza: Scalone komórki, ukryte wiersze/kolumny, zaawansowane formatowanie mogą utrudniać parsowanie. Spróbuj uprościć arkusz lub wyeksportować dane do nowego, czystego pliku.
  • Pusty arkusz lub brak nagłówków: Upewnij się, że wybrany arkusz zawiera dane i że pierwszy wiersz to nagłówki kolumn.

Problem: Błąd autoryzacji API (401 Unauthorized)

Możliwe przyczyny i rozwiązania:

  • Nieprawidłowy klucz API: Sprawdź, czy wprowadzony klucz API OpenAI jest poprawny i aktywny. Skopiuj go ponownie ze swojego panelu OpenAI.
  • Brak środków na koncie OpenAI lub wyczerpany limit: Zaloguj się do panelu OpenAI i sprawdź stan swojego konta oraz limity użycia.
Problem: Błąd limitu zapytań (429 Too Many Requests)

Możliwe przyczyny i rozwiązania:

  • Przekroczenie limitu zapytań na minutę (RPM) lub tokenów na minutę (TPM): Odczekaj chwilę i spróbuj ponownie. Jeśli problem się powtarza, rozważ zmniejszenie liczby grup analizowanych jednocześnie lub skontaktuj się z OpenAI w sprawie zwiększenia limitów.
Problem: Nieprawidłowe odpowiedzi AI lub błędy parsowania JSON

Możliwe przyczyny i rozwiązania:

  • Zbyt skomplikowany lub niejednoznaczny prompt: Uprość prompt, upewnij się, że jasno określa zadanie i oczekiwany format.
  • Nieprawidłowy schemat JSON: Sprawdź poprawność składni schematu JSON. Użyj walidatora JSON online. Upewnij się, że typy danych i struktura są zgodne z tym, co model ma wygenerować.
  • Zbyt duża ilość tekstu do analizy w jednym zapytaniu (przekroczenie limitu tokenów kontekstu): Rosetta stara się dzielić dane, ale jeśli pojedyncze komentarze są bardzo długie, może to być problem. Rozważ agregację lub skracanie bardzo długich tekstów.
  • Model "halucynuje" lub nie trzyma się schematu: Spróbuj obniżyć temperaturę (np. do 0.1-0.2). Wzmocnij instrukcje w prompcie dotyczące trzymania się schematu. Czasem pomaga dodanie `description` do pól w schemacie JSON.
Wskazówka do debugowania

Użyj funkcji "Test promptu" w zakładce AI na małej próbce danych. Sprawdź surową odpowiedź modelu, aby zobaczyć, czy generuje poprawny JSON i czy treść jest zgodna z oczekiwaniami.

Problem: Brak danych po zastosowaniu filtrów lub w podglądzie

Możliwe przyczyny i rozwiązania:

  • Zbyt restrykcyjne filtry: Sprawdź, czy kombinacja wybranych filtrów nie eliminuje wszystkich danych. Spróbuj usunąć niektóre filtry lub rozszerzyć ich zakres.
  • Nieprawidłowy zakres dat lub format daty: Upewnij się, że wybrany zakres dat zawiera dane i że format dat w pliku jest poprawnie interpretowany przez Rosettę.
  • Opcja "Pomiń puste komentarze" jest włączona: Jeśli ta opcja jest aktywna, a wybrane kolumny komentarzy są puste dla przefiltrowanych wierszy, nie zostaną one uwzględnione.
Problem: Nieoczekiwane lub niskiej jakości wyniki analizy

Możliwe przyczyny i rozwiązania:

  • Niewłaściwe kolumny wybrane jako komentarze: Upewnij się, że wybrałeś kolumny zawierające tekst do analizy, a nie np. dane liczbowe czy kody.
  • Niewystarczająca ilość danych w grupach: AI potrzebuje wystarczającej ilości kontekstu. Jeśli grupy są zbyt małe (np. 1-2 krótkie komentarze), wyniki mogą być ogólnikowe.
  • Nieodpowiedni prompt lub schemat JSON: To najczęstsza przyczyna. Dostosuj prompt i schemat do specyfiki danych i oczekiwanych informacji. Zobacz sekcję "AI i JSON" oraz "Przykłady".
Problem: Analiza trwa bardzo długo lub zawiesza się

Możliwe przyczyny i rozwiązania:

  • Bardzo duży zbiór danych: Rozważ podzielenie analizy na mniejsze części (np. filtrując dane po kolei dla różnych segmentów).
  • Problemy z połączeniem internetowym: Stabilne połączenie jest wymagane do komunikacji z API OpenAI.
  • Ograniczenia przeglądarki lub zasobów komputera: Długotrwałe, intensywne operacje JavaScript mogą obciążać przeglądarkę. Zamknij inne niepotrzebne karty/aplikacje.

Problem: Błąd podczas eksportu do Excel/CSV

Możliwe przyczyny i rozwiązania:

  • Zbyt duża ilość danych do wyeksportowania: Jeśli wyniki są bardzo obszerne, eksport może zająć dużo czasu lub przekroczyć limity pamięci przeglądarki. Spróbuj eksportować mniejsze części lub użyj formatu JSON.
  • Nietypowe znaki w wynikach: Chociaż biblioteki eksportujące starają się radzić sobie ze specjalnymi znakami, czasem mogą wystąpić problemy.
Problem: Błędy podczas eksportu do PDF

Możliwe przyczyny i rozwiązania:

  • Duża ilość wykresów lub złożonych elementów: Generowanie PDF z wieloma grafikami jest zasobożerne. Spróbuj ograniczyć liczbę wykresów lub eksportować bez nich.
  • Ograniczenia biblioteki generującej PDF (html2pdf.js): Niektóre złożone układy CSS lub elementy HTML mogą nie być w pełni obsługiwane.
Alternatywa dla eksportu PDF

Jeśli bezpośredni eksport do PDF zawodzi, możesz użyć funkcji przeglądarki "Drukuj do PDF" (Ctrl+P lub Cmd+P, następnie wybierz "Zapisz jako PDF"). Wynik może się różnić, ale często jest to skuteczne obejście.

Potrzebujesz dalszej pomocy?

Jeśli napotkasz problem, którego nie możesz rozwiązać, przygotuj następujące informacje, które pomogą w diagnozie:

  • Dokładny opis problemu i kroki prowadzące do jego wystąpienia.
  • Nazwa i wersja używanej przeglądarki.
  • Format i przybliżony rozmiar analizowanego pliku.
  • Zrzut ekranu błędu (jeśli występuje) oraz komunikaty z konsoli deweloperskiej przeglądarki (F12).
  • Fragment dziennika operacji Rosetty, jeśli problem dotyczy etapu analizy.
  • Za utrzymanie narzędzia odpowiada dział NewTech, deweloperem jest Adam Rędzikowski.

Zaawansowane funkcje wykresów

Rozbudowane możliwości wizualizacji

Moduł wykresów w Rosetta oferuje zaawansowane narzędzia do tworzenia profesjonalnych wizualizacji danych. Umożliwia dostosowanie wyglądu, kolorów i stylów wykresów, aby przedstawić wyniki analizy w najbardziej czytelny i atrakcyjny sposób.

Główne funkcje modułu wykresów:
Etykiety danych

Bezpośrednie wyświetlanie wartości na wykresach dla łatwiejszej interpretacji danych.

Unikalne kolory

Automatyczne przypisywanie różnych kolorów do każdego wymiaru na osi X.

Palety kolorów

Gotowe zestawy harmonijnych kolorów dla profesjonalnych wizualizacji.

Gradienty i wzory

Zaawansowane style wizualne dla bardziej atrakcyjnych wykresów.

Opcje eksportu

Zapisywanie wykresów w wysokiej jakości w różnych formatach.

Kolekcja wykresów

Zapisywanie i zarządzanie biblioteką stworzonych wykresów.

Typy wykresów:
  • Słupkowy: Do porównania wartości między kategoriami.
  • Liniowy: Do pokazania trendów w czasie.
  • Kołowy: Do przedstawienia proporcji w całości.
  • Pierścieniowy: Podobny do kołowego, ale z pustym środkiem.
  • Radarowy: Do porównania wielu zmiennych.
  • Polar Area: Podobny do kołowego, ale z różnymi długościami promieni.
  • Punktowy: Do wizualizacji korelacji między zmiennymi.

Rosetta umożliwia szczegółowe dostosowanie wyglądu wykresów poprzez następujące opcje:

Zarządzanie kolorami:
  • Palety predefiniowane: Wybór spośród różnych gotowych zestawów kolorów (domyślna, pastelowa, żywa, ziemista, chłodna, ciepła).
  • Indywidualne kolory: Możliwość ustawienia własnego koloru dla każdego elementu wykresu.
  • Style kolorowania: Wybór między jednolitymi kolorami, gradientami lub wzorami.
  • Przezroczystość: Regulacja poziomu przezroczystości kolorów dla lepszej czytelności nakładających się elementów.
Etykiety i siatka:
  • Etykiety danych: Wyświetlanie wartości bezpośrednio na wykresie z możliwością formatowania.
  • Siatka osi: Włączanie/wyłączanie linii siatki dla osi X i Y.
  • Start od zera: Opcja wymuszenia rozpoczynania osi Y od wartości zero.
  • Formaty liczbowe: Wyświetlanie wartości jako liczby, procenty lub według własnego formatu.
Typy agregacji danych:
  • Liczba (count): Zlicza wystąpienia wartości w grupie.
  • Suma (sum): Sumuje wartości liczbowe.
  • Średnia (average): Oblicza średnią arytmetyczną.
  • Liczba unikalnych (uniqueCount): Zlicza unikalne wartości.
  • Maksimum (max): Znajduje największą wartość.
  • Minimum (min): Znajduje najmniejszą wartość.
Wskazówka

Aby stworzyć efektywną wizualnie prezentację danych, wybieraj kolory, które kontrastują ze sobą, ale tworzą harmonijną całość. Jeśli prezentujesz dane z podziałem na kategorie pozytywne/negatywne, używaj konsekwentnie kolorów (np. zielony dla pozytywnych, czerwony dla negatywnych).

Kolekcja wykresów to funkcja pozwalająca na zapisywanie i organizowanie stworzonych wizualizacji do późniejszego wykorzystania:

Dodawanie wykresów do kolekcji:

Po stworzeniu wykresu z pożądanymi ustawieniami, można dodać go do kolekcji za pomocą przycisku "Dodaj wykres do kolekcji". Zapisane zostaną:

  • Typ wykresu i dane źródłowe
  • Wybrane kolumny danych i osie
  • Ustawienia kolorów i stylów
  • Wszystkie opcje formatowania
Organizacja kolekcji:
  • Kategorie: Wykresy są automatycznie grupowane według typów (słupkowe, liniowe, kołowe, inne).
  • Miniatury: Każdy wykres jest przedstawiony jako miniatura ze szczegółowym opisem.
  • Podgląd szczegółowy: Kliknięcie miniatury otwiera szczegółowy widok z pełnymi informacjami o konfiguracji.
Ponowne wykorzystanie:

Zapisane wykresy można łatwo zastosować do aktualnego widoku:

  • Zastosuj ustawienia: Przycisk "Zastosuj" przenosi wszystkie ustawienia zapisanego wykresu do bieżącego widoku.
  • Edycja: Po zastosowaniu ustawień można je dalej modyfikować.
  • Eksport: Zapisane wykresy można eksportować bezpośrednio z widoku kolekcji.
Wskazówka

Kolekcja wykresów jest szczególnie przydatna przy tworzeniu raportów cyklicznych, gdzie te same typy wizualizacji są wykorzystywane regularnie z nowymi danymi. Zamiast za każdym razem konfigurować wykresy od nowa, można zastosować zapisane szablony.

Rosetta oferuje zaawansowane opcje eksportu wykresów do wykorzystania w prezentacjach, raportach czy publikacjach:

Formaty eksportu:
  • PNG: Uniwersalny format graficzny z obsługą przezroczystości, idealny do większości zastosowań.
  • JPEG: Format z kompresją, dobry gdy zależy nam na mniejszym rozmiarze pliku kosztem jakości.
  • SVG: Format wektorowy, idealny do publikacji i grafik wymagających skalowania bez utraty jakości.
Opcje jakości i rozmiaru:
  • Jakość (dla JPEG): Wybór między standardową (70%), wysoką (85%) i najwyższą (100%) jakością.
  • Skalowanie: Możliwość eksportu w różnych rozdzielczościach (standardowa 1x, wysoka 2x, ultra HD 3x).
  • Znak wodny: Opcjonalne dodanie tekstu "Wygenerowano przez Rosetta".
  • Datowanie: Możliwość dodania daty wygenerowania wykresu.
Integracja z raportami:

Wyeksportowane wykresy można:

  • Dołączyć do raportów PDF generowanych przez Rosettę
  • Wstawić do dokumentów Word, PowerPoint, czy Google Docs
  • Umieścić na stronach internetowych czy w systemach wewnętrznych
  • Udostępnić zespołowi przez komunikatory lub e-mail
Wskazówka

Przy eksporcie wykresów do profesjonalnych raportów czy publikacji, warto używać formatu SVG lub wysokiej rozdzielczości PNG (skala 2x lub 3x). Zapewni to ostrość obrazu nawet po wydrukowaniu lub wyświetleniu na ekranach o wysokiej rozdzielczości.

Dobór odpowiedniego typu wykresu:
  • Wykresy słupkowe są idealne do porównywania wartości między różnymi kategoriami lub grupami.
  • Wykresy liniowe najlepiej sprawdzają się do przedstawiania trendów w czasie lub ciągłych zmian.
  • Wykresy kołowe lub pierścieniowe są użyteczne do pokazywania proporcji w całości, ale tylko gdy mamy niewielką liczbę kategorii (najlepiej 3-7).
  • Wykresy radarowe sprawdzają się przy porównywaniu obiektów względem wielu cech jednocześnie.
Efektywne użycie kolorów:
  • Spójność: Używaj tych samych kolorów dla tych samych kategorii w różnych wykresach w ramach jednego raportu.
  • Kontrast: Upewnij się, że kolory wystarczająco się od siebie różnią dla łatwego rozróżnienia.
  • Znaczenie: Wykorzystuj konwencje kolorystyczne (np. zielony dla pozytywnych wyników, czerwony dla negatywnych).
  • Dostępność: Pamiętaj o osobach z zaburzeniami widzenia barw - unikaj polegania wyłącznie na kolorach do przekazywania informacji.
Projektowanie czytelnych wykresów:
  • Prostota: Unikaj przeładowania wykresu zbyt wieloma seriami danych czy elementami dekoracyjnymi.
  • Etykiety: Używaj etykiet danych strategicznie - pokazuj je dla najważniejszych punktów, nie wszystkich.
  • Skala: Rozważ, czy oś Y powinna zaczynać się od zera (zazwyczaj tak dla wykresów słupkowych, niekoniecznie dla liniowych).
  • Legendy: Umieszczaj legendy w miejscu, które nie zakłóca odczytu głównych danych.
Prezentacja wyników:
  • Kontekst: Zawsze staraj się dostarczyć odpowiedni kontekst dla prezentowanych danych.
  • Kombinacje: Używaj różnych typów wykresów w raporcie, aby pokazać dane z różnych perspektyw.
  • Uporządkowanie: Sortuj dane w sposób logiczny (np. według wielkości dla wykresów słupkowych, chronologicznie dla liniowych).
  • Proporcje: Zachowaj odpowiednie proporcje wykresu, aby uniknąć zniekształcenia percepcji danych.
Wskazówka

Przy tworzeniu wykresów, kieruj się zasadą "less is more" - mniej znaczy więcej. Każdy element wykresu powinien mieć swój cel i dostarczać wartościowych informacji. Usuń wszelkie elementy, które nie przyczyniają się do zrozumienia danych.

Często zadawane pytania

Rosetta obsługuje następujące formaty plików:

  • CSV (Comma-Separated Values):
    • Separatory: przecinek (,), średnik (;), tabulator (⇥), pionowa kreska (|).
    • Kodowania: UTF-8, ISO-8859-2, Windows-1250, CP852 i inne popularne.
  • Excel:
    • Formaty: XLSX (zalecany), XLS.
    • Obsługa wielu arkuszy w jednym pliku.

Aby uzyskać najlepsze wyniki, upewnij się, że Twój plik ma strukturę tabelaryczną z nagłówkami kolumn w pierwszym wierszu.

Liczba komentarzy zależy od kilku czynników, głównie od limitów tokenów modeli AI i wybranego trybu analizy:

  • Limity tokenów modeli AI: Każdy model ma maksymalną liczbę tokenów (fragmentów słów), które może przetworzyć w jednym zapytaniu (prompt + odpowiedź). Np. GPT-4o może obsłużyć do 128k tokenów w kontekście, a GPT-4o Mini również sporo. Rosetta dzieli dane na partie, aby zmieścić się w tych limitach.
  • Długość komentarzy: Im dłuższe komentarze, tym mniej zmieści się ich w jednej partii wysyłanej do AI.
  • Tryb analizy:
    • Z gradacją: Dane są grupowane (np. dziennie, tygodniowo). Każda grupa jest analizowana osobno. Optymalna wielkość grupy to 20-200 komentarzy.
    • Bez gradacji: Każdy wiersz (komentarz) jest analizowany indywidualnie, co jest dobre dla szczegółowej analizy, ale może być wolniejsze i droższe dla dużych zbiorów.

W praktyce Rosetta może przetwarzać pliki z tysiącami, a nawet dziesiątkami tysięcy wierszy. Kluczowe jest odpowiednie grupowanie i świadomość kosztów API.

Rosetta priorytetowo traktuje bezpieczeństwo Twoich danych:

  • Przetwarzanie lokalne w przeglądarce: Większość operacji (wczytywanie pliku, filtrowanie, przygotowanie danych) odbywa się lokalnie w Twojej przeglądarce. Dane nie są wysyłane na serwery Rosetty.
  • Komunikacja z API OpenAI: Jedynie teksty przeznaczone do analizy (komentarze wraz z promptem) są wysyłane do API OpenAI. OpenAI ma własną politykę prywatności i politykę użycia danych API. Domyślnie dane wysyłane przez API nie są używane do trenowania modeli OpenAI.
  • Brak trwałego przechowywania przez Rosettę: Rosetta nie przechowuje Twoich danych wsadowych ani wyników analizy na żadnych serwerach po zakończeniu sesji. Zapisane analizy są przechowywane lokalnie na Twoim komputerze jako pliki.
  • Twój klucz API: Używasz własnego klucza API OpenAI, co daje Ci pełną kontrolę nad dostępem i rozliczeniami.

Zalecenia: Jeśli pracujesz z danymi szczególnie wrażliwymi, rozważ ich anonimizację przed wczytaniem do Rosetty. Zawsze korzystaj z bezpiecznego połączenia (HTTPS).

Interpretacja wyników zależy od Twojego promptu i schematu JSON. Oto ogólne wskazówki:

  • Zrozum swój schemat: Dokładnie przeanalizuj, jakie pola zdefiniowałeś w schemacie JSON i czego od nich oczekujesz.
  • Szukaj wzorców i trendów: Zamiast skupiać się na pojedynczych wynikach, szukaj powtarzających się tematów, sentymentów czy rekomendacji w różnych grupach danych lub okresach.
  • Porównuj segmenty: Jeśli używasz filtrów, porównuj wyniki między różnymi segmentami (np. różne produkty, działy, kanały kontaktu).
  • Weryfikuj z oryginalnymi danymi: Wyrywkowo sprawdzaj, czy analiza AI dla danej grupy komentarzy jest zgodna z Twoim odczytaniem oryginalnych tekstów.
  • Pamiętaj o ograniczeniach AI: Modele językowe mogą czasem "halucynować" (generować nieprawdziwe informacje) lub źle interpretować sarkazm/ironię. Wyniki należy traktować jako cenne wskazówki i punkt wyjścia do dalszej analizy, a nie ostateczną prawdę.
  • Iteruj: Jeśli wyniki nie są satysfakcjonujące, dostosuj prompt, schemat JSON lub parametry modelu i przeprowadź analizę ponownie na próbce danych.
Wskazówka

Wyniki z AI są najcenniejsze, gdy są używane do odkrywania "ukrytych" tematów, szybkiego przeglądu dużych ilości tekstu i generowania hipotez, które można następnie zweryfikować bardziej tradycyjnymi metodami.

Samo narzędzie Rosetta (jako aplikacja webowa działająca w przeglądarce) jest darmowe. Koszty związane są wyłącznie z wykorzystaniem API OpenAI:

  • Opłaty za API OpenAI: Naliczane są za liczbę tokenów przetworzonych przez modele AI (zarówno tokeny wejściowe - Twój prompt i komentarze, jak i tokeny wyjściowe - odpowiedź modelu). Ceny różnią się w zależności od wybranego modelu (np. GPT-4o jest droższy od GPT-4o Mini). Aktualny cennik znajdziesz na stronie OpenAI.
Jak optymalizować koszty?
  • Wybieraj odpowiedni model: Do wielu zadań wystarczy tańszy model (np. GPT-4o Mini). Używaj najmocniejszych modeli (np. GPT-4o) tam, gdzie jakość jest absolutnie krytyczna.
  • Testuj na małych próbkach: Zanim uruchomisz analizę na pełnym zbiorze danych, przetestuj ustawienia na małej próbce.
  • Optymalizuj prompty i schematy: Krótsze, bardziej precyzyjne prompty i zwięzłe schematy JSON mogą zmniejszyć liczbę tokenów.
  • Monitoruj zużycie: Rosetta pokazuje szacunkowe zużycie tokenów. Możesz też śledzić koszty w panelu OpenAI.
  • Grupuj dane mądrze: Unikaj tworzenia nadmiernie wielu małych grup, jeśli nie jest to konieczne, ale też nie twórz zbyt dużych, które przekroczą limity kontekstu.
  • Zapisuj analizy: Zapisane analizy można wczytać ponownie bez ponoszenia kosztów API.

Dobre przygotowanie danych to klucz do sukcesu:

Struktura pliku:
  • Format tabelaryczny: Dane w wierszach i kolumnach, z nagłówkami w pierwszym wierszu.
  • Czytelne nazwy kolumn: Używaj prostych, zrozumiałych nazw bez spacji i znaków specjalnych (np. "OpiniaKlienta" zamiast "Opinia klienta po kontakcie!").
  • Spójny format dat: Najlepiej YYYY-MM-DD lub inny standardowy, łatwo rozpoznawalny format.
Czyszczenie danych (zalecane):
  • Usuń duplikaty: Jeśli wiersze są identyczne.
  • Usuń "szum": Zbędne znaki, automatyczne podpisy e-mail, powtarzające się frazy bez znaczenia.
  • Normalizuj dane kategoryczne: Ujednolić pisownię (np. "Warszawa", "warszawa", "W-wa" na jedną formę).
  • Sprawdź puste wartości: Zdecyduj, jak traktować puste komórki w kolumnach komentarzy (Rosetta ma opcję ich pomijania).
Organizacja komentarzy:
  • Wybierz właściwe kolumny: Upewnij się, że kolumny wybrane do analizy faktycznie zawierają tekstowe komentarze.
  • Dodaj kontekst: Jeśli masz dodatkowe informacje (np. kategoria produktu, typ klienta), które mogą być istotne dla analizy, rozważ dołączenie ich jako "kolumny dodatkowe" – ich zawartość zostanie dodana do promptu.
Wskazówka

Im czystsze i lepiej przygotowane dane, tym lepsze i bardziej wiarygodne wyniki analizy uzyskasz od AI. Poświęcenie czasu na ten etap często się opłaca.

Witamy w Rosetta! Oto kilka kroków, aby dobrze zacząć:

  1. Przygotuj mały plik testowy: Zacznij od niewielkiego pliku CSV lub Excel (np. 20-50 wierszy) z komentarzami, które chcesz przeanalizować. Upewnij się, że plik ma czytelne nagłówki kolumn.
  2. Zapoznaj się z interfejsem: Przejdź przez poszczególne kroki wczytywania pliku i wyboru kolumn. Zwróć uwagę na automatyczne sugestie Rosetty.
  3. Użyj gotowego szablonu AI: W zakładce "AI i JSON" wybierz jeden z gotowych szablonów promptu i schematu JSON. Na początek nie musisz tworzyć własnych od zera. Możesz też skorzystać z przykładów w zakładce "Przykłady".
  4. Przetestuj na małej próbce: Uruchom analizę na swoim małym pliku. Zwróċ uwagę na czas przetwarzania i koszty (jeśli używasz własnego klucza API).
  5. Przejrzyj wyniki: Zapoznaj się z tabelą wyników, wykresami i podsumowaniem. Zastanów się, czy uzyskane informacje są dla Ciebie wartościowe.
  6. Eksperymentuj: Spróbuj zmodyfikować prompt, zmienić parametry modelu AI (np. temperaturę) lub dostosować schemat JSON, aby zobaczyć, jak wpływa to na wyniki.
  7. Przeczytaj tę instrukcję: Szczególnie sekcje "Kroki analizy", "AI i JSON" oraz "Przykłady" dostarczą Ci wielu cennych wskazówek.

Pamiętaj, że kluczem jest praktyka. Im więcej będziesz eksperymentować z różnymi danymi i ustawieniami, tym lepiej zrozumiesz możliwości Rosetty. Nie bój się testować i popełniać błędów – to najlepszy sposób na naukę!