Rosetta - Narzędzie do analizy
tekstowej
Co to jest Rosetta?
Rosetta to zaawansowane narzędzie analityczne, które pomaga w
odkrywaniu wartościowych informacji z danych tekstowych, takich
jak komentarze klientów, opinie, czy odpowiedzi na pytania
otwarte w ankietach. Wykorzystuje modele językowe AI do
automatycznej analizy i kategoryzacji tekstów, umożliwiając
szybkie identyfikowanie trendów, problemów i możliwości.
Dla kogo jest Rosetta
Rosetta została zaprojektowana z myślą o szerokim gronie
użytkowników, którzy potrzebują efektywnie analizować dane
tekstowe. Idealnie sprawdzi się dla:
-
Jakościowców: Do szybkiego
przetwarzania
dużych zbiorów opinii, recenzji, odpowiedzi z ankiet.
-
Kierowników: Do zrozumienia feedbacku
użytkowników na temat produktów i usług.
-
Liderów: Do identyfikacji kluczowych
problemów i obszarów do poprawy w komunikacji z klientami.
-
Działów HR: Do analizy ankiet
pracowniczych
i zrozumienia nastrojów w organizacji.
-
Marketingowców: Do śledzenia opinii o
kampaniach i marce w internecie.
Niezależnie od branży, jeśli pracujesz z tekstami i chcesz
wydobyć z nich cenne wnioski, Rosetta jest narzędziem dla
Ciebie.
Główne funkcje:
Import danych
Obsługa plików CSV i Excel, z wykrywaniem kodowania i
separatorów.
Filtrowanie
Elastyczne filtrowanie, grupowanie i segmentacja danych.
Analiza AI
Integracja z modelami AI do analizy semantycznej tekstów.
Wizualizacje
Wykresy trendu, rozkładów i porównań wyników analizy.
Strukturyzacja JSON
Definiowanie własnych schematów JSON dla wyników analizy.
Eksport
Eksport wyników w różnych formatach (Excel, CSV, PDF, JSON).
Wskazówka
Rosetta najlepiej sprawdza się przy analizie tekstów o podobnej
tematyce i strukturze. Przed uruchomieniem pełnej analizy na
dużym zbiorze danych, zalecamy przetestowanie ustawień na
mniejszej próbce, aby dostosować parametry i schemat wyników.
Kroki przeprowadzania analizy
Obsługiwane formaty
plików:
-
CSV - z różnymi separatorami
(przecinek, średnik, tabulator)
-
Excel - formaty XLSX i XLS z obsługą
wielu arkuszy
Typy analizy:
-
Z gradacją - grupowanie danych według
wybranego okresu czasu (dzień, tydzień, miesiąc) i
analizowanie trendów.
-
Bez gradacji - analiza każdego wiersza
danych oddzielnie, idealne do analizowania
indywidualnych przypadków.
Opcje dodatkowe:
-
Kodowanie znaków - wybór odpowiedniego
kodowania dla plików CSV (UTF-8, ISO-8859-2,
Windows-1250)
-
Separator - wybór separatora dla plików
CSV (przecinek, średnik, tabulator, pionowa kreska)
-
Wybór arkusza - dla plików Excel z
wieloma arkuszami
Wskazówka
W przypadku problemów z kodowaniem polskich znaków w
plikach CSV, spróbuj różnych opcji kodowania.
Najczęściej używane to UTF-8 (standard) oraz
Windows-1250 (typowy dla plików z Microsoft Excel).
Typy kolumn:
-
Kolumna z datą - wybierana dla analizy
z gradacją, służy do grupowania danych w czasie. Rosetta
automatycznie rozpoznaje popularne formaty dat.
-
Kolumny filtrów (max 5) - kolumny,
które posłużą do filtrowania i segmentacji danych.
Najlepiej wybierać kolumny kategoryczne z umiarkowaną
liczbą unikalnych wartości.
-
Kolumny komentarzy (max 3) - kolumny
zawierające teksty do analizy przez AI. Mogą to być
komentarze klientów, opinie, opisy problemów, itp.
-
Kolumny dodatkowe - kolumny, których
wartości zostaną doklejone do komentarzy w formacie
"nagłówek:wartość". Przydatne do dodania kontekstu do
analizowanych tekstów.
Automatyczne wykrywanie:
Rosetta automatycznie sugeruje odpowiednie kolumny na
podstawie zawartości pliku:
-
Kolumny dat - wykrywane na podstawie nazwy i formatu
zawartości
-
Kolumny komentarzy - wykrywane na podstawie długości
tekstu i zawartości
-
Kolumny filtrów - wykrywane na podstawie liczby
unikalnych wartości
Wskazówka
Wybierając kolumny komentarzy, kieruj się zasadą, że
powinny zawierać teksty o podobnej strukturze i zakresie
tematycznym. Możesz wybrać kilka kolumn komentarzy,
które zostaną połączone podczas analizy.
Zakładki ustawień:
-
Filtry - wybór wartości z wybranych
kolumn filtrujących. Możesz użyć filtrów do skupienia
analizy na konkretnych segmentach danych.
-
AI - konfiguracja modelu AI, promptu
systemowego i struktury wyników. Tutaj możesz
dostosować, jak AI ma interpretować i analizować teksty.
-
Podgląd - podgląd przefiltrowanych
danych i statystyk przed rozpoczęciem analizy.
-
Opcje dodatkowe - dodatkowe ustawienia
analizy, takie jak pomijanie pustych komentarzy czy
generowanie wykresów.
Konfiguracja
grupowania danych (dla analizy z gradacją):
-
Zakres dat - określenie okresu
analizowanych danych. Możesz wybrać predefiniowane
zakresy lub ustawić własny.
-
Gradacja - wybór sposobu grupowania
danych w czasie: dziennie, tygodniowo, miesięcznie,
kwartalnie, rocznie lub niestandardowo.
-
Kolumna do grupowania - opcjonalne
dodatkowe grupowanie danych według wybranej kolumny (np.
zespół, konsultant, kategoria).
Wskazówka
Przy konfiguracji filtrów sprawdź, ile danych pozostaje
po zastosowaniu filtrów, korzystając z zakładki
"Podgląd". Optymalna liczba komentarzy w jednej grupie
to 20-100 - zbyt mała liczba może dać mało wiarygodne
wyniki, a zbyt duża może przekroczyć limity kontekstu
AI.
W tym kroku:
-
Przygotowanie danych - dane są
filtrowane i grupowane według wybranych kryteriów.
-
Wysyłanie do API AI - komentarze z
każdej grupy są wysyłane do modelu AI w celu analizy.
-
Przetwarzanie odpowiedzi - odpowiedzi
AI są przetwarzane i formatowane zgodnie z wybranym
schematem JSON.
-
Generowanie wykresów - na podstawie
wyników analizy tworzone są wykresy i wizualizacje.
Monitoring postępu:
-
Lista operacji - wyświetla aktualny
stan każdego etapu analizy
-
Pasek postępu - pokazuje ogólny postęp
analizy
-
Szczegółowe liczniki - informują o
przetworzonych grupach, zapytaniach do AI i zużyciu
tokenów
-
Dziennik operacji - szczegółowy log
wykonywanych czynności
Uwaga
Analiza dużych zbiorów danych może trwać dłuższy czas i
generować koszty związane z wykorzystaniem API OpenAI. W
przypadku dużych analiz, zalecamy:
- Podzielenie analizy na mniejsze partie
-
Używanie modeli GPT-4o Mini dla wstępnych testów
- Monitorowanie zużycia tokenów w panelu analizy
Zakładki wyników:
-
Tabela - tabelaryczne zestawienie
wyników analizy dla każdej grupy. Możliwość wyszukiwania
i filtrowania.
-
Wykresy - interaktywne wizualizacje
wyników, w tym:
-
Wykres główny - konfigurowalne podsumowanie wyników
-
Trendy w komentarzach - częstotliwość
najważniejszych tematów
-
Trend czasowy - zmiana sentymentu lub liczby
mocnych/słabych stron w czasie
-
Podsumowanie - automatycznie
wygenerowane podsumowanie całej analizy:
- Ogólne wnioski z analizy
- Lista najważniejszych mocnych stron
- Lista najważniejszych słabych stron
- Rekomendacje działań
-
Eksport - możliwość wyeksportowania
wyników w różnych formatach:
- Excel - dla dalszej analizy danych
-
CSV - dla kompatybilności z różnymi narzędziami
- PDF - dla raportów i prezentacji
- JSON - dla integracji z innymi systemami
Zapisywanie i wczytywanie
analizy:
Możesz zapisać kompletną analizę do pliku JSON i wczytać
ją później, co pozwala na kontynuowanie pracy lub
udostępnianie analizy innym osobom bez konieczności
ponownego wykonywania wszystkich kroków i generowania
kosztów API.
Wskazówka
Podczas eksportu do PDF, zaznacz opcje "Podsumowanie"
oraz "Wykresy", aby utworzyć kompaktowy raport z
najważniejszymi ustaleniami i wizualizacjami, idealny do
prezentacji wyników analizy.
Konfiguracja AI i schematu JSON
1. Prompt (System message)
Prompt to instrukcja dla modelu AI, która określa, jak ma
interpretować i analizować komentarze. Dobrze skonstruowany prompt
jest kluczowy dla uzyskania wysokiej jakości analizy.
Elementy skutecznego
promptu:
-
Rola - określenie perspektywy, z jakiej AI ma
analizować dane (np. "Jako analityk komentarzy klientów...")
-
Zadanie - jasne określenie, co AI ma zrobić
(np. "...przeanalizuj poniższe komentarze i zidentyfikuj
kluczowe problemy...")
-
Kontekst - dodatkowe informacje o danych (np.
"...komentarze pochodzą z ankiety satysfakcji klientów działu
obsługi...")
-
Format - informacja o wymaganym formacie
odpowiedzi (np. "...odpowiedz w formacie zgodnym z podanym
schematem...")
-
Wskazówki - szczegóły dotyczące tego, na co
zwrócić uwagę (np. "...zwróć szczególną uwagę na problemy
związane z czasem oczekiwania, jakością obsługi i
funkcjonalnością produktu...")
Przykładowy prompt:
Jako analityk komentarzy klientów, przeanalizuj poniższe opinie. Odpowiadaj po polsku.
Zidentyfikuj główne mocne i słabe strony, a także zaproponuj rekomendacje dla firmy.
Szczególną uwagę zwróć na kwestie związane z jakością obsługi, czasem realizacji
i funkcjonalnością produktów.
Odpowiedź podaj w formacie JSON zgodnym z dostarczonym schematem.
2. Schemat JSON
Schemat JSON definiuje strukturę wyników analizy. Pozwala to na
uzyskanie spójnych, ustrukturyzowanych odpowiedzi, które można
łatwo przetwarzać i prezentować.
Struktura schematu JSON:
-
type - typ głównego obiektu (zawsze "object")
-
properties - definicje poszczególnych pól w
wynikowym JSON
- required - lista wymaganych pól
Dla każdego pola można zdefiniować:
-
type - typ danych (string, number, array,
object, boolean)
-
description - opcjonalny opis pola, który
może pomóc modelowi AI
-
items - dla tablic, określa typ elementów
tablicy
-
properties - dla zagnieżdżonych obiektów, ich
struktura
-
enum - dla typu "string", lista dozwolonych
wartości
Podstawowy schemat JSON:
{
"type": "object",
"properties": {
"mocne_strony": {
"type": "array",
"description": "Lista kluczowych pozytywnych aspektów wymienionych w komentarzach.",
"items": { "type": "string" }
},
"slabe_strony": {
"type": "array",
"description": "Lista głównych problemów i negatywnych aspektów.",
"items": { "type": "string" }
},
"rekomendacje": {
"type": "array",
"description": "Konkretne sugestie działań lub usprawnień.",
"items": { "type": "string" }
}
},
"required": ["mocne_strony", "slabe_strony", "rekomendacje"]
}
Zaawansowany schemat JSON z sentymentem i kategoriami:
{
"type": "object",
"properties": {
"ogolne_podsumowanie": {
"type": "string",
"description": "Krótkie, 2-3 zdaniowe podsumowanie głównych wniosków z analizowanych komentarzy."
},
"sentyment_ogolny": {
"type": "string",
"description": "Ogólny wydźwięk komentarzy.",
"enum": ["Pozytywny", "Neutralny", "Negatywny", "Mieszany"]
},
"glowne_tematy": {
"type": "array",
"description": "Lista 3-5 głównych tematów poruszanych w komentarzach, wraz z ich sentymentem.",
"items": {
"type": "object",
"properties": {
"temat": { "type": "string" },
"sentyment_tematu": { "type": "string", "enum": ["Pozytywny", "Neutralny", "Negatywny"] },
"liczba_wzmianek_przyblizona": { "type": "number",
"description": "Szacunkowa liczba komentarzy dotyczących tego tematu."}
},
"required": ["temat", "sentyment_tematu"]
}
},
"cytaty_kluczowe": {
"type": "array",
"description": "2-3 reprezentatywne cytaty ilustrujące główne wnioski
(zachowaj oryginalną pisownię).",
"items": { "type": "string" }
},
"sugestie_dzialan": {
"type": "array",
"description": "Lista konkretnych, możliwych do wdrożenia sugestii działań.",
"items": { "type": "string" }
}
},
"required": ["ogolne_podsumowanie", "sentyment_ogolny", "glowne_tematy"]
}
Najlepsze praktyki
-
Testuj swój prompt i schemat JSON na małej próbce komentarzy
(np. 5-10) używając funkcji "Test promptu" w Rosetcie, aby
szybko iterować i optymalizować ustawienia.
-
Używaj gotowych szablonów jako punktu wyjścia, a następnie
dostosuj je do swoich specyficznych potrzeb i rodzaju danych.
-
Schemat JSON powinien precyzyjnie odzwierciedlać strukturę
informacji, których szukasz. Dodawanie `description` do pól w
schemacie może pomóc modelowi lepiej zrozumieć oczekiwania.
-
Jeśli wyniki nie są zadowalające, spróbuj przeformułować
prompt, dodać więcej przykładów (few-shot prompting, jeśli to
możliwe) lub uprościć/uszczegółowić schemat JSON.
Przykłady i przypadki użycia
Poniższe przykłady pokazują, jak skonfigurować Rosettę do
różnych zastosowań. Możesz użyć ich jako punktu wyjścia do
własnych analiz, dostosowując parametry do swoich konkretnych
potrzeb. Pamiętaj, aby dostosować nazwy kolumn do tych w Twoim
pliku.
Przykład 1: Analiza opinii klientów (Obsługa Klienta)
Scenariusz:
Analiza komentarzy klientów z ankiety satysfakcji po kontakcie z
działem obsługi klienta. Celem jest identyfikacja
mocnych/słabych stron obsługi i trendów w czasie.
Konfiguracja:
-
Typ analizy: Z gradacją (np. Miesięcznie)
- Kolumna daty: "DataKontaktu"
-
Kolumny komentarzy: "OpiniaPoKontakcie",
"DodatkoweUwagi"
-
Kolumny filtrów: "KanalKontaktu" (np.
telefon, email, czat), "TypSprawy"
Prompt:
Jesteś analitykiem specjalizującym się w opiniach klientów dotyczących obsługi.
Przeanalizuj poniższe komentarze. Odpowiadaj po polsku.
Twoim zadaniem jest zidentyfikowanie:
1. Głównych mocnych stron obsługi (np. szybkość, uprzejmość, kompetencje).
2. Głównych słabych stron obsługi
(np. długi czas oczekiwania, nierozwiązany problem, niekompetencja).
3. Kluczowych kategorii problemów/pochwał
(np. "Czas odpowiedzi", "Kompetencje konsultanta", "Jakość rozwiązania", "Proces obsługi").
4. Ogólnego sentymentu (Pozytywny, Neutralny, Negatywny, Mieszany).
5. Konkretnych rekomendacji usprawnień.
Zwróć szczególną uwagę na powtarzające się wzorce.
Odpowiedź podaj w formacie JSON zgodnym z dostarczonym schematem.
Schemat JSON:
{
"type": "object",
"properties": {
"sentyment_ogolny": { "type": "string", "enum":
["Pozytywny", "Neutralny", "Negatywny", "Mieszany"] },
"mocne_strony_obslugi": { "type": "array", "items": { "type": "string" } },
"slabe_strony_obslugi": { "type": "array", "items": { "type": "string" } },
"kategorie_tematyczne": {
"type": "array",
"items": {
"type": "object",
"properties": {
"kategoria": { "type": "string" },
"liczba_wzmianek": { "type": "number" },
"sentyment_kategorii": { "type": "string", "enum":
["Pozytywny", "Neutralny", "Negatywny"] }
},
"required": ["kategoria", "liczba_wzmianek", "sentyment_kategorii"]
}
},
"rekomendacje_dzialan": { "type": "array", "items": { "type": "string" } }
},
"required": ["sentyment_ogolny", "mocne_strony_obslugi",
"slabe_strony_obslugi", "kategorie_tematyczne", "rekomendacje_dzialan"]
}
Przykład 2: Analiza zgłoszeń błędów (Produkt Cyfrowy)
Scenariusz:
Analiza zgłoszeń błędów i problemów technicznych zgłaszanych
przez użytkowników aplikacji mobilnej. Celem jest kategoryzacja
błędów i identyfikacja najpilniejszych do naprawy.
Konfiguracja:
-
Typ analizy: Bez gradacji (każde zgłoszenie
osobno lub grupowane np. tygodniowo)
-
Kolumny komentarzy: "OpisProblemu",
"KrokiDoReprodukcji"
-
Kolumny dodatkowe: "WersjaAplikacji",
"SystemOperacyjny", "ModelUrzadzenia" (te dane zostaną
dołączone do promptu)
-
Kolumny filtrów: "PriorytetZgloszenia",
"StatusNaprawy", "ModulAplikacji"
Prompt:
Jako analityk QA, przeanalizuj poniższe zgłoszenie błędu w aplikacji.
Odpowiadaj po polsku.
Na podstawie opisu problemu, kroków reprodukcji oraz dodatkowych informacji
(wersja aplikacji, OS, urządzenie):
1. Zidentyfikuj główną kategorię błędu (np. UI/UX, Wydajność, Awaria, Funkcjonalność X).
2. Określ potencjalną przyczynę źródłową (jeśli możliwa do wywnioskowania).
3. Oceń powagę błędu (Krytyczny, Wysoki, Średni, Niski).
4. Zaproponuj kroki weryfikacji dla testera.
Odpowiedź podaj w formacie JSON.
Schemat JSON:
{
"type": "object",
"properties": {
"kategoria_bledu": { "type": "string", "description":
"Np. UI/UX, Wydajność, Awaria, Logika biznesowa, Funkcjonalność Płatności" },
"potencjalna_przyczyna": { "type": "string", "description": "Krótki opis możliwej przyczyny." },
"ocena_powagi": { "type": "string", "enum": ["Krytyczny", "Wysoki", "Średni", "Niski"] },
"sugerowane_kroki_weryfikacji": { "type": "array", "items": { "type": "string" } },
"dodatkowe_obserwacje": { "type": "string", "description": "Wszelkie inne istotne obserwacje."}
},
"required": ["kategoria_bledu", "ocena_powagi"]
}
Przykład 3: Analiza ankiet pracowniczych (HR)
Scenariusz:
Analiza odpowiedzi na pytania otwarte z corocznej ankiety
zaangażowania pracowników. Celem jest zrozumienie nastrojów,
identyfikacja obszarów do poprawy i mocnych stron organizacji.
Konfiguracja:
-
Typ analizy: Z gradacją (np. Rocznie, jeśli
porównujemy rok do roku) lub Bez gradacji (jeśli analizujemy
jedną ankietę)
-
Kolumny komentarzy: "CoCiSiePodobaWPracy",
"CoMozemyPoprawic", "DodatkoweSugestie"
-
Kolumny filtrów: "Dzial", "StazPracy",
"PoziomStanowiska"
Prompt:
Jesteś specjalistą HR analizującym wyniki ankiety pracowniczej.
Przeanalizuj poniższe komentarze. Odpowiadaj po polsku.
Twoim celem jest zrozumienie ogólnych nastrojów oraz zidentyfikowanie kluczowych tematów.
1. Podsumuj ogólny wydźwięk komentarzy
(Pozytywny, Raczej pozytywny, Neutralny, Raczej negatywny, Negatywny).
2. Wymień 3-5 głównych mocnych stron organizacji wymienianych przez pracowników.
3. Wymień 3-5 głównych obszarów do poprawy wskazywanych przez pracowników.
4. Zidentyfikuj 3-5 kluczowych tematów/kategorii poruszanych w komentarzach
(np. Rozwój, Wynagrodzenie, Atmosfera, Zarządzanie, Komunikacja).
5. Zaproponuj 2-3 ogólne rekomendacje dla działu HR.
Odpowiedź podaj w formacie JSON.
Schemat JSON:
{
"type": "object",
"properties": {
"ogolny_wydzwiek": { "type": "string", "enum": ["Pozytywny", "Raczej pozytywny",
"Neutralny", "Raczej negatywny", "Negatywny"] },
"mocne_strony_organizacji": { "type": "array", "items": { "type": "string" } },
"obszary_do_poprawy": { "type": "array", "items": { "type": "string" } },
"kluczowe_tematy_w_komentarzach": {
"type": "array",
"items": {
"type": "object",
"properties": {
"temat": { "type": "string" },
"czestotliwosc_wzmianek": { "type": "string", "enum":
["Wysoka", "Średnia", "Niska"] }
},
"required": ["temat", "czestotliwosc_wzmianek"]
}
},
"rekomendacje_dla_hr": { "type": "array", "items": { "type": "string" } }
},
"required": ["ogolny_wydzwiek", "mocne_strony_organizacji", "obszary_do_poprawy",
"kluczowe_tematy_w_komentarzach"]
}
Nie działa mi!
Problem: Błąd podczas wczytywania pliku CSV
Możliwe przyczyny i rozwiązania:
-
Nieprawidłowe kodowanie znaków:
Spróbuj zmienić kodowanie w ustawieniach importu. Dla
plików z polskimi znakami najczęściej używane są UTF-8,
Windows-1250, ISO-8859-2.
-
Nieprawidłowy separator kolumn:
Upewnij się, że wybrany separator (przecinek, średnik,
tabulator) odpowiada temu, który jest używany w pliku.
Otwórz plik w notatniku, aby sprawdzić.
-
Niespójna liczba kolumn w wierszach:
Plik CSV powinien mieć taką samą liczbę separatorów w
każdym wierszu. Sprawdź, czy znaki separatora nie
występują wewnątrz danych tekstowych bez odpowiedniego
cytowania.
-
Uszkodzony plik lub nietypowa struktura:
Otwórz plik w programie arkusza kalkulacyjnego (Excel,
Google Sheets), zapisz ponownie jako CSV i spróbuj
wczytać.
Problem: Błąd podczas wczytywania pliku Excel
Możliwe przyczyny i rozwiązania:
-
Nieobsługiwany format lub wersja:
Upewnij się, że używasz formatu XLSX lub XLS. Starsze
formaty lub pliki z makrami (XLSM) mogą sprawiać
problemy.
-
Skomplikowana struktura arkusza:
Scalone komórki, ukryte wiersze/kolumny, zaawansowane
formatowanie mogą utrudniać parsowanie. Spróbuj uprościć
arkusz lub wyeksportować dane do nowego, czystego pliku.
-
Pusty arkusz lub brak nagłówków:
Upewnij się, że wybrany arkusz zawiera dane i że
pierwszy wiersz to nagłówki kolumn.
Problem: Błąd autoryzacji API (401 Unauthorized)
Możliwe przyczyny i rozwiązania:
-
Nieprawidłowy klucz API:
Sprawdź, czy wprowadzony klucz API OpenAI jest poprawny
i aktywny. Skopiuj go ponownie ze swojego panelu OpenAI.
-
Brak środków na koncie OpenAI lub wyczerpany
limit:
Zaloguj się do panelu OpenAI i sprawdź stan swojego
konta oraz limity użycia.
Problem: Błąd limitu zapytań (429 Too Many Requests)
Możliwe przyczyny i rozwiązania:
-
Przekroczenie limitu zapytań na minutę (RPM) lub
tokenów na minutę (TPM):
Odczekaj chwilę i spróbuj ponownie. Jeśli problem się
powtarza, rozważ zmniejszenie liczby grup analizowanych
jednocześnie lub skontaktuj się z OpenAI w sprawie
zwiększenia limitów.
Problem: Nieprawidłowe odpowiedzi AI lub błędy parsowania
JSON
Możliwe przyczyny i rozwiązania:
-
Zbyt skomplikowany lub niejednoznaczny
prompt:
Uprość prompt, upewnij się, że jasno określa zadanie i
oczekiwany format.
-
Nieprawidłowy schemat JSON:
Sprawdź poprawność składni schematu JSON. Użyj
walidatora JSON online. Upewnij się, że typy danych i
struktura są zgodne z tym, co model ma wygenerować.
-
Zbyt duża ilość tekstu do analizy w jednym zapytaniu
(przekroczenie limitu tokenów kontekstu):
Rosetta stara się dzielić dane, ale jeśli pojedyncze
komentarze są bardzo długie, może to być problem. Rozważ
agregację lub skracanie bardzo długich tekstów.
-
Model "halucynuje" lub nie trzyma się
schematu:
Spróbuj obniżyć temperaturę (np. do 0.1-0.2). Wzmocnij
instrukcje w prompcie dotyczące trzymania się schematu.
Czasem pomaga dodanie `description` do pól w schemacie
JSON.
Wskazówka do
debugowania
Użyj funkcji "Test promptu" w zakładce AI na małej
próbce danych. Sprawdź surową odpowiedź modelu, aby
zobaczyć, czy generuje poprawny JSON i czy treść jest
zgodna z oczekiwaniami.
Problem: Brak danych po zastosowaniu filtrów lub w
podglądzie
Możliwe przyczyny i rozwiązania:
-
Zbyt restrykcyjne filtry:
Sprawdź, czy kombinacja wybranych filtrów nie eliminuje
wszystkich danych. Spróbuj usunąć niektóre filtry lub
rozszerzyć ich zakres.
-
Nieprawidłowy zakres dat lub format daty:
Upewnij się, że wybrany zakres dat zawiera dane i że
format dat w pliku jest poprawnie interpretowany przez
Rosettę.
-
Opcja "Pomiń puste komentarze" jest włączona:
Jeśli ta opcja jest aktywna, a wybrane kolumny
komentarzy są puste dla przefiltrowanych wierszy, nie
zostaną one uwzględnione.
Problem: Nieoczekiwane lub niskiej jakości wyniki analizy
Możliwe przyczyny i rozwiązania:
-
Niewłaściwe kolumny wybrane jako komentarze:
Upewnij się, że wybrałeś kolumny zawierające tekst do
analizy, a nie np. dane liczbowe czy kody.
-
Niewystarczająca ilość danych w grupach:
AI potrzebuje wystarczającej ilości kontekstu. Jeśli
grupy są zbyt małe (np. 1-2 krótkie komentarze), wyniki
mogą być ogólnikowe.
-
Nieodpowiedni prompt lub schemat JSON:
To najczęstsza przyczyna. Dostosuj prompt i schemat do
specyfiki danych i oczekiwanych informacji. Zobacz
sekcję "AI i JSON" oraz "Przykłady".
Problem: Analiza trwa bardzo długo lub zawiesza się
Możliwe przyczyny i rozwiązania:
-
Bardzo duży zbiór danych:
Rozważ podzielenie analizy na mniejsze części (np.
filtrując dane po kolei dla różnych segmentów).
-
Problemy z połączeniem internetowym:
Stabilne połączenie jest wymagane do komunikacji z API
OpenAI.
-
Ograniczenia przeglądarki lub zasobów
komputera:
Długotrwałe, intensywne operacje JavaScript mogą
obciążać przeglądarkę. Zamknij inne niepotrzebne
karty/aplikacje.
Problem: Błąd podczas eksportu do Excel/CSV
Możliwe przyczyny i rozwiązania:
-
Zbyt duża ilość danych do wyeksportowania:
Jeśli wyniki są bardzo obszerne, eksport może zająć dużo
czasu lub przekroczyć limity pamięci przeglądarki.
Spróbuj eksportować mniejsze części lub użyj formatu
JSON.
-
Nietypowe znaki w wynikach:
Chociaż biblioteki eksportujące starają się radzić sobie
ze specjalnymi znakami, czasem mogą wystąpić problemy.
Problem: Błędy podczas eksportu do PDF
Możliwe przyczyny i rozwiązania:
-
Duża ilość wykresów lub złożonych elementów:
Generowanie PDF z wieloma grafikami jest zasobożerne.
Spróbuj ograniczyć liczbę wykresów lub eksportować bez
nich.
-
Ograniczenia biblioteki generującej PDF
(html2pdf.js):
Niektóre złożone układy CSS lub elementy HTML mogą nie
być w pełni obsługiwane.
Alternatywa dla
eksportu PDF
Jeśli bezpośredni eksport do PDF zawodzi, możesz użyć
funkcji przeglądarki "Drukuj do PDF" (Ctrl+P lub Cmd+P,
następnie wybierz "Zapisz jako PDF"). Wynik może się
różnić, ale często jest to skuteczne obejście.
Potrzebujesz dalszej pomocy?
Jeśli napotkasz problem, którego nie możesz rozwiązać, przygotuj
następujące informacje, które pomogą w diagnozie:
-
Dokładny opis problemu i kroki prowadzące do jego wystąpienia.
- Nazwa i wersja używanej przeglądarki.
- Format i przybliżony rozmiar analizowanego pliku.
-
Zrzut ekranu błędu (jeśli występuje) oraz komunikaty z konsoli
deweloperskiej przeglądarki (F12).
-
Fragment dziennika operacji Rosetty, jeśli problem dotyczy
etapu analizy.
-
Za utrzymanie narzędzia odpowiada dział NewTech, deweloperem
jest Adam Rędzikowski.
Zaawansowane funkcje wykresów
Rozbudowane możliwości
wizualizacji
Moduł wykresów w Rosetta oferuje zaawansowane narzędzia do
tworzenia profesjonalnych wizualizacji danych. Umożliwia
dostosowanie wyglądu, kolorów i stylów wykresów, aby przedstawić
wyniki analizy w najbardziej czytelny i atrakcyjny sposób.
Główne funkcje modułu wykresów:
Etykiety danych
Bezpośrednie wyświetlanie wartości na wykresach dla
łatwiejszej interpretacji danych.
Unikalne kolory
Automatyczne przypisywanie różnych kolorów do każdego
wymiaru na osi X.
Palety kolorów
Gotowe zestawy harmonijnych kolorów dla profesjonalnych
wizualizacji.
Gradienty i wzory
Zaawansowane style wizualne dla bardziej atrakcyjnych
wykresów.
Opcje eksportu
Zapisywanie wykresów w wysokiej jakości w różnych formatach.
Kolekcja wykresów
Zapisywanie i zarządzanie biblioteką stworzonych wykresów.
Typy wykresów:
-
Słupkowy: Do porównania wartości
między
kategoriami.
-
Liniowy: Do pokazania trendów w
czasie.
-
Kołowy: Do przedstawienia
proporcji w
całości.
-
Pierścieniowy:
Podobny do kołowego, ale z pustym środkiem.
-
Radarowy: Do porównania wielu
zmiennych.
-
Polar Area:
Podobny do kołowego, ale z różnymi długościami promieni.
-
Punktowy: Do wizualizacji korelacji
między zmiennymi.
Rosetta umożliwia szczegółowe dostosowanie wyglądu
wykresów poprzez następujące opcje:
Zarządzanie kolorami:
-
Palety predefiniowane: Wybór spośród
różnych gotowych zestawów kolorów (domyślna, pastelowa,
żywa, ziemista, chłodna, ciepła).
-
Indywidualne kolory: Możliwość
ustawienia własnego koloru dla każdego elementu wykresu.
-
Style kolorowania: Wybór między
jednolitymi kolorami, gradientami lub wzorami.
-
Przezroczystość: Regulacja poziomu
przezroczystości kolorów dla lepszej czytelności
nakładających się elementów.
Etykiety i siatka:
-
Etykiety danych: Wyświetlanie wartości
bezpośrednio na wykresie z możliwością formatowania.
-
Siatka osi: Włączanie/wyłączanie linii
siatki dla osi X i Y.
-
Start od zera: Opcja wymuszenia
rozpoczynania osi Y od wartości zero.
-
Formaty liczbowe: Wyświetlanie wartości
jako liczby, procenty lub według własnego formatu.
Typy agregacji
danych:
-
Liczba (count): Zlicza wystąpienia
wartości w grupie.
-
Suma (sum): Sumuje wartości liczbowe.
-
Średnia (average): Oblicza średnią
arytmetyczną.
-
Liczba unikalnych (uniqueCount): Zlicza
unikalne wartości.
-
Maksimum (max): Znajduje największą
wartość.
-
Minimum (min): Znajduje najmniejszą
wartość.
Wskazówka
Aby stworzyć efektywną wizualnie prezentację danych,
wybieraj kolory, które kontrastują ze sobą, ale tworzą
harmonijną całość. Jeśli prezentujesz dane z podziałem
na kategorie pozytywne/negatywne, używaj konsekwentnie
kolorów (np. zielony dla pozytywnych, czerwony dla
negatywnych).
Kolekcja wykresów to funkcja pozwalająca na zapisywanie i
organizowanie stworzonych wizualizacji do późniejszego
wykorzystania:
Dodawanie wykresów
do kolekcji:
Po stworzeniu wykresu z pożądanymi ustawieniami, można
dodać go do kolekcji za pomocą przycisku "Dodaj wykres do
kolekcji". Zapisane zostaną:
- Typ wykresu i dane źródłowe
- Wybrane kolumny danych i osie
- Ustawienia kolorów i stylów
- Wszystkie opcje formatowania
Organizacja
kolekcji:
-
Kategorie: Wykresy są automatycznie
grupowane według typów (słupkowe, liniowe, kołowe,
inne).
-
Miniatury: Każdy wykres jest
przedstawiony jako miniatura ze szczegółowym opisem.
-
Podgląd szczegółowy: Kliknięcie
miniatury otwiera szczegółowy widok z pełnymi
informacjami o konfiguracji.
Ponowne wykorzystanie:
Zapisane wykresy można łatwo zastosować do aktualnego
widoku:
-
Zastosuj ustawienia: Przycisk
"Zastosuj" przenosi wszystkie ustawienia zapisanego
wykresu do bieżącego widoku.
-
Edycja: Po zastosowaniu ustawień można
je dalej modyfikować.
-
Eksport: Zapisane wykresy można
eksportować bezpośrednio z widoku kolekcji.
Wskazówka
Kolekcja wykresów jest szczególnie przydatna przy
tworzeniu raportów cyklicznych, gdzie te same typy
wizualizacji są wykorzystywane regularnie z nowymi
danymi. Zamiast za każdym razem konfigurować wykresy od
nowa, można zastosować zapisane szablony.
Rosetta oferuje zaawansowane opcje eksportu wykresów do
wykorzystania w prezentacjach, raportach czy publikacjach:
Formaty eksportu:
-
PNG: Uniwersalny format graficzny z
obsługą przezroczystości, idealny do większości
zastosowań.
-
JPEG: Format z kompresją, dobry gdy
zależy nam na mniejszym rozmiarze pliku kosztem jakości.
-
SVG: Format wektorowy, idealny do
publikacji i grafik wymagających skalowania bez utraty
jakości.
Opcje jakości i rozmiaru:
-
Jakość (dla JPEG): Wybór między
standardową (70%), wysoką (85%) i najwyższą (100%)
jakością.
-
Skalowanie: Możliwość eksportu w
różnych rozdzielczościach (standardowa 1x, wysoka 2x,
ultra HD 3x).
-
Znak wodny: Opcjonalne dodanie tekstu
"Wygenerowano przez Rosetta".
-
Datowanie: Możliwość dodania daty
wygenerowania wykresu.
Integracja z
raportami:
Wyeksportowane wykresy można:
-
Dołączyć do raportów PDF generowanych przez Rosettę
-
Wstawić do dokumentów Word, PowerPoint, czy Google Docs
-
Umieścić na stronach internetowych czy w systemach
wewnętrznych
-
Udostępnić zespołowi przez komunikatory lub e-mail
Wskazówka
Przy eksporcie wykresów do profesjonalnych raportów czy
publikacji, warto używać formatu SVG lub wysokiej
rozdzielczości PNG (skala 2x lub 3x). Zapewni to ostrość
obrazu nawet po wydrukowaniu lub wyświetleniu na
ekranach o wysokiej rozdzielczości.
Dobór
odpowiedniego typu wykresu:
-
Wykresy słupkowe są idealne do
porównywania wartości między różnymi kategoriami lub
grupami.
-
Wykresy liniowe najlepiej sprawdzają
się do przedstawiania trendów w czasie lub ciągłych
zmian.
-
Wykresy kołowe lub pierścieniowe są
użyteczne do pokazywania proporcji w całości, ale tylko
gdy mamy niewielką liczbę kategorii (najlepiej 3-7).
-
Wykresy radarowe sprawdzają się przy
porównywaniu obiektów względem wielu cech jednocześnie.
Efektywne użycie
kolorów:
-
Spójność: Używaj tych samych kolorów
dla tych samych kategorii w różnych wykresach w ramach
jednego raportu.
-
Kontrast: Upewnij się, że kolory
wystarczająco się od siebie różnią dla łatwego
rozróżnienia.
-
Znaczenie: Wykorzystuj konwencje
kolorystyczne (np. zielony dla pozytywnych wyników,
czerwony dla negatywnych).
-
Dostępność: Pamiętaj o osobach z
zaburzeniami widzenia barw - unikaj polegania wyłącznie
na kolorach do przekazywania informacji.
Projektowanie
czytelnych wykresów:
-
Prostota: Unikaj przeładowania wykresu
zbyt wieloma seriami danych czy elementami
dekoracyjnymi.
-
Etykiety: Używaj etykiet danych
strategicznie - pokazuj je dla najważniejszych punktów,
nie wszystkich.
-
Skala: Rozważ, czy oś Y powinna
zaczynać się od zera (zazwyczaj tak dla wykresów
słupkowych, niekoniecznie dla liniowych).
-
Legendy: Umieszczaj legendy w miejscu,
które nie zakłóca odczytu głównych danych.
Prezentacja wyników:
-
Kontekst: Zawsze staraj się dostarczyć
odpowiedni kontekst dla prezentowanych danych.
-
Kombinacje: Używaj różnych typów
wykresów w raporcie, aby pokazać dane z różnych
perspektyw.
-
Uporządkowanie: Sortuj dane w sposób
logiczny (np. według wielkości dla wykresów słupkowych,
chronologicznie dla liniowych).
-
Proporcje: Zachowaj odpowiednie
proporcje wykresu, aby uniknąć zniekształcenia percepcji
danych.
Wskazówka
Przy tworzeniu wykresów, kieruj się zasadą "less is
more" - mniej znaczy więcej. Każdy element wykresu
powinien mieć swój cel i dostarczać wartościowych
informacji. Usuń wszelkie elementy, które nie
przyczyniają się do zrozumienia danych.
Często zadawane pytania
Rosetta obsługuje następujące formaty plików:
-
CSV (Comma-Separated Values):
-
Separatory: przecinek (,), średnik (;), tabulator
(⇥), pionowa kreska (|).
-
Kodowania: UTF-8, ISO-8859-2, Windows-1250, CP852 i
inne popularne.
-
Excel:
- Formaty: XLSX (zalecany), XLS.
- Obsługa wielu arkuszy w jednym pliku.
Aby uzyskać najlepsze wyniki, upewnij się, że Twój plik ma
strukturę tabelaryczną z nagłówkami kolumn w pierwszym
wierszu.
Liczba komentarzy zależy od kilku czynników, głównie od
limitów tokenów modeli AI i wybranego trybu analizy:
-
Limity tokenów modeli AI: Każdy model
ma maksymalną liczbę tokenów (fragmentów słów), które
może przetworzyć w jednym zapytaniu (prompt +
odpowiedź). Np. GPT-4o może obsłużyć do 128k tokenów w
kontekście, a GPT-4o Mini również sporo. Rosetta dzieli
dane na partie, aby zmieścić się w tych limitach.
-
Długość komentarzy: Im dłuższe
komentarze, tym mniej zmieści się ich w jednej partii
wysyłanej do AI.
-
Tryb analizy:
-
Z gradacją: Dane są grupowane (np.
dziennie, tygodniowo). Każda grupa jest analizowana
osobno. Optymalna wielkość grupy to 20-200
komentarzy.
-
Bez gradacji: Każdy wiersz
(komentarz) jest analizowany indywidualnie, co jest
dobre dla szczegółowej analizy, ale może być
wolniejsze i droższe dla dużych zbiorów.
W praktyce Rosetta może przetwarzać pliki z tysiącami, a
nawet dziesiątkami tysięcy wierszy. Kluczowe jest
odpowiednie grupowanie i świadomość kosztów API.
Rosetta priorytetowo traktuje bezpieczeństwo Twoich
danych:
-
Przetwarzanie lokalne w przeglądarce:
Większość operacji (wczytywanie pliku, filtrowanie,
przygotowanie danych) odbywa się lokalnie w Twojej
przeglądarce. Dane nie są wysyłane na serwery Rosetty.
-
Komunikacja z API OpenAI: Jedynie
teksty przeznaczone do analizy (komentarze wraz z
promptem) są wysyłane do API OpenAI. OpenAI ma własną
politykę prywatności
i
politykę użycia danych API. Domyślnie dane wysyłane przez API nie
są używane do
trenowania modeli OpenAI.
-
Brak trwałego przechowywania przez Rosettę:
Rosetta nie przechowuje Twoich danych wsadowych ani
wyników analizy na żadnych serwerach po zakończeniu
sesji. Zapisane analizy są przechowywane lokalnie na
Twoim komputerze jako pliki.
-
Twój klucz API: Używasz własnego klucza
API OpenAI, co daje Ci pełną kontrolę nad dostępem i
rozliczeniami.
Zalecenia: Jeśli pracujesz z danymi
szczególnie wrażliwymi, rozważ ich anonimizację przed
wczytaniem do Rosetty. Zawsze korzystaj z bezpiecznego
połączenia (HTTPS).
Interpretacja wyników zależy od Twojego promptu i schematu
JSON. Oto ogólne wskazówki:
-
Zrozum swój schemat: Dokładnie
przeanalizuj, jakie pola zdefiniowałeś w schemacie JSON
i czego od nich oczekujesz.
-
Szukaj wzorców i trendów: Zamiast
skupiać się na pojedynczych wynikach, szukaj
powtarzających się tematów, sentymentów czy rekomendacji
w różnych grupach danych lub okresach.
-
Porównuj segmenty: Jeśli używasz
filtrów, porównuj wyniki między różnymi segmentami (np.
różne produkty, działy, kanały kontaktu).
-
Weryfikuj z oryginalnymi danymi:
Wyrywkowo sprawdzaj, czy analiza AI dla danej grupy
komentarzy jest zgodna z Twoim odczytaniem oryginalnych
tekstów.
-
Pamiętaj o ograniczeniach AI: Modele
językowe mogą czasem "halucynować" (generować
nieprawdziwe informacje) lub źle interpretować
sarkazm/ironię. Wyniki należy traktować jako cenne
wskazówki i punkt wyjścia do dalszej analizy, a nie
ostateczną prawdę.
-
Iteruj: Jeśli wyniki nie są
satysfakcjonujące, dostosuj prompt, schemat JSON lub
parametry modelu i przeprowadź analizę ponownie na
próbce danych.
Wskazówka
Wyniki z AI są najcenniejsze, gdy są używane do
odkrywania "ukrytych" tematów, szybkiego przeglądu
dużych ilości tekstu i generowania hipotez, które można
następnie zweryfikować bardziej tradycyjnymi metodami.
Samo narzędzie Rosetta (jako aplikacja webowa działająca w
przeglądarce) jest darmowe. Koszty związane są wyłącznie z
wykorzystaniem API OpenAI:
-
Opłaty za API OpenAI: Naliczane są za
liczbę tokenów przetworzonych przez modele AI (zarówno
tokeny wejściowe - Twój prompt i komentarze, jak i
tokeny wyjściowe - odpowiedź modelu). Ceny różnią się w
zależności od wybranego modelu (np. GPT-4o jest droższy
od GPT-4o Mini). Aktualny cennik znajdziesz na
stronie OpenAI.
Jak optymalizować koszty?
-
Wybieraj odpowiedni model: Do wielu
zadań wystarczy tańszy model (np. GPT-4o Mini). Używaj
najmocniejszych modeli (np. GPT-4o) tam, gdzie jakość
jest absolutnie krytyczna.
-
Testuj na małych próbkach: Zanim
uruchomisz analizę na pełnym zbiorze danych, przetestuj
ustawienia na małej próbce.
-
Optymalizuj prompty i schematy:
Krótsze, bardziej precyzyjne prompty i zwięzłe schematy
JSON mogą zmniejszyć liczbę tokenów.
-
Monitoruj zużycie: Rosetta pokazuje
szacunkowe zużycie tokenów. Możesz też śledzić koszty w
panelu OpenAI.
-
Grupuj dane mądrze: Unikaj tworzenia
nadmiernie wielu małych grup, jeśli nie jest to
konieczne, ale też nie twórz zbyt dużych, które
przekroczą limity kontekstu.
-
Zapisuj analizy: Zapisane analizy można
wczytać ponownie bez ponoszenia kosztów API.
Dobre przygotowanie danych to klucz do sukcesu:
Struktura pliku:
-
Format tabelaryczny: Dane w wierszach i
kolumnach, z nagłówkami w pierwszym wierszu.
-
Czytelne nazwy kolumn: Używaj prostych,
zrozumiałych nazw bez spacji i znaków specjalnych (np.
"OpiniaKlienta" zamiast "Opinia klienta po kontakcie!").
-
Spójny format dat: Najlepiej YYYY-MM-DD
lub inny standardowy, łatwo rozpoznawalny format.
Czyszczenie danych (zalecane):
-
Usuń duplikaty: Jeśli wiersze są
identyczne.
-
Usuń "szum": Zbędne znaki, automatyczne
podpisy e-mail, powtarzające się frazy bez znaczenia.
-
Normalizuj dane kategoryczne: Ujednolić
pisownię (np. "Warszawa", "warszawa", "W-wa" na jedną
formę).
-
Sprawdź puste wartości: Zdecyduj, jak
traktować puste komórki w kolumnach komentarzy (Rosetta
ma opcję ich pomijania).
Organizacja komentarzy:
-
Wybierz właściwe kolumny: Upewnij się,
że kolumny wybrane do analizy faktycznie zawierają
tekstowe komentarze.
-
Dodaj kontekst: Jeśli masz dodatkowe
informacje (np. kategoria produktu, typ klienta), które
mogą być istotne dla analizy, rozważ dołączenie ich jako
"kolumny dodatkowe" – ich zawartość zostanie dodana do
promptu.
Wskazówka
Im czystsze i lepiej przygotowane dane, tym lepsze i
bardziej wiarygodne wyniki analizy uzyskasz od AI.
Poświęcenie czasu na ten etap często się opłaca.
Witamy w Rosetta! Oto kilka kroków, aby dobrze zacząć:
-
Przygotuj mały plik testowy: Zacznij od
niewielkiego pliku CSV lub Excel (np. 20-50 wierszy) z
komentarzami, które chcesz przeanalizować. Upewnij się,
że plik ma czytelne nagłówki kolumn.
-
Zapoznaj się z interfejsem: Przejdź
przez poszczególne kroki wczytywania pliku i wyboru
kolumn. Zwróć uwagę na automatyczne sugestie Rosetty.
-
Użyj gotowego szablonu AI: W zakładce
"AI i JSON" wybierz jeden z gotowych szablonów promptu i
schematu JSON. Na początek nie musisz tworzyć własnych
od zera. Możesz też skorzystać z przykładów w zakładce
"Przykłady".
-
Przetestuj na małej próbce: Uruchom
analizę na swoim małym pliku. Zwróċ uwagę na czas
przetwarzania i koszty (jeśli używasz własnego klucza
API).
-
Przejrzyj wyniki: Zapoznaj się z tabelą
wyników, wykresami i podsumowaniem. Zastanów się, czy
uzyskane informacje są dla Ciebie wartościowe.
-
Eksperymentuj: Spróbuj zmodyfikować
prompt, zmienić parametry modelu AI (np. temperaturę)
lub dostosować schemat JSON, aby zobaczyć, jak wpływa to
na wyniki.
-
Przeczytaj tę instrukcję: Szczególnie
sekcje "Kroki analizy", "AI i JSON" oraz "Przykłady"
dostarczą Ci wielu cennych wskazówek.
Pamiętaj, że kluczem jest praktyka. Im więcej będziesz
eksperymentować z różnymi danymi i ustawieniami, tym
lepiej zrozumiesz możliwości Rosetty. Nie bój się testować
i popełniać błędów – to najlepszy sposób na naukę!