OpenAI
Tato stránka byla přeložena strojově. Zobrazit původní článek v angličtině.

Získávání poznatků pomocí analýzy dat v ChatGPT

Osobní AI analytik pro firemní uživatele a zkušené datové profesionály

Aktualizováno: 6 hours ago

Práce s tabulkami v ChatGPT

Když nahrajete soubor, ChatGPT automaticky vytvoří interaktivní zobrazení tabulky, které vám umožní procházet data a zobrazit všechny řádky a sloupce.

Data analysis table of San Francisco film locations with titles, release years, and locations

Jakmile je soubor nahrán, můžete pokládat doplňující otázky týkající se datové sady. Prompty nemusí určovat konkrétní operace – přirozené jazykové příkazy jako „analyzuj“ nebo „porovnej“ stačí k vytvoření výsledků z ChatGPT.

ChatGPT data analysis table comparing weekday and weekend revenue, with weekday sales higher than weekend

Tabulky můžete v ChatGPT také vytvářet přímo tím, že požádáte, aby byl výstup vygenerován jako tabulka.

Image

Chcete-li si data prohlédnout lépe, můžete tabulku rozbalit kliknutím na dvě šipky v pravém horním rohu tabulky:

ChatGPT data analysis table expand button with tooltip “Expand table”

V zobrazení tabulky můžete vybrat konkrétní řádek nebo sloupec a vytvořit prompt, abyste získali poznatky o zvýrazněných datech. Například zde jsme vybrali sloupec a zeptali se na položku, která se objevuje nejčastěji.

ChatGPT Data Analysis table with the Title column selected and a prompt asking which title appears most often

Více řádků nebo sloupců lze vybrat stisknutím a podržením klávesy Command na Macu nebo Ctrl ve Windows a kliknutím na řádky nebo sloupce. Více buněk lze také vybrat kliknutím na jednu buňku a tažením myši přes požadovanou oblast.

ChatGPT answers the average of three selected spreadsheet cells as 79

Po výběru více položek můžete ChatGPT požádat, aby vypočítal hodnotu nebo provedl akci s hodnotami vybraných položek. Můžete například zvýraznit sadu buněk a požádat ChatGPT o výpočet průměrné hodnoty.

Úprava a vytváření tabulek pomocí ChatGPT

Můžete nahrát a upravovat své stávající tabulky tím, že ChatGPT zadáte, aby provedl aktualizace. Můžete ho například požádat, aby tabulku aktualizoval o sloupec obsahující průměrné hodnoty.

ChatGPT Data Analysis table updated with a new Average column for each row

ChatGPT můžete zadat konkrétní změny zvýrazněním sloupců, řádků nebo buněk, na kterých mají být aktualizace založeny. Zde jsme zvýraznili dva sloupce a požádali o nový sloupec v tabulce, který obsahuje jejich součty.

Data table with a new Friday + Saturday column summing the Friday and Saturday values

Tabulku vygenerovanou ChatGPT si můžete stáhnout kliknutím na tlačítko pro stažení v pravém horním rohu tabulky. Upozorňujeme, že stažený soubor bude ve formátu CSV.

Download table button in ChatGPT Data Analysis

Vizualizace dat pomocí ChatGPT

Po nahrání souboru můžete ChatGPT zadat, aby vytvořil statický graf. Můžete nechat ChatGPT určit ideální typ grafu pro datovou sadu, nebo v promptu uvést jeden z našich podporovaných typů grafů: spojnicový graf, sloupcový graf, koláčový graf, histogramy, bodový graf, krabicové grafy (Box-and-Whisker Plots), teplotní mapy, plošné grafy, radarové grafy, stromové mapy, bublinové grafy a vodopádové grafy.

Upozorňujeme, že v současnosti jsou ve většině případů interaktivní pouze sloupcové, koláčové, bodové a spojnicové grafy.

Revenue by day of week line chart with Friday as the low point at 53

Pokud není určen žádný typ grafu, ChatGPT určí ideální typ grafu pro výstup.

ChatGPT data analysis chart comparing total revenue for weekdays versus weekends

V pravém horním rohu grafu můžete graf stáhnout nebo zvětšit jeho velikost. Ve výchozím nastavení jsou stažené grafy ve formátu PNG.

Můžete také upravit barvy grafu nebo zapnout či vypnout jeho interaktivitu. Při změně barev si můžete vybrat jednu z našich výchozích barev nebo zadat hex kód barvy.

Color settings panel with Dataset color set to blue and Interactive toggled on

Běžné typy analýz

ChatGPT je natrénován k provádění různých úloh datové analýzy. Mezi běžné úlohy patří:

Detekce a náprava anomálií

Při rozhodování na základě dat je důležité zajistit, aby zdrojová data byla co nejpřesnější. ChatGPT umí identifikovat data, která mohou chybět nebo být nesprávná. Mezi běžné problémy, které ChatGPT dokáže identifikovat a opravit, patří:

  • Chybějící hodnoty

  • Odlehlé hodnoty

  • Duplicitní řádky

  • Nesprávné datové typy

Začněte analýzu promptem, jako je tento: Zkontroluj tato data na běžné problémy.

Jakmile ChatGPT identifikuje běžné problémy, můžete ho požádat, aby je opravil. V závislosti na zjištěných problémech vám ChatGPT může nabídnout několik možností, z nichž si vyberete. Pokud si nejste jisti důsledky těchto voleb, zkuste ChatGPT požádat o další informace.

Agregace a integrace

ChatGPT dokáže agregovat velké množství strukturovaných dat, aby vám pomohl porozumět informacím. Mezi agregace, které ChatGPT dokáže provádět, patří:

  • Součty

  • Průměry (medián, aritmetický průměr, modus)

  • Minimální a maximální hodnoty

  • Počty jedinečných hodnot

  • Směrodatná odchylka

Můžete rozbalit tabulku a vybrat jeden nebo více číselných sloupců a pak použít prompt, jako je tento: Vypočítej pro tato data medián a směrodatnou odchylku.

ChatGPT také dokáže sloučit více datových sad dohromady na základě sdílených identifikátorů.

Řekněme, že nahrajete dvě tabulky, jednu obsahující customers a druhou obsahující purchases. Záznamy purchase jsou spojeny se záznamy customer prostřednictvím vlastnosti customer_id . ChatGPT ví, jak oba soubory integrovat do jedné datové sady, aby mohl odpovědět na otázky jako „Jaká je celková hodnota všech nákupů provedených zákazníky se zlatým tarifem?

ChatGPT za vás automaticky sloučí datové sady, když položíte otázku, kde je to potřeba.

Pokročilá statistická analýza

ChatGPT rozumí tomu, jak provádět širokou škálu statistických analýz, a dokáže vybrat vhodné techniky podle vašich požadavků. Mezi typy analýz, které ChatGPT dokáže provádět, patří:

  • Srovnávací statistika: Zahrnuje porovnávání různých skupin nebo proměnných za účelem pochopení jejich rozdílů nebo podobností. Mezi techniky patří t-testy, ANOVA (Analysis of Variance) a MANOVA (Multivariate Analysis of Variance).

  • Korelační a regresní analýza: Tyto metody hodnotí vztah mezi proměnnými. Korelační analýza měří sílu a směr vztahu, zatímco regresní analýza modeluje vztah za účelem predikce výsledků.

  • Analýza časových řad: Tento typ analýzy zkoumá datové body shromážděné v čase za účelem identifikace trendů, cyklů a sezónních vlivů. Mezi metody patří ARIMA (Autoregressive Integrated Moving Average) a sezónní dekompozice.

Abyste tyto techniky používali, nemusíte být datový vědec! Pokud si nejste jisti, která technika je pro vaše data nejvhodnější, zkuste ChatGPT říct, čemu chcete porozumět, a požádejte ho, aby doporučil nejlepší analytickou techniku. Pokud si nejste jisti, jak interpretovat výstup analýzy, požádejte ChatGPT, aby vám to vysvětlil. Účinný prompt může být: Je na této analýze něco pozoruhodného nebo neobvyklého?

Byl tento článek užitečný?