Gör en snabb koll av din data med diagram i Excel
I dataanalysens värld är termen ‘sanity check’ lika avgörande som den är ständigt aktuell. Termen hänvisar till en uppsättning preliminära procedurer som utförs på data för att säkerställa dess giltighet och användbarhet innan den genomgår mer detaljerad analys. Ett innovativt tillvägagångssätt för att utföra sanity checks innefattar användningen av “engångsdiagram”—en snabb, effektiv och populär metod inom dataanalys.
Använd diagram i ett tidigt stadie av din dataanalys
Engångsdiagram (översatt från engelskans disposable chart) är enkla, ofta grundläggande visuella representationer av data, skapade i syfte att endast utföra en sanity check. Till skillnad från detaljerade diagram och grafer avsedda för presentationer eller publikationer, är engångsdiagram avsedda att snabbt skapas, användas och sedan kasseras. De är verktyg för analytikern, inte publiken. Skönheten i dessa diagram ligger i deras enkelhet och hastigheten med vilken de kan genereras och tolkas. Dessa kan man fördel skapas mycket snabbt i Excel. Antingen med några få klick eller genom att markera data och använda snabbkommandot ‘Alt’ + ‘F1’.
Varför ska man använda diagram i ett tidigt skede?
- Upptäck fel och anomalier: engångsdiagram möjliggör en snabb visuell bedömning av data. Genom att plotta data i dess råaste form kan analytiker omedelbart upptäcka avvikelser, luckor eller mönster som tyder på fel. Detta kan variera från att upptäcka saknade värden till att identifiera outliers.
- Effektivitet och flexibilitet: att skapa detaljerade och polerade diagram kan vara tidskrävande. För sanity checks, där målet är att snabbt validera data, gör enkelheten i engångsdiagram dem till ett mycket effektivare val. Engångsdiagram kan skapas med hjälp av en mängd olika verktyg; R, Python eller Excel för att nämna några. Enkelheten i att skapa dessa diagram möjliggör flexibilitet i de verktyg och tekniker som används.
- Iterativ analys: diagrammen kan användas iterativt. När data rengörs och raffineras kan nya diagram snabbt genereras för att bedöma effekten av dessa ändringar, vilket säkerställer kontinuerlig kvalitetskontroll under hela datapreparationsprocessen.
Bästa praxis för användning av engångsdiagram
- Håll det enkelt: målet är att snabbt kontrollera data, inte att skapa ett mästerverk. Använd grundläggande diagramtyper och undvik onödiga utsmyckningar.
- Fokusera på målet: varje diagram bör skapas med en specifik sanity check i åtanke, vare sig det är att kontrollera avvikelser, förstå distribution eller bedöma trender.
- Dokumentera resultat: även om diagrammen i sig är skapade för att sedan förkastas, bör insikterna som erhållits från dem dokumenteras för framtida referens under datarengörings- och analysprocessen.
- Iterativt tillvägagångssätt: använd engångsdiagram iterativt genom hela datapreparationsprocessen för att kontinuerligt validera datan.
Ett simpelt exempel på ett scenario
I det här exemplet används ett dataunderlag från kursen Ekonomisk analys i Excel, och finns att ladda ned här. Vilka insikter får man då man väljer att visualisera beloppskolumnen, tkr, med ett enkelt stapeldiagram.
Vad kan man snabbt utröna från detta simpla stapeldiagram? Det går bl a se att det totalt verkar röra sig om ca 300 observationer. Det även att se att de flesta belopp är under 5 000 tkr, och att en observation utmärker sig runt 20 000 tkr (20 miljoner kr). För att inspektera individuella värden kan man helt enkelt hovra med muspekaren över respektive stapel.
Vad går mer att utröna? Säg att datamaterialet skulle innehålla ett simpelt bearbetningsfel genom att en nolla har slagits in för mycket.
Med ett simpelt stapeldiagram blir det då mycket tydligt att detta värde behöver undersökas vidare. Vad som kan tyckas försvåra vidare undersökning av värdet är att x-axeln saknar etiketter. Detta är inte fallet då man får ett ungefärligt index från x-axeln och ett exakt genom att hovra med muspekaren över stapeln.
Slutsats
Sammanfattningsvis är engångsdiagram ett kraftfullt verktyg i alla dataanalytikers arsenal. De är inte vackra men de erbjuder ett snabbt, enkelt och effektivt sätt att utföra sanity checks utan nästan någon ansträngning. Sanity checks säkerställer att datamaterialet som används i analysen är av hög kvalitet och tillförlitlig. I takt med att data blir alltmer central för beslutsfattande över olika branscher, kan vikten av effektiva sanity checks inte överskattas, och engångsdiagram spelar en avgörande roll i denna process.