Histogram je velmi často žádaným pohledem na data. Jeho principem je zobrazení četnosti výskytu dat ve skupinách, tzv. binech. Vstupní data jsou rozdělena do intervalů (binů) a histogram zobrazí četnost výskytu v rámci intervalu. Microsoft Excel nabízí jednoduché řešení – graf v podobě histogramu. podobným typem grafu je pareto.
Mnohem ilustrativnější bude následující jednoduchý příklad, na němž uvidíte princip histogramu i grafu pareto v praxi. Histogram patří mezi veličiny statistiky.
Histogram výšky lidí
Coby vstupní data mějme naměřenou výšku 30 lidí. Cílem histogramu je zjistit četnosti výšky v intervalech. Prvek vložíte standardním způsobem jako jakýkoli graf.
Máme tedy 30 hodnot výšky a jako graf zvolíme Histogram. Ihned se zobrazí náhled a histogram se automaticky rozdělil na 4 intervaly (biny).
Excel rozdělí data na automatický počet intervalů dle variačního rozpětí do stejných skupin. U každého z intervalů vidíme četnost, tedy kolik hodnot je v rámci daného intervalu.
Vlastní počet intervalů v histogramu
Výchozí rozložení intervalů nemusí vždy vyhovovat a budete chtít zadat vlastní počet intervalů. K tomu je potřeba v grafu nastavit formát osy. Zde je možno nastavit intervaly podle různých kritérií a pro naše účely nastavíme počet intervalů (přihrádek) na 10. Ihned se přeformátuje celý graf.
Intervaly jsou nyní přesnější a je vidět, že do intervalu 162,3 až 165,6 nespadá žádná výška, tzn. pro celé cm žádný člověk nemá výšku 163, 164 nebo 165 cm, což je vidět ve zdrojových datech.
Graf pareto
Podobným grafem k histogramu je pareto. Zatímco intervaly u histogramu nejsou řazeny, pareto seřazuje intervaly od nejvyššího počtu četností k nejmenšímu. Navíc se zobrazuje tzv. kumulativní čára vyjadřující procento z celkového zastoupení z celku. Ponecháme nastavení na 10 intervalů a změníme pomocí Změnit typ grafu graf na pareto a výsledek je následující:
Hned je vidět, že největší četnost, tedy 5, je výška mezi 178,8 a 182,1 cm. Pareto tak dává přehled o četnostech dle zastoupení na první pohled. Velmi praktický příklad je užití pareto grafu v logistice, jako jeden z mnoha oborů.
Histogram i pareto jsou užitečné grafy, pokud nás zajímají četnosti údajů v intervalech. Podávají tak přehledně informaci, v jakých intervalech je nejčastější výskyt hodnot, apod. Je možné nastavit počet intervalů dle různých kritérií.