GROUP BY klauzuli používáme v SQL k seskupování záznamů. Ve většině případů jde o situaci, kdy potřebujeme udělat nějakou agregační operaci v tabulce (součet tržeb, počet záznamů, průměr, apod).
Pořadí klauzule v SQL skriptu
- SELECT
- FROM
- WHERE
- GROUP BY
- HAVING
- ORDER BY
Syntaxe klauzule GROUP BY:
SELECT [Sloupec1], [Sloupec2], AgregacniFunkce([Sloupec3]) AS Alias
FROM Tabulka
WHERE Podminka
GROUP BY Sloupec1, Sloupec2
Pokud použijeme agragační funkci, tak většinou tuto klauzuli použijeme. Výjimkou jsou situace, kdy do agregační funkce ještě zahrneme operátor OVER( PARTITION BY| ORDER BY|ROW|RANGE), ten řadíme mezi pokročilejší znalosti a proto s ním zatím nemusíme ztrácet čas. Pro začátečníky budiž pravidlem, že je klauzule je povinná, pokud v SELECT existuje nějaká agregační funkce.
Příklad použití GROUP BY
Tabulka [FactInternetSales] má spoustu polí jak je vidět z obrázku, ale my budeme pracovat pouze se 2-ma poli:
- Datum [OrderDate]
- Částka [SalesAmount]
Budeme chtít agregovat částku podle datumů a výsledek poté seřadit sestupně. Použijeme k tomu:
- agregační funkci SUM() v klauzuli SELECT
- GROUP BY
- ORDER BY
SELECT [OrderDate] AS Datum
,SUM([SalesAmount]) AS Soucet
FROM [AdventureWorksDW2012].[dbo].[FactInternetSales]
GROUP BY [OrderDate]
ORDER BY [OrderDate] DESC
a výsledek:
Kdybychom klauzuli vynechali, tak by výsledkem byla chyba
“Column ‘AdventureWorksDW2012.dbo.FactInternetSales.OrderDate’ is invalid in the select list because it is not contained in either an aggregate function or the GROUP BY clause.”
Chybová hláška nás upozorňuje, že není sloupec OrderDate obsažen v klauzuli
Kompletní dokumentaci ke klauzuli můžeme najít v dokumentaci Microsoftu
Děkuji za to, že někdo si dal tu práci a sepsal to a já to tím pádem mohl pochopit.