記入日:2023-01-10 編集日:2023-01-10
SQL見るだけクエリ。今回は通販サイトなどで良くある、売上データを購入者毎にグループ化し、購入商品毎の販売数をクロス集計するSQLを記述してみようと思います。
以下のsql_orderテーブルには、販売商品毎のレコードが入っております。Shopifyの受注データもこの様な形式ですね。
以下のような、売上テーブルを用意しました。
テーブル名:sql_order
id | order_id | name | item_id | price | quantity | size | datetime | status |
---|---|---|---|---|---|---|---|---|
1 | 1 | 伊藤 明日香 | sku-0001 | 3000 | 1 | S | 2022-12-16 07:00:00 | 1 |
2 | 1 | 伊藤 明日香 | sku-0002 | 2500 | 3 | S | 2022-12-16 07:00:00 | 1 |
3 | 1 | 伊藤 明日香 | sku-0003 | 9000 | 1 | S | 2022-12-16 07:00:00 | 1 |
4 | 2 | 原田 和美 | sku-0001 | 3000 | 1 | L | 2022-12-16 10:00:00 | 1 |
5 | 2 | 原田 和美 | sku-0002 | 2500 | 1 | L | 2022-12-16 10:00:00 | 1 |
6 | 2 | 原田 和美 | sku-0003 | 9000 | 2 | L | 2022-12-16 10:00:00 | 1 |
7 | 3 | 高橋 由美子 | sku-0001 | 3000 | 1 | M | 2022-12-16 18:00:00 | 1 |
8 | 3 | 高橋 由美子 | sku-0002 | 2500 | 5 | S | 2022-12-16 18:00:00 | 1 |
9 | 3 | 高橋 由美子 | sku-0003 | 9000 | 1 | M | 2022-12-16 18:00:00 | 1 |
10 | 4 | 田中 明日香 | sku-0001 | 3000 | 1 | S | 2022-12-16 22:00:00 | 1 |
11 | 4 | 田中 明日香 | sku-0002 | 2500 | 1 | S | 2022-12-16 22:00:00 | 1 |
12 | 4 | 田中 明日香 | sku-0003 | 9000 | 2 | S | 2022-12-16 22:00:00 | 1 |
13 | 5 | 小林 美佐子 | sku-0001 | 3000 | 1 | L | 2022-12-17 10:00:00 | 1 |
14 | 5 | 小林 美佐子 | sku-0002 | 2500 | 1 | L | 2022-12-17 10:00:00 | 1 |
15 | 5 | 小林 美佐子 | sku-0003 | 9000 | 2 | L | 2022-12-17 10:00:00 | 1 |
16 | 6 | 渡辺 雄一 | sku-0001 | 3000 | 1 | S | 2022-12-18 08:00:00 | 1 |
17 | 6 | 渡辺 雄一 | sku-0002 | 2500 | 1 | S | 2022-12-18 08:00:00 | 1 |
18 | 6 | 渡辺 雄一 | sku-0003 | 9000 | 1 | S | 2022-12-18 08:00:00 | 1 |
19 | 7 | 佐藤 智子 | sku-0001 | 3000 | 12 | M | 2022-12-18 15:00:00 | 1 |
20 | 7 | 佐藤 智子 | sku-0002 | 2500 | 1 | S | 2022-12-18 15:00:00 | 1 |
21 | 7 | 佐藤 智子 | sku-0003 | 9000 | 1 | M | 2022-12-18 15:00:00 | 1 |
22 | 8 | 坂本 純子 | sku-0001 | 3000 | 1 | S | 2022-12-19 20:00:00 | 1 |
23 | 8 | 坂本 純子 | sku-0002 | 2500 | 1 | S | 2022-12-19 20:00:00 | 1 |
24 | 8 | 坂本 純子 | sku-0003 | 9000 | 3 | S | 2022-12-19 20:00:00 | 1 |
25 | 9 | 加藤 和子 | sku-0001 | 3000 | 1 | L | 2022-12-20 10:00:00 | 1 |
26 | 9 | 加藤 和子 | sku-0002 | 2500 | 8 | L | 2022-12-20 10:00:00 | 1 |
27 | 9 | 加藤 和子 | sku-0003 | 9000 | 1 | L | 2022-12-20 10:00:00 | 1 |
28 | 10 | 山口 晴子 | sku-0001 | 3000 | 1 | M | 2022-12-20 19:00:00 | 1 |
29 | 10 | 山口 晴子 | sku-0002 | 2500 | 1 | L | 2022-12-20 19:00:00 | 1 |
30 | 10 | 山口 晴子 | sku-0003 | 9000 | 3 | L | 2022-12-20 19:00:00 | 1 |
この記事を読むと(約5分)
CASE式を使った、クロス集計の基本形を知る事ができます。購入者毎の集計や、販売日毎の集計なども、同じような形で実現できます。
商品毎のレコードを、顧客でグループ化しながら、各人の商品毎の販売個数を合計していきます。最後に各人毎の販売総数も計算しています。
さていつもの様に、テーブルの情報を取得するSQLに関して、注目する部分は、以下の9~15行目のみです。
SELECT name , SUM(CASE item_id WHEN "sku-0001" THEN quantity ELSE 0 END) AS "sku-0001", SUM(CASE item_id WHEN "sku-0002" THEN quantity ELSE 0 END) AS "sku-0002", SUM(CASE item_id WHEN "sku-0003" THEN quantity ELSE 0 END) AS "sku-0003", SUM(quantity) AS "total" FROM sql_order GROUP BY order_id この部分で、各商品毎の条件に一致していれば合計、そうで無ければ0 を、顧客毎(実際にはorder_id毎に)に集計していっています。
try { include_once '../model/class.php'; // データベース接続 $database = new Database(); $db = $database->connect(); // SQLを準備し、パラメータをバインドする $query = 'SELECT name , SUM(CASE item_id WHEN "sku-0001" THEN quantity ELSE 0 END) AS "sku-0001", SUM(CASE item_id WHEN "sku-0002" THEN quantity ELSE 0 END) AS "sku-0002", SUM(CASE item_id WHEN "sku-0003" THEN quantity ELSE 0 END) AS "sku-0003", SUM(quantity) AS "total" FROM sql_order GROUP BY order_id'; $stmt = $db->prepare($query); // 実行する $stmt->execute(); // 結果を取得する $result = $stmt->fetchAll(PDO::FETCH_ASSOC); print_r($result); // データベースから切断する $database->disconnect(); } catch(PDOException $e) { echo $e->getMessage(); }
これを実行すると、二次元連想配列で、取得することができます。
Array ( [0] => Array ( [name] => 伊藤 明日香 [sku-0001] => 1 [sku-0002] => 3 [sku-0003] => 1 [total] => 5 ) [1] => Array ( [name] => 山口 晴子 [sku-0001] => 1 [sku-0002] => 1 [sku-0003] => 3 [total] => 5 ) [2] => Array ( [name] => 原田 和美 [sku-0001] => 1 [sku-0002] => 1 [sku-0003] => 2 [total] => 4 ) [3] => Array ( [name] => 高橋 由美子 [sku-0001] => 1 [sku-0002] => 5 [sku-0003] => 1 [total] => 7 ) [4] => Array ( [name] => 田中 明日香 [sku-0001] => 1 [sku-0002] => 1 [sku-0003] => 2 [total] => 4 ) [5] => Array ( [name] => 小林 美佐子 [sku-0001] => 1 [sku-0002] => 1 [sku-0003] => 2 [total] => 4 ) [6] => Array ( [name] => 渡辺 雄一 [sku-0001] => 1 [sku-0002] => 1 [sku-0003] => 1 [total] => 3 ) [7] => Array ( [name] => 佐藤 智子 [sku-0001] => 12 [sku-0002] => 1 [sku-0003] => 1 [total] => 14 ) [8] => Array ( [name] => 坂本 純子 [sku-0001] => 1 [sku-0002] => 1 [sku-0003] => 3 [total] => 5 ) [9] => Array ( [name] => 加藤 和子 [sku-0001] => 1 [sku-0002] => 8 [sku-0003] => 1 [total] => 10 ) )
名前 | 商品1 | 商品2 | 商品3 | 合計数 |
---|---|---|---|---|
伊藤 明日香 |
1 |
3 |
1 |
5 |
山口 晴子 |
1 |
1 |
3 |
5 |
原田 和美 |
1 |
1 |
2 |
4 |
高橋 由美子 |
1 |
5 |
1 |
7 |
田中 明日香 |
1 |
1 |
2 |
4 |
小林 美佐子 |
1 |
1 |
2 |
4 |
渡辺 雄一 |
1 |
1 |
1 |
3 |
佐藤 智子 |
12 |
1 |
1 |
14 |
坂本 純子 |
1 |
1 |
3 |
5 |
加藤 和子 |
1 |
8 |
1 |
10 |
SQLの使いどころ
サイトに大量の情報を掲載することは、ユーザーにとってとても便利なことです。しかし、情報が多すぎると、目的の情報を見つけるのが困難になります。そのため、SQLを使用することで、情報を効率的に管理することができます。
SQLを使用することで、データベース内の情報を検索したり、フィルタリングしたりすることができます。これにより、ユーザーは目的の情報をスムーズかつ簡単に見つけることができます。
また、SQLを使用することで、データを集計したり、統合したりすることもできます。これにより、ユーザーはさまざまな視点から情報を分析することができます。つまり、サイトに多くの情報を掲載することが重要である一方で、その情報を効率的かつ簡単に管理することが求められる場合には、SQLが不可欠であるといえます。
KK
機械工学を専攻。工業デザイナーとして、国内及び海外の自動車・搬送ラインの設計などに従事した後、2003年にウェブシステム会社を設立。UI設計やウェブシステムの開発、DX化のディレクションなどを行っています。