Ý nghĩa của group by
Trong quá trình phân tích dữ liệu trong Power BI, việc “group by” là một bước quan trọng để hiểu rõ hơn về xu hướng, phân phối, và các thống kê quan trọng khác. Nhóm hóa dữ liệu là quá trình tổ chức và phân loại các row dữ liệu trong một tập dữ liệu thành các nhóm dựa trên giá trị của một hoặc nhiều thuộc tính.
Bằng cách group by, bạn có thể thực hiện các phép toán tổng hợp như tổng, trung bình, số lượng, và các phép toán khác trên các nhóm dữ liệu, giúp bạn đánh giá mức độ phổ biến, xu hướng, và các thống kê quan trọng khác. Điều này giúp bạn nhanh chóng hiểu được các đặc điểm và xu hướng của từng nhóm.
Cách Group by theo nhiều cột khác nhau
Trong Power BI, để group by dữ liệu theo nhiều cột khác nhau, bạn có thể sử dụng chức năng “Group By”. Đây là cách bạn có thể thực hiện:
Trong màn hình Power Query -> chọn tab “Transform” -> chọn “Group By” -> chọn “Advanced” -> Chọn thêm cột để group by, bạn chọn Add Grouping và chọn thêm cột muốn nhóm. Ngoài ra, nếu bạn muốn thêm các cột dữ liệu tổng hợp có thể chọn Add aggregation để thêm.
Ví dụ áp dụng Group By
Giả sử mình có tập dữ liệu về dữ liệu bán hàng, với mỗi dòng tương ứng với thông tin mỗi đơn hàng.
Giả sử bạn muốn nhóm tổng giá vốn hàng bán và lợi nhuận theo chi nhánh và sản phẩm thì có thể làm như sau:
Trong chọn “Group by” -> “Advanced” -> đầu tiên chọn cột “Chi nhánh”, sau đó chọn “Add grouping” và chọn cột “Sản phẩm” . Trong phần “New column name” nhập tên cột “Tổng giá vốn hàng bán” , operation chọn “Sum”, Column chọn “Giá vốn hàng bán” để tính tổng giá vốn hàng bán, còn tổng lợi nhuận làm tương tự.
Sau khi làm các bước trên, ta được kết quả
Kết luận
Bài viết trên SmartData đã giới thiệu với các bạn các thao tác group By trong Power Query. Nếu bạn thấy bài viết hay và hữu ích, bạn có thể tham gia các kênh sau của SmartData để nhận được nhiều thông tin hơn nữa: