Trong bài viết này, SmartData sẽ giới thiệu về khái niệm, công dụng và ứng dụng của biểu đồ phân tán (Scatter Chart) trong Power BI.
Khái Niệm và Công Dụng
Biểu đồ phân tán, hay còn được gọi là biểu đồ Scatter Chart, là một loại biểu đồ thể hiện mối quan hệ giữa hai biến số. Nó sử dụng các điểm dữ liệu trên một hệ trục tọa độ để biểu diễn giá trị của hai biến số tương ứng. Mỗi điểm trên biểu đồ đại diện cho một cặp giá trị từ hai biến số. Trục ngang thường đại diện cho biến số độc lập và trục dọc thường đại diện cho biến số phụ thuộc.
Biểu đồ phân tán hữu ích trong việc phân tích mối quan hệ giữa các biến số và hiển thị dữ liệu không theo thứ tự thời gian. Dưới đây là một số khái niệm và thành phần chính của biểu đồ phân tán:
- Trục ngang (Axis X): Đây là trục dọc theo chiều ngang của biểu đồ. Nó biểu thị giá trị của biến số độc lập (điều kiện, thời gian, vị trí, v.v.) mà bạn đang nghiên cứu.
- Trục dọc (Axis Y): Đây là trục dọc theo chiều dọc của biểu đồ. Nó biểu thị giá trị của biến số phụ thuộc (kết quả, hiệu suất, số lượng, v.v.) mà bạn đang quan tâm đến.
- Chú giải (Legend): Biểu đồ phân tán có thể bao gồm một chú giải để phân loại và nhận dạng các nhóm dữ liệu khác nhau. Chú giải thông thường được sử dụng khi màu sắc, kích thước hoặc biểu tượng của các điểm dữ liệu được sử dụng để đại diện cho các thuộc tính phân nhóm.
Ứng dụng của biểu đồ phân tán (Scatter Chart)
1 số công dụng của biểu đồ phân tán là:
1. Hiển thị mối quan hệ
Scatter Chart giúp phân tích mối quan hệ giữa hai biến số. Nó cho phép bạn xem xét liệu có sự tương quan, xu hướng hoặc mẫu chuyển động nào giữa hai biến số.
2. Phát hiện giá trị ngoại lệ
Scatter Chart giúp bạn phát hiện giá trị ngoại lệ hoặc các điểm dữ liệu đặc biệt trong tập dữ liệu. Các điểm ngoại lệ thường nằm xa khỏi phân phối chung và có thể chỉ ra sự không bình thường hoặc các yếu tố đáng chú ý khác.
3. Phân loại và nhận dạng
Scatter Chart cũng có thể được sử dụng để phân loại và nhận dạng các nhóm dữ liệu. Bằng cách sử dụng màu sắc, kích thước hoặc biểu tượng khác nhau cho các điểm dữ liệu, bạn có thể nhận biết các nhóm khác nhau và phân tích sự khác biệt giữa chúng.
Khi sử dụng biểu đồ phân tán, bạn có thể tìm hiểu mối quan hệ giữa hai biến số, nhận diện xu hướng, xác định giá trị ngoại lệ, phân nhóm dữ liệu và thấy sự phân bố của dữ liệu trên hệ trục tọa độ. Điều này giúp bạn tìm ra các mẫu, khối lượng hoặc tương quan trong dữ liệu một cách trực quan và dễ hiểu.
Cách vẽ biểu đồ phân tán (Scatter Chart)
Trong ví dụ dưới đây, SmartData sẽ sử dụng Dataset mẫu của Microsoft để hướng dẫn vẽ loại biểu đồ này. Nếu muốn thực hành, bạn có thể download tại đây.
Bước 1: Chuẩn bị Dataset và chọn ra các trường dữ liệu cần sử dụng
Hãy đảm bảo rằng Data của bạn đã “clean” và sẵn sàng cho việc trực quan.Sau đó, cần lên phương án và chọn ra những trường dữ liệu phù hợp để vẽ biểu đồ. Ở đây ta chọn 3 trường sau:
- Sales > Sales Per Sq Ft
- Sales > Total Sales Variance %
- District > District
Bước 2: Chọn kiểu biểu đồ Scatter Chart tại Tab Visualizations.
Sau đó, kéo thả trường dữ liệu District từ mục Values sang mục Legend
Bước 3: Sử dụng thẻ Format trong tab Visualizations để điều chỉnh và trang trí cho phù hợp
Trong mục Visual ở thẻ Format, ta có thể tuỳ chỉnh các chú thích, các dãy màu cho các thành phần.
Ở mục General trong thẻ Format, ta có thể điều chỉnh tiêu đề, màu nền cho bắt mắt hơn.
Sau khi điều chỉnh xong, ta được 1 biểu đồ tròn (Pie Chart) tương đối hoàn chỉnh và có thể sử dụng được như sau.
Ngoài ra, bạn có thể thêm các đường trend line để biểu đồ có tính phân tích sâu và trực quan hơn.
Tổng Kết
Qua bài viết trên đây, SmartData đã giới thiệu đến các bạn khái niệm, công dụng và ứng dụng của dạng biểu đồ phân tán (Scatter Chart) là 1 trong những biểu đồ phức hợp có tính ứng dụng cao trong Power BI. Hi vọng các bạn sẽ áp dụng được những kiến thức trên vào công việc trực quan hoá dữ liệu trên thực tế.
Nếu bạn là newbie có thể tham khảo bài viết này để tìm hiểu lộ trình học DA trong 3 tháng của SmartData.
Nếu bạn thấy bài viết hay và hữu ích, bạn có thể tham gia các kênh sau của SmartData để nhận được nhiều hơn nữa: