Tableau là một trong các công cụ phân tích và trực quan hóa dữ liệu tốt nhất hiện nay. Nhằm giúp đỡ mọi người trong việc tự học Tableau một cách đơn giản, hiệu quả và nhanh nhất, bài viết này SmartData sẽ giúp các bạn tổng hợp kiến thức về Tableau – cụ thể là Tableau Desktop để có thể học và hiểu cấp tốc trong 1 ngày.
Các thành phần của Tableau Desktop
Data
Nơi chứa thông tin về dữ liệu đầu vào gôm có:
- Data Source: Nơi định nghĩa các dữ liệu đầu vào được sử dụng để thiết kế các báo cáo trong Tableau
- Dimension: Biến phân loại:
- Dimensions chứa giá trị định tính như tên, ngày tháng, dữ liệu địa lý
- Có thể sử dụng dimensions để phân loại, phân chia và tiết lộ chi tiết về dữ liệu
- Dimensions sẽ ảnh hưởng đến mức độ chi tiết bên trong view
- Biến phân loại là các nhãn phân tách các giá trị định lượng thành các nhóm với những nhãn có ý nghĩa nhỏ hơn.
- Biến phân loại được chia thành các loại nhỏ:
- Định danh (nominal): Các đối tượng riêng lẻ khác nhau về tên gọi. Các đối tượng này không có trật tự đặc biệt nào và không có giá trị định lượng.
- Thứ bậc (ordinal): Các đối tượng riêng lẻ khác nhau, được sắp xếp theo thứ tự nhất định và không có giá trị định lượng.
- Các đối tượng riêng lẻ tương ứng với các giá trị định lượng. Các khoảng bắt đầu như một dải các giá trị định lượng được chuyển đổi thành thang phân loại bằng cách chia giá trị thành các đoạn nhỏ có kích thước bằng nhau, mỗi giá trị được gán cho một nhãn (ví dụ “0–99” hoặc “> = 0 và < 100”).
- Thời gian: Đây là một thang phân loại khá đặc biệt vì nó vừa có thể được coi như thang đo khoảng hoặc thang đo thứ bậc.
- Measure: Biến định lượng:
- Measures chứa các con số, giá trị định tính mà bạn có thể đo
- Measures có thể được tổng hợp, khi bạn kéo một measure vào view, Tableau sẽ áp dụng một tổng hợp cho nó theo mặc định.
- Biến định lượng chứa các giá trị là các con số, các phép đo phản ánh dữ liệu liên quan đến doanh nghiệp như số lượng đơn hàng, lợi nhuận, mức độ hài lòng của khách hàng…
- Các giá trị định lượng được biểu diễn dưới dạng con số và có thể thực hiện được các phép toán số học giữa các số này. Có hai loại gia trị định lượng:
- Giá trị rời rạc (Discrete): Giá trị được biểu thị bởi các số nguyên, có thể đếm được như số sản phẩm bán ra, số ngày trong năm…
- Giá trị liên tục (Continuous): Biến mà các giá trị có thể có của nó được lấp kín cả một khoảng trên trục số. Ví dụ như giá bán sản phẩm, doanh thu, lợi nhuận…
- Set: Các tập dữ liệu được định nghĩa trong Data Source
- Parameter: Các tham số được định nghĩa trong Workbook
Analytics
Chứa các phân tích nâng cao gồm có:
- Summarize
- Constant Line
- Average Line
- Median with Quartiles
- Box Plot
- Totals
- Model
- Average with 95% CI
- Median with 95% CI
- Trend Line
- Forecast
- Cluster
- Custom
- Reference Line
- Reference Band
- Distribution Band
- Box Plot
Worksheet
Trang thiết kế một báo cáo trong Tableau.
Workbook
Một tệp tin chứa một hoặc nhiều Worksheet, Dashboard và Story trong Tableau.
Dashboard
Thể hiện một khung nhìn chứa một hoặc nhiều Worksheet
Story
Thể hiển một thứ tự các Worksheet và Dashboard.
Show me
Giúp chuyển đổi giữa các dạng biểu đồ một cách nhanh chóng
Các loại dữ liệu trong Tableau Desktop
Loại dữ liệu | Mô tả |
Numberic(decimal) | Dữ liệu kiểu số có chứa phần thập phân |
Numberic(whole) | Dữ liệu kiểu số không chưa phần thập phân |
String | Dữ liêu kiểu chuỗi |
Boolean | Dữ liệu kiểu logic |
Date | Dữ liệu kiểu ngày tháng năm |
Date & Time | Dữ liệu kiểu ngày tháng năm + giờ phút giây |
Các dạng biểu đồ trong Tableau
Text Tables
- Text tables dùng để hiển thị một bảng dữ liệu (dạng như crosstab hoặc pivot).
- Ví dụ: Hiển thị doanh thu theo từng vùng
Heat Maps
- Heat maps (bản đồ nhiệt) là một biểu đồ gồm hai chiều trong đó các giá trị được thể hiện bằng màu sắc. Nó như một bảng tóm tắt các thông tin giúp người dùng nắm bắt thông tin một cách nhanh chóng
- Ví dụ: Hiển thị dữ liệu Doanh thu (Sales) và Lợi nhuận (Profit) của dòng sản phẩm (Category) và vùng (Region)
Highlight Tables
- Highlight Tables là một dạng giống với Heat Maps dùng để hiển thị dữ liệu qua màu sắc nhưng Highlight tables hiển thị dữ liệu chi tiết thay vì hiển thị hình chữ nhật như Heat maps.
- Ví dụ: Hiển thị dữ liệu Doanh thu (Sales) và Lợi nhuận (Profit) của dòng sản phẩm (Category) và vùng (Region).
Symbol Maps
- Symbol Maps cho phép hiển thị dữ liệu lên bản đồ địa lí theo quốc gia, vùng, tỉnh, quận/huyện dưới dạng Marker (điểm).
- Ví dụ: Hiển thị dữ liệu doanh thu (Sales) theo từng thành phố (city).
Maps
- Maps cho phép hiển thị dữ liệu lên bản đồ địa lí theo quốc gia, vùng, tỉnh, quận/huyện dưới dạng phủ màu lên toàn vùng đó.
- Ví dụ: Hiển thị dữ liệu doanh thu (Sales) theo từng bang (State).
Pie Charts
- Là một dạng biểu hình tròn bao gồm nhiều phần. Pie charts thường dùng để thể hiện tỷ trọng đóng góp (%) của các đối tượng con vào số tổng.
- Ví dụ: Hiển thị tỉ trọng doanh thu (Sales) theo từng bộ phận (Segment)
Horizontal Bars
- Horizontal Bars là một dạng biểu đồ hình cột quen thuộc, dạng này được dùng để so sánh các đối tượng dữ liệu với nhau.
- Ví dụ: Biểu đồ hiển thị so sánh doanh thu (Sales) giữa các bộ phận (Segment)
Stacked Bars
- Stacked bars là một dạng biểu đồ hình cột như Horizontal bars nhưng mỗi cột nó có nhiều phần xếp lên nhau, vì vậy ngoài việc có thể so sánh dữ liệu các cột với nhau, bạn còn thể hiển thị thêm một chiều thể hiện chi tiết thành phần của mỗi cột.
- Ví dụ: Biểu đồ thể hiện doanh thu (Sales) và số lượng (Quantity) theo từng bộ phận (Segment) và từng loại sản phẩm (Category).
Side-by-side Bars
- Side – by – side bars là một dạng biểu đồ hình cột để so sánh nhiều đối tượng dữ liệu trên một không gian làm việc.
- Ví dụ: So sánh doanh thu (Sales) và số lượng (Quantity) theo từng bộ phận (Segment), từng loại sản phẩm (Category).
Treemaps
- Treemaps là một dạng biểu đồ biểu diễn dữ liệu thành các hình chữ nhật, kích thước của mỗi hình chữ nhật thể hiện độ lớn của đối tượng. Bạn có rất nhiều đối tượng dữ liệu vậy bạn muốn xem những đối tượng nào đang chiếm tỉ trọng cao, dùng Treemaps để xem điều này.
- Ví dụ: Hiển thị tỉ trọng doanh thu (Sales) theo từng bộ phận (Segment) và theo từng loại sản phẩm (Category).
Circle Views
- Circle views là một dạng biểu đồ bao gồm nhiều hình tròn thể hiện độ phân tán dữ liệu của bạn.
- Ví dụ: Hiển thị mức độ phân tán doanh thu (Sales) theo từng bộ phận (Segment) và loại sản phẩm (Category).
Side-by-side Circles
- Side – by – side circle tương tự như Circle views, nhưng nó cung cấp cho bạn một cách nhìn khác.
- Ví dụ: Hiển thị mức độ phân tán doanh thu (Sales) theo từng bộ phận (Segment) và loại sản phẩm (Category).
Lines (Continuous)
- Chart cho phép nhìn thấy dòng chảy của dữ liệu theo dòng thời gian.
- Ví dụ: Hiển thị sự biến động doanh thu (Sales) và số lượng (Quantity) theo ngày (Order Date).
Dual Lines
- Thể hiện sự biến động dữ liệu của 2 measures theo thời gian, so sánh hai giá trị với nhau.
- Ví dụ: Xây dựng biểu đồ thể hiện sự biến động của giá trị profit và sales qua các năm.
Area Charts(Continuous)
- Biểu đồ phân vùng cho từng nhóm để thấy sự chênh lệch giữa các nhóm.
- Ví dụ: Xây dựng biểu đồ phân khác thị trường theo dòng thời gian của profit và sales.
Area Charts (Discrete)
- Biểu đồ phân vùng cho từng nhóm để thấy sự chênh lệch giữa các nhóm.
- Ví dụ: Xây dựng biểu đồ phân khác thị trường theo dòng thời gian của profit và sales.
Dual combination
- Biểu đồ thể hiện một dạng khác của Dual Charts, so sánh 2 giá trị measures.
- Ví dụ: Xây dựng biểu đồ thể hiện sự biến động của giá trị profit và sales qua các năm.
Scatter Plots
- Cho thấy được mức độ tương quan của các measures chi tiết theo (nhóm sản phẩm, sản phẩm, khách hàng, phân khúc thị trường…).
- Ví dụ: Xây dựng biểu đồ tương quan giữa Doanh thu (Sales), Lợi nhuận (Profit) theo từng bộ phận (Segment) và Khách hàng (Customer Name).
Histogram
- Biểu đồ có thể thống kê tổng giá trị trong một khoảng giá trị để thấy được mức độ tập hợp ở khoảng nào.
- Ví dụ: Xây dựng biểu đồ thống kê hiển thị số lượng đơn hàng (Quantity).
Box-and-whisker Plots
- Biểu đồ cho phép xem được sự phân tán và tập trung dữ liệu theo từng nhóm.
- Ví dụ: Xây dựng biểu đồ xem giá ở mức nào của từng nhóm sản phẩm là bán chạy, tập trung cao nhất.
- Dựa trên biểu đồ sẽ tại các Box Plot là nơi tập trung 50 % của các điểm dữ liệu.
Gantt Chart
- Biểu đồ Gantt dùng để để hiển thị thời gian của các sự kiện hoặc hoạt động theo thời gian. Trong một biểu đồ Gantt bar, từng nhãn hiệu riêng biệt (thường là một thanh) cho thấy một thời gian khác nhau.
- Ví dụ: Xây dựng biểu đồ Gantt để hiển thị thời gian giao hàng trung bình cho một phạm vi của sản phẩm.
- Để tạo một biểu đồ Gantt cho biết bao nhiêu ngày, trung bình, trôi qua giữa order date và ship date, làm theo các bước dưới đây. Các dữ liệu được chia ra theo sub_category và ship mode. Các view hiển thị kết quả trên một cơ sở hàng tuần cho một kỳ 3 tháng.
Bullet Graphs
- Biểu đồ cho thấy được sự tương quan của 2 giá trị, ví dụ như tương quan giữa số thực tế và số kế hoạch, chúng ta có thể xem được số thực tế đã đạt được bao nhiêu phần trăm số kế hoạch.
- Ví dụ: Xây dựng biểu đồ Bullet để thể hiện doanh thu đạt được (Sales) so với mục tiêu (Target) theo từng loại sản phẩm (Category).
Packed Bubbles
- Biểu đồ bong bóng cho phép bạn hiển thị dữ liệu trong một cụm các vòng tròn.
- Sử dụng kích thước để xác định các bong bóng khác nhau dựa trên các giá trị measures và để xác định màu sắc của các vòng tròn cá nhân bằng dimensions .
- Biểu đồ bong bóng cung cấp một hình dung dữ liệu tương đối đơn giản mà có thể cung cấp cái nhìn sâu sắc trong một định dạng trực quan hấp dẫn.
- Ví dụ: Xây dựng biểu đồ bong bóng thể hiện doanh thu (Sales) theo từng loại sản phẩm (Category), nhóm sản phẩm (Sub-category) và sản phẩm (Product Name).
Nếu các bạn có nhu cầu muốn học Tableau một cách bài bản hơn nữa, có thể tham khảo các khóa học tableau ở đây.