Trong phần 1 của series ” Hướng Dẫn Tự Học Power BI “, Smartdata sẽ giới thiệu đến các bạn cách kết nối dữ liệu từ các tệp trong Power BI.
Giới Thiệu
Trong vài năm trở lại đây, hầu hết những công ty thường lưu trữ các dữ liệu của mình bằng cách xuất ra và lưu trữ dưới dạng các tệp máy tính, thông dụng nhất là loại flat file ( tệp phẳng). Tệp phẳng là 1 loại tệp mà chỉ chứa 1 bảng dữ liệu và mỗi dòng trong dữ liệu có cấu trúc giống hết nhau, không có sự phân cấp rõ ràng. Ví dụ cho loại tệp thông dụng này là tệp .csv và tệp .txt. Một vài loại file khác có thể kể đến như là Excel có định dạng .xlsx. Điều đó đặt ra 1 nhu cầu về 1 công cụ có thể tập trung dữ liệu từ nhiều nguồn tệp khác nhau để dễ dàng thao tác.
Power BI Desktop được phát triển cho phép ta có thể lấy được dữ liệu từ rất nhiều định dạng tệp khác nhau. Bạn có thể xem các nguồn dữ liệu được hỗ trợ bằng cách truy cập vào tính năng Get Data trong PBI desktop. Sau đây, SmartData sẽ hướng dẫn các bạn cách để lấy dữ liệu từ 1 file Excel được lưu trong máy tính.
Bối Cảnh
Để sát với thực tế hơn, hãy giả dụ như bạn là nhân viên của 1 DA của 1 phòng nhân sự của công ty Tailwind. Họ có 1 tệp phẳng chứa thông tin của các nhân viên công ty bao gồm: Họ và tên, ngày bắt đầu làm việc, vị trí và quản lý trực tiếp.
Trưởng phòng nhân sự yêu cầu bạn viết 1 báo cáo bằng Power BI sử dụng dữ liệu đó kết hợp với 1 vài dữ liệu được lưu trữ ở 1 số nguồn khác.
Xác Định Vị Trí Lữu Trữ Tệp Phẳng
Việc cơ bản đầu tiên bạn cần làm là xác định vị trí của tệp dữ liệu mà bạn muốn lấy và lưu trữ các báo cáo của bạn. Ta có vài vị trí lưu trữ như sau:
- Local: Bạn có thể truy xuất dữ liệu từ 1 tệp cục bộ đến Power B. Tiến trình này sẽ không làm cho tệp đó di chuyển đến vị trí Power BI cũng không tạo ra bất cứ liên kết nào, thay vào đó tất cả dữ liệu nằm trong tệp sẽ được đưa lên Power BI. Vì vậy, khi có sự thay đổi ở tệp gốc, dữ liệu trong Power BI sẽ không bị ảnh hưởng.
- OneDrive for Business: bạn cũng có thể lấy dữ liệu từ OneDrive for Business đến PowerBI. Phương thức này giúp tệp Excel gốc và các báo cáo trong PowerBI của bạn được đồng bộ. Tức là nếu có sự thay đổi nào ở tệp gốc, các số liệu trong Power BI sẽ bị thay đổi theo.
- OneDrive – Personal : phương thức này tương tự với Onedrive for Business nhưng điểm khác biệt là bạn cần phải đăng nhập vào tài khoản Onedrive cá nhân của mình và lựa chọn tùy chọn Keep mee signed in. Một số công ty lớn sẽ không cho phép nhân viên sử dụng tài khoản cá nhân để lưu trữ, hãy cân nhắc với phương thức này.
- SharePoint – Team Sites – Bạn có thể lưu trũ những tệp báo cáo Power BI ở SharePoint Team Sites. Nó tương tự như OneDrive for Business. Điểm khác biệt chính nằm ở chỗ cách bạn kết nối đến tệp từ PBI, nó có thể là 1 đường link URL hoặc đến thẳng thư mục gốc.
Sử dụng OneDrive hoặc SharePoint – Team Sites là 1 trong những cách hiệu quả nhất để lữu trữ các bộ dữ liệu, các báo cáo và các bảng dashboard Power BI. Tuy nhiên nếu dữ liệu trong tệp ít bị thay đổi thường xuyên, bạn có thể cân nhắc lữu trữ cục bộ trên máy tính.
Cách Kết Nối 1 Tệp Dữ Liệu
Trong Power BI, ở thanh công cụ Home, ta chọn Get Data. 1 danh sách các loại nguồn dữ liệu thông dụng sẽ xuất hiện, hãy chọn 1 nguồn phù hợp, ví dụ như là Text/CSV hoặc XML. Trong trường hợp này, ta chọn Excel.
Tùy thuộc vào lựa chọn của bạn, bạn sẽ phải đi tìm tệp có định dạng tương ứng loại kết nối bạn đã chọn. Bạn có thể bị yêu cầu đặng nhập nếu chọn các phương thức như là OneDrive vì lí do bảo mật. Trong ví dụ này, ta sẽ mở tệp excel có tên là Employee Data được lưu trữ trên màn hình Desktop.
Chọn Tệp Để Truy Xuất Dữ Liệu
Sau khi đã kết nối dữ liệu đến Power BI, 1 cửa sổ điều hướng sẽ xuất hiện và thể hiện những dữ liệu bên trong tệp dữ liệu của bạn ( trong ví dụ trên là file excel). Bạn có thể click chọn 1 thành phần để xem nội dung bên trong nó. Chú ý, hãy đảm bảo rằng các dữ liệu được kết nối đến Power BI là đúng dịnh dạng.
Điền vào check box những bảng dữ liệu bạn muốn sử dụng. Nút Load và TransformData sẽ sáng lên khi có ít nhất 1 bảng hợp lệ được chọn. Xem ảnh minh họa
Nhấp vào nút Load để tự động lấy dữ liệu từ File lên Power BI hoặc chọn Transform Data để mở chương trình Power Query Editor để có thêm những chỉnh sửa hoặc làm sạch dữ liệu trước khi tải những dữ liệu đó lên PBI
SmartData luôn khuyến khích sử dụng Transform Data để có thêm 1 bước chỉnh sửa cuối cùng, nhưng quá trình Transform Data sẽ được SmartData hướng dẫn ở các bài viết sau. Ở bài viết này, ta sẽ chọn Load
Đổi Nguồn Của Tệp Dữ Liệu
Bạn hoàn toàn có thể đổi đường dẫn của 1 nguồn dữ liệu trong suốt quá trình thao tác hoặc nếu có sử thay đổi đối với thư mục lưu trữ. Và để giữ cho những báo cáo của mình luôn có được những cập nhật mới nhất, ta cần update đường dẫn đến file gốc trong PBI.
Power Query có nhiều cách để thực hiện điều này để bạn có thể linh động thực hiện khi cần thiết, bao gồm:
- Data source settings
- Query settings
- Advanced Editor
Ví dụ, nếu bạn muốn thay đổi đường dẫn tệp trong Data source settings. Trong Power Query, mở Data source settings -> chọn đúng file -> chọn Change Source -> Cập nhật đường dẫn hoặc sử dụng tính năng Browse để dẫn đến thư mụa chứa file -> chọn OK -> chọn Close
Tổng Kết
Như vậy, với series ‘Hướng dẫn tự học Power BI’ – Phần 1, SmartData đã giới thiệu đến các bạn các thao tác kết nối dữ liệu từ các tệp . Hi vọng bài viết có thể cung cấp cho bạn các kiến thức cần thiết cho quá trình rèn luyện và trở thành 1 DA xuất sắc.
Nếu bạn là newbie có thể tham khảo bài viết này để tìm hiểu lộ trình học DA trong 3 tháng của SmartData.
Nếu bạn thấy bài viết hay và hữu ích, bạn có thể tham gia các kênh sau của SmartData để nhận được nhiều hơn nữa: