Numpy là một thư viện toán học phổ biến và mạnh mẽ của Python. Nó cung cấp các hàm để tạo và thao tác với các mảng.
Numpy cũng cung cấp các hàm để đọc và ghi file. Các hàm này cho phép bạn lưu trữ và truy xuất dữ liệu mảng từ file.
Sử dụng numpy.load, numpy.save
Các hàm numpy.load và numpy.save là các hàm cơ bản nhất để đọc và ghi file với Numpy.
Hàm numpy.load được sử dụng để đọc dữ liệu mảng từ file. Hàm này có hai tham số:
- filename: Đường dẫn đến file cần đọc.
- allow_pickle=True: Cho phép file được lưu ở định dạng pickle.
Ví dụ, để đọc dữ liệu từ một file có tên data.npy, bạn có thể sử dụng mã sau:
import numpy as np # Đọc dữ liệu từ file data = np.load("data.npy") # In ra dữ liệu print(data) Đầu ra: [[1, 2, 3], [4, 5, 6]]
Hàm numpy.save() được sử dụng để ghi dữ liệu vào một file. Hàm này có hai tham số:
- Mảng dữ liệu: Mảng dữ liệu cần ghi.
- Tên file: Tên của file cần ghi.
- Định dạng file: Định dạng của file cần ghi.
Ví dụ, để ghi dữ liệu vào một file có tên data.npy, bạn có thể sử dụng mã sau:
import numpy as np # Tạo mảng dữ liệu data = np.array([[1, 2, 3], [4, 5, 6]]) # Ghi dữ liệu vào file np.save("data.npy", data)
Đọc ghi file csv, txt, ảnh, …
Ngoài các hàm numpy.load và numpy.save, Numpy còn cung cấp các hàm chuyên dụng để đọc và ghi file csv, txt, ảnh, …
- Đọc file csv: Sử dụng hàm numpy.genfromtxt(). Hàm này có nhiều tham số, trong đó các tham số quan trọng nhất là:
- delimiter: Ký tự phân tách dữ liệu trong file csv.
- skip_header: Số dòng đầu tiên của file cần bỏ qua.
- dtype: Kiểu dữ liệu của các phần tử trong mảng.
- Ghi file csv: Sử dụng hàm numpy.savetxt(). Hàm này có nhiều tham số, trong đó các tham số quan trọng nhất là:
- delimiter: Ký tự phân tách dữ liệu trong file csv.
- fmt: Định dạng của dữ liệu trong file csv.
- Đọc file txt: Sử dụng hàm numpy.loadtxt(). Hàm này có thể được sử dụng để đọc file txt có định dạng tương tự như file csv.
- Ghi file txt: Sử dụng hàm numpy.savetxt(). Hàm này có thể được sử dụng để ghi file txt có định dạng tương tự như file csv.
- Đọc ảnh: Sử dụng hàm imread() của thư viện cv2. Hàm này có hai tham số:
- filename: Đường dẫn đến ảnh cần đọc.
- flags: Các tùy chọn đọc ảnh.
- Ghi ảnh: Sử dụng hàm imwrite() của thư viện cv2. Hàm này có ba tham số:
- filename: Đường dẫn đến ảnh cần ghi.
- arr: Mảng chứa dữ liệu ảnh.
- flags: Các tùy chọn ghi ảnh.
Các tham số trong hàm đọc ghi
Các tham số trong hàm đọc ghi có thể được sử dụng để kiểm soát cách thức dữ liệu được đọc và ghi.
Ví dụ, tham số delimiter trong hàm numpy.genfromtxt() được sử dụng để chỉ định ký tự phân tách dữ liệu trong file csv. Tham số này có thể được sử dụng để đọc file csv có định dạng khác nhau.
Tham số flags trong hàm imread() của thư viện cv2 được sử dụng để kiểm soát cách thức ảnh được đọc. Tham số này có thể được sử dụng để đọc ảnh ở các định dạng khác nhau, hoặc để đọc ảnh ở các chế độ màu khác nhau.
Nếu bạn là newbie có thể tham khảo bài viết này để tìm hiểu lộ trình học DA trong 3 tháng của SmartData.
Nếu bạn thấy bài viết hay và hữu ích, bạn có thể tham gia các kênh sau của SmartData để nhận được nhiều hơn nữa: