
1. Các kiểu dữ liệu của NumPy
Dưới đây là một số kiểu dữ liệu phổ biến và ký hiệu rút gọn của chúng:
- `i` – integer (số nguyên)
- `b` – boolean (đúng/sai)
- `u` – unsigned integer (số nguyên không dấu)
- `f` – float (số thực)
- `c` – complex float (số phức)
- `m` – timedelta
- `M` – datetime
- `O` – object (đối tượng)
- `S` – string (chuỗi)
- `U` – unicode string
- `V` – fixed chunk of memory for other type (void)
—
2. Kiểm tra kiểu dữ liệu của mảng
Bạn sử dụng thuộc tính `dtype` để biết kiểu dữ liệu của mảng hiện tại.
import numpy as np
arr = np.array([1, 2, 3, 4])
print(arr.dtype) # Kết quả: int64 (tùy hệ điều hành)
arr_str = np.array(['apple', 'banana', 'cherry'])
print(arr_str.dtype) # Kết quả: <U6
—
3. Tạo mảng với kiểu dữ liệu định sẵn
Bạn có thể ép kiểu dữ liệu ngay khi tạo mảng bằng đối số `dtype`.
import numpy as np
# Tạo mảng với kiểu string cho các con số
arr = np.array([1, 2, 3, 4], dtype='S')
print(arr)
print(arr.dtype)
—
4. Chuyển đổi kiểu dữ liệu (astype)
Cách tốt nhất để đổi kiểu dữ liệu của một mảng hiện có là sử dụng phương thức `astype()`. Nó sẽ tạo ra một bản sao (copy) của mảng.
import numpy as np
arr = np.array([1.1, 2.1, 3.1])
# Chuyển từ float sang integer
newarr = arr.astype('i')
print(newarr)
print(newarr.dtype)
Ví dụ chuyển đổi sang Boolean:
import numpy as np
arr = np.array([1, 0, 3])
newarr = arr.astype(bool)
print(newarr) # Kết quả: [ True False True]
—
Lời kết Bài 15
Quản lý kiểu dữ liệu giúp bạn kiểm soát độ chính xác và tiết kiệm tài nguyên hệ thống khi làm việc với tập dữ liệu lớn. Ở bài tiếp theo, chúng ta sẽ phân biệt hai khái niệm dễ nhầm lẫn: Sao chép (Copy) và Xem (View) trong NumPy.
Hẹn gặp lại các bạn!
Leave a comment