Table of contents
Open Table of contents
1. Các kiểu dữ liệu của NumPy
Dưới đây là một số kiểu dữ liệu phổ biến và ký hiệu rút gọn của chúng:
i- integer (số nguyên)b- boolean (đúng/sai)u- unsigned integer (số nguyên không dấu)f- float (số thực)c- complex float (số phức)m- timedeltaM- datetimeO- object (đối tượng)S- string (chuỗi)U- unicode stringV- fixed chunk of memory for other type (void)
2. Kiểm tra kiểu dữ liệu của mảng
Bạn sử dụng thuộc tính dtype để biết kiểu dữ liệu của mảng hiện tại.
import numpy as np
arr = np.array([1, 2, 3, 4])
print(arr.dtype) # Kết quả: int64 (tùy hệ điều hành)
arr_str = np.array(['apple', 'banana', 'cherry'])
print(arr_str.dtype) # Kết quả: <U6
3. Tạo mảng với kiểu dữ liệu định sẵn
Bạn có thể ép kiểu dữ liệu ngay khi tạo mảng bằng đối số dtype.
import numpy as np
# Tạo mảng với kiểu string cho các con số
arr = np.array([1, 2, 3, 4], dtype='S')
print(arr)
print(arr.dtype)
4. Chuyển đổi kiểu dữ liệu (astype)
Cách tốt nhất để đổi kiểu dữ liệu của một mảng hiện có là sử dụng phương thức astype(). Nó sẽ tạo ra một bản sao (copy) của mảng.
import numpy as np
arr = np.array([1.1, 2.1, 3.1])
# Chuyển từ float sang integer
newarr = arr.astype('i')
print(newarr)
print(newarr.dtype)
Ví dụ chuyển đổi sang Boolean:
import numpy as np
arr = np.array([1, 0, 3])
newarr = arr.astype(bool)
print(newarr) # Kết quả: [ True False True]
Lời kết Bài 15
Quản lý kiểu dữ liệu giúp bạn kiểm soát độ chính xác và tiết kiệm tài nguyên hệ thống khi làm việc với tập dữ liệu lớn. Ở bài tiếp theo, chúng ta sẽ phân biệt hai khái niệm dễ nhầm lẫn: Sao chép (Copy) và Xem (View) trong NumPy.
Hẹn gặp lại các bạn!