Nâng cao hiệu quả phân lớp dữ liệu không cân bằng sử dụng kỹ thuật tăng mẫu thiểu số và đặc trưng của mỗi cụm

Bài viết đề xuất một phương pháp để nâng cao hiệu quả phân lớp dữ liệu không cân bằng. Đóng góp chính của phương pháp là kết hợp thuật toán phân cụm K-means và kỹ thuật sinh mẫu thiểu số VCIR để tạo ra các mẫu nhân tạo có tính đại diện sát với đặc trưng của dữ liệu thực tế.