- Bạn vui lòng tham khảo Thỏa Thuận Sử Dụng của Thư Viện Số
Tài liệu Thư viện số
Danh mục TaiLieu.VN
Bài viết đề xuất một phương pháp để nâng cao hiệu quả phân lớp dữ liệu không cân bằng. Đóng góp chính của phương pháp là kết hợp thuật toán phân cụm K-means và kỹ thuật sinh mẫu thiểu số VCIR để tạo ra các mẫu nhân tạo có tính đại diện sát với đặc trưng của dữ liệu thực tế.
11 p hbu 16/01/2025 7 0
Từ khóa: Phân lớp dữ liệu, Kỹ thuật tăng mẫu thiểu số, Dữ liệu không cân bằng, Thuật toán phân cụm K-means, Kỹ thuật sinh mẫu thiểu số VCIR
Bài viết thử áp dụng giải thuật Rừng ngẫu nhiên có điều chỉnh hàm chi phí (cost-sensitive weighted random forest - CSWRF), vốn đã thành công trong bài toán phát hiện gian lận thẻ tín dụng (credit card fraud detection) để giải quyết vấn đề dữ liệu mất cân bằng trong bài toán dự đoán thuê bao rời bỏ nhà mạng. Ngoài ra, tác giả so sánh hiệu quả của giải...
10 p hbu 27/05/2024 52 0
Từ khóa: Phân lớp dữ liệu mất cân bằng, Dự đoán thuê bao rời bỏ nhà mạng, Rừng ngẫu nhiên, Kỹ thuật viễn thông, Điều chỉnh hàm chi phí, Phương pháp SMOTE
Thuật toán khai thác tập thường xuyên hiệu quả dựa trên kỹ thuật phân lớp dữ liệu
Trong bài báo này các tác giả đề xuất phương án giải quyết bài toán trên bằng cách phân hoạch dữ liệu thành N lớp, mỗi lớp được lưu trữ độc lập thành 1 file trên bộ nhớ ngoài và đề xuất thuật toán SPP-Mining để khai thác các tập thường xuyên với ngưỡng So tùy ý và được xử lý song song trên N máy.
12 p hbu 28/08/2017 351 1
Từ khóa: Thuật toán khai thác, Kỹ thuật phân lớp dữ liệu, Phân lớp dữ liệu, Đề xuất thuật toán SPP-Mining, Phân hoạch dữ liệu, Phân hoạch dữ liệu thành N lớp
Bộ sưu tập nổi bật