Xây dựng hệ thống phân loại website giả mạo (phishing websites) dựa trên học máy

Sinh viên thực hiệnPhạm Quốc Đạt

Khoá20

Website giả mạo (Phishing)Học máy (Machine Learning)Trích xuất đặc trưng URL

Tóm tắt

Đồ án nghiên cứu và phát triển giải pháp nhận diện website lừa đảo bằng kỹ thuật học máy, thay thế cho phương pháp so khớp danh sách đen truyền thống. Tác giả thực hiện trích xuất các nhóm đặc trưng từ URL như đặc trưng từ vựng (lexical) và đặc trưng thống kê để huấn luyện các mô hình như SVM, Random Forest. Quy trình bao gồm thu thập dữ liệu, tiền xử lý bằng thư viện Pandas và chuẩn hóa đặc trưng để tối ưu hóa khả năng phân loại. Kết quả thực nghiệm qua Ablation Study cho thấy các đặc trưng cấu trúc URL đóng vai trò then chốt, giúp mô hình đạt hiệu năng cao với F1-score ấn tượng

File PDF

Mở file PDF Tải PDF

Tài liệu tham khảo

Cục An toàn thông tin – Bộ Thông tin và Truyền thông, "Báo cáo tổng quan an toàn thông tin mạng Việt Nam," 2024. [Online]. Available:

NCSC, "Cảnh báo và thống kê tình hình lừa đảo trực tuyến tại Việt Nam," 2024. [Online]. Available:

VNCERT/CC, "Hướng dẫn phòng chống tấn công phishing," 2024. [Online]. Available:

Khoa CNTT - ĐH Bách Khoa Hà Nội, Giáo trình Học máy (Machine Learning). Hà Nội, 2023.

VietAI, "Tổng quan về các thuật toán học máy và ứng dụng," 2023. [Online]. Available:

N. T. Bình et al., "Ứng dụng học máy trong phát hiện website phishing," Tạp chí Khoa học & Công nghệ Thông tin Việt Nam, 2023.

Trích dẫn

Phạm Quốc Đạt. (2024). Xây dựng hệ thống phân loại website giả mạo (phishing websites) dựa trên học máy. Trường đại học Công nghệ thông tin và Truyền thông - Đại học Thái Nguyên. https://repository.ictu.edu.vn/wp-content/uploads/2026/05/22213.pdf.

P. Q. Đạt, “Xây dựng hệ thống phân loại website giả mạo (phishing websites) dựa trên học máy,” đồ án tốt nghiệp, Trường Đại học Công nghệ thông tin và Truyền thông - Đại học Thái Nguyên, 2024. [Online]. Available: https://repository.ictu.edu.vn/wp-content/uploads/2026/05/22213.pdf.

@mastersthesis{t2024xydnghthngphnlo,
  title        = {Xây dựng hệ thống phân loại website giả mạo (phishing websites) dựa trên học máy},
  author       = {Phạm Quốc Đạt},
  year         = {2024},
  school       = {Trường đại học Công nghệ thông tin và Truyền thông - Đại học Thái Nguyên},
  url          = {https://repository.ictu.edu.vn/wp-content/uploads/2026/05/22213.pdf},
  urldate      = {2026-07-21},
}