Nghiên cứu mô hình học tăng cường sâu lai và ứng dụng xây dựng AI Agent cho game Flappy Bird

Sinh viên thực hiện
Giảng viên hướng dẫn Nguyễn Đức Bình
Từ khoá: Học tăng cường sâu (Deep Reinforcement Learning) Double DQN AI Agent

Tóm tắt

Đồ án nghiên cứu về các thuật toán học tăng cường sâu (Deep Reinforcement Learning) và khả năng ứng dụng trong việc huấn luyện tác nhân thông minh. Tác giả tập trung vào kiến trúc lai Double DQN (D3QN) kết hợp với Dueling Network và cơ chế Prioritized Experience Replay để tối ưu hóa quá trình học và giảm thiểu sai lệch hành động. Mô hình được thực nghiệm trên môi trường game Flappy Bird để đánh giá tính ổn định và khả năng thích nghi trong các điều kiện môi trường thay đổi. Kết quả nghiên cứu cung cấp cơ sở quan trọng cho việc phát triển các AI Agent có khả năng tự học từ dữ liệu thô (ảnh màn hình) một cách hiệu quả

Tài liệu tham khảo

  1. H. Van Hasselt, A. Guez, and D. Silver, "Deep Reinforcement Learning with Double Q-learning," in Proc. AAAI Conf. Artif. Intell., 2016.
  1. Z. Wang et al., "Dueling Network Architectures for Deep Reinforcement Learning," in Proc. Int. Conf. Mach. Learn. (ICML), 2016.
  1. T. Schaul et al., "Prioritized Experience Replay," in Proc. Int. Conf. Learn. Represent. (ICLR), 2016.
  1. V. Mnih et al., "Playing Atari with Deep Reinforcement Learning," arXiv:1312.5602, 2013.
  1. J. Schulman et al., "Proximal Policy Optimization Algorithms," arXiv:1707.06347, 2017.