Xây dựng chương trình sinh phụ đề mô tả cho ảnh với CNN & LSTM

Sinh viên thực hiện
Khoá K16
Giảng viên hướng dẫn ICTU
Từ khoá: học sâu mạng nơ-ron đối xứng (CNN) xử lý tín hiệu thời gian liên tục (LSTM) phụ đề hình ảnh

Tóm tắt

Đề tài này tập trung vào việc xây dựng một hệ thống tự động hóa để tạo phụ đề mô tả cho hình ảnh bằng cách kết hợp các phương pháp học sâu như mạng nơ-ron đối xứng (CNN) và xử lý tín hiệu thời gian liên tục (LSTM). Bối cảnh thực tế đã thúc đẩy nghiên cứu này nhằm đáp ứng nhu cầu cấp thiết của việc tự động hóa quá trình tạo phụ đề. Mục tiêu là phát triển một hệ thống có khả năng phân tích hình ảnh, nhận dạng nội dung hình ảnh và chuyển đổi chúng thành văn bản mô tả chính xác. Phương pháp sử dụng CNN để xử lý hình ảnh và LSTM để nắm bắt ngữ cảnh thời gian của các thuật ngữ trong phụ đề. Kết quả mong đợi từ nghiên cứu này là cung cấp một công cụ hữu ích cho cộng đồng, với tiềm năng ứng dụng rộng rãi trong giáo dục, truyền thông và dịch vụ hỗ trợ người khuyết tật.