Ứng dụng mô hình lai Vision Transformer và LSTM trong dự đoán thời điểm co rút theo chu vi từ chuỗi ảnh tim mạch.

Sinh viên thực hiện
Giảng viên hướng dẫn Trần Quang Quý
Từ khoá: Siêu âm tim Vision Transformer (ViT) LSTM Phân tích chuỗi ảnh

Tóm tắt

Đồ án đề xuất giải pháp y tế thông minh kết hợp giữa Vision Transformer (ViT) và LSTM để phân tích chuỗi ảnh siêu âm tim. ViT đảm nhận việc trích xuất đặc trưng không gian chi tiết từ các khung hình, trong khi LSTM học các phụ thuộc thời gian để dự đoán chính xác thời điểm co rút của cơ tim. Phương pháp này giúp bác sĩ đánh giá chức năng thất trái và chẩn đoán sớm các bệnh lý tim mạch một cách tự động và khách quan hơn. Kết quả nghiên cứu đạt độ tương quan cao so với các phương pháp chẩn đoán lâm sàng truyền thống

Tài liệu tham khảo

  1. A. Dosovitskiy et al., “An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale,” arXiv preprint, 2021. [2] D. Ouyang et al., “Video-based AI for beat-to-beat assessment of cardiac function,” Nature, vol. 580, pp. 252–256, 2020. [3] S. Hochreiter and J. Schmidhuber, “Long Short-Term Memory,” Neural Computation, vol. 9, no. 8, pp. 1735–1780, 1997.