Ứng dụng mô hình lai Vision Transformer và LSTM trong dự đoán thời điểm co rút theo chu vi từ chuỗi ảnh tim mạch.
Từ khoá:
Siêu âm tim
Vision Transformer (ViT)
LSTM
Phân tích chuỗi ảnh
Tóm tắt
Đồ án đề xuất giải pháp y tế thông minh kết hợp giữa Vision Transformer (ViT) và LSTM để phân tích chuỗi ảnh siêu âm tim. ViT đảm nhận việc trích xuất đặc trưng không gian chi tiết từ các khung hình, trong khi LSTM học các phụ thuộc thời gian để dự đoán chính xác thời điểm co rút của cơ tim. Phương pháp này giúp bác sĩ đánh giá chức năng thất trái và chẩn đoán sớm các bệnh lý tim mạch một cách tự động và khách quan hơn. Kết quả nghiên cứu đạt độ tương quan cao so với các phương pháp chẩn đoán lâm sàng truyền thống
Tài liệu tham khảo
- A. Dosovitskiy et al., “An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale,” arXiv preprint, 2021. [2] D. Ouyang et al., “Video-based AI for beat-to-beat assessment of cardiac function,” Nature, vol. 580, pp. 252–256, 2020. [3] S. Hochreiter and J. Schmidhuber, “Long Short-Term Memory,” Neural Computation, vol. 9, no. 8, pp. 1735–1780, 1997.