Nâng cao hiệu quả phân tích Protein sửa đổi sau dịch mã trên cơ sở kết hợp mô hình học máy và xử lý ngôn ngữ tự nhiên
Tóm tắt
Nghiên cứu này tập trung nâng cao hiệu quả phân tích các biến đổi sau dịch mã (PTM) của protein, một yếu tố then chốt để hiểu rõ chức năng sinh học và cơ chế bệnh lý. Phương pháp tiếp cận chính là kết hợp mô hình học máy và kỹ thuật xử lý ngôn ngữ tự nhiên (NLP) nhằm khai thác đặc trưng trình tự amino acid như một ngôn ngữ sinh học. Nghiên cứu ứng dụng kiến trúc Transformer và học sâu để dự đoán chính xác các vị trí sửa đổi trên quy mô dữ liệu lớn. Kết quả kỳ vọng sẽ tối ưu hóa độ chính xác so với phương pháp truyền thống, đồng thời tiết kiệm chi phí và thời gian thực nghiệm. Đề tài đóng góp giải pháp công nghệ quan trọng cho tin sinh học, hỗ trợ quá trình khám phá thuốc và phát triển y học cá thể hóa.
Từ khóa
biến đổi sau dịch mã, học máy, xử lý ngôn ngữ tự nhiên, tin sinh học, mô hình Transformer