Nghiên cứu và phát triển hệ thống tổng hợp và phân tích tin tức tiếng Việt đa nguồn dựa trên PhoBERT và các mô hình ngôn ngữ lớn.
Từ khoá:
PhoBERT
mô hình ngôn ngữ lớn
tổng hợp và phân tích tin tức
Tóm tắt
Đề tài này nhằm giải quyết vấn đề quản lý thông tin đa nguồn trong lĩnh vực xử lý ngôn ngữ tự nhiên, đặc biệt là đối với ngôn ngữ Việt Nam. Qua việc ứng dụng PhoBERT và các mô hình ngôn ngữ lớn, mục tiêu của nghiên cứu là xây dựng hệ thống tổng hợp và phân tích tin tức tự động. Phương pháp tiếp cận bao gồm cả nghiên cứu lý thuyết về xử lý ngôn ngữ tự nhiên và thực nghiệm triển khai ứng dụng để thử nghiệm hiệu quả của hệ thống. Kết quả mong đợi sẽ cung cấp giải pháp hữu ích cho việc thu thập thông tin nhanh chóng, chính xác từ nhiều nguồn tin tức khác nhau.