Thiết kế và triển khai hệ thống nhận dạng ký tự quang học và trích xuất thông tin hóa đơn sử dụng thị giác máy tính kết hợp mô hình ngôn ngữ lớn.
Từ khoá:
Hệ thống nhận dạng ký tự quang học
Thị giác máy tính
Mô hình ngôn ngữ lớn
Trích xuất thông tin hóa đơn
Quản lý tài liệu
Tóm tắt
Đề tài này tập trung vào việc thiết kế và triển khai một hệ thống nhận dạng ký tự quang học (OCR) có khả năng xử lý và trích xuất thông tin từ hóa đơn. Bối cảnh đề tài được đặt trong thực tế, nơi việc quản lý dữ liệu hóa đơn trở nên ngày càng phức tạp. Mục tiêu của nghiên cứu là xây dựng một hệ thống hiệu quả để cải thiện quá trình phân loại và thu thập thông tin từ các hình ảnh hóa đơn. Phương pháp sử dụng kết hợp giữa thị giác máy tính cho việc nhận dạng ký tự và mô hình ngôn ngữ lớn (NLP) để trích xuất nội dung chính. Dự kiến, hệ thống sẽ mang lại những ứng dụng đáng kể trong quản lý tài liệu và phân tích dữ liệu kinh doanh, đóng góp vào sự phát triển của công nghệ OCR.