Nghiên cứu và triển khai thuật toán Dynamic Time Warping trong bài toán phân cụm chuỗi thời gian
Từ khoá:
Dynamic Time Warping
Phân cụm chuỗi thời gian
Học máy
Tóm tắt
Tài liệu nghiên cứu sâu về thuật toán Dynamic Time Warping (DTW) và ứng dụng của nó trong việc phân cụm dữ liệu chuỗi thời gian, một dạng dữ liệu phổ biến trong nhiều lĩnh vực như khí tượng và kinh tế. Tác giả trình bày cơ sở lý thuyết về chuỗi thời gian, các phương pháp đo lường độ tương tự và tập trung vào thuật toán DTW để giải quyết vấn đề sự khác biệt về pha và tốc độ giữa các chuỗi. Nghiên cứu triển khai thực nghiệm việc phân cụm, thực hiện chuẩn hóa dữ liệu và đánh giá hiệu quả thông qua các chỉ số như Silhouette. Kết quả chứng minh khả năng của DTW trong việc nhận diện các mẫu tương đồng không phụ thuộc vào sự đồng bộ thời gian
Tài liệu tham khảo
- J. D. Hunter, "Matplotlib: A 2D graphics environment," Comput. Sci. Eng., vol. 9, no. 3, pp. 90–95, 2007.
- F. Pedregosa et al., "Scikit-learn: Machine Learning in Python," J. Mach. Learn. Res., vol. 12, no. 85, pp. 2825–2830, 2011.
- W. McKinney, "Data Structures for Statistical Computing in Python," in Proc. 9th Python Sci. Conf., 2010, pp. 56–61.
- C. R. Harris et al., "Array programming with NumPy," Nature, vol. 585, pp. 357–362, 2020.
- T. Caliński and J. Harabasz, "A dendrite method for cluster analysis," Commun. Stat., vol. 3, no. 1, pp. 1–27, 1974.
- D. L. Davies and D. W. Bouldin, "A Cluster Separation Measure," IEEE Trans. Pattern Anal. Mach. Intell., vol. 1, no. 2, pp. 224–227, 1979.
- P. J. Rousseeuw, "Silhouettes: A graphical aid to the interpretation and validation of cluster analysis," J. Comput. Appl. Math., vol. 20, pp. 53–65, 1987