Câu chuyện sử dụng AI để tối ưu hay ưu lo?

Dữ liệu
STEDATA Team
26 tháng 1, 2026
Câu chuyện sử dụng AI để tối ưu hay ưu lo?
AI có thể giúp xử lý dữ liệu nhanh hơn, nhưng không tự tạo ra insight nếu thiếu sự kiểm soát của con người. Một case phân tích Spotify cho thấy: dùng AI để gom nhóm thể loại nhạc chỉ hiệu quả khi Data Analyst hiểu rõ bài toán, đặt đúng yêu cầu và kiểm tra lại kết quả. AI là công cụ tăng tốc, không phải phép màu thay thế tư duy phân tích.

Gần đây có một bài phân tích dữ liệu từ Spotify với bộ dữ liệu khá đầy đủ: tên bài hát, nghệ sĩ, độ phổ biến, năm phát hành… và đặc biệt là thể loại nhạc.

Vấn đề xuất hiện ngay khi nhìn vào cột thể loại: gần 150 thể loại khác nhau.

Thử tưởng tượng việc phân tích hành vi nghe nhạc theo từng thể loại khi số lượng lên tới 150. Việc quan sát, so sánh và rút insight trở nên rất khó khăn. Chưa kể, nhiều thể loại chỉ xuất hiện vài lần, khiến kết quả phân tích không đủ ý nghĩa thống kê. Dưới góc nhìn của Data Analyst, việc chia quá nhiều nhóm vừa làm mô hình dự đoán phức tạp hơn, vừa không mang lại hiệu quả rõ rệt.

Giải pháp phù hợp hơn là gom nhóm các thể loại. Ví dụ:

“east coast hip hop”, “detroit hip hop” đều có thể được xếp vào nhóm Hip Hop.

=> Tức là cần mapping lại các thể loại chi tiết thành những nhóm lớn hơn, có ý nghĩa cho phân tích dữ liệu.

Để tiết kiệm thời gian, AI được sử dụng để hỗ trợ quá trình này. Cụ thể, Grok được yêu cầu:

  • Gom nhóm các thể loại tương đồng

  • Phân loại về các nhóm lớn như Rock, Pop, Hip Hop,…

  • Tuy nhiên, điểm mấu chốt là không thể để AI “chạy mà không kiểm soát”.

Ở lần chạy đầu tiên, AI xử lý rất nhanh nhưng kết quả cho thấy hơn 70% thể loại bị gom vào nhóm “Other”. Nguyên nhân là AI chỉ phân tích kỹ một phần nhỏ danh sách ban đầu, các thể loại còn lại bị phân loại khá cảm tính. Nếu không kiểm tra lại, rất dễ chấp nhận kết quả này trong khi chất lượng phân tích gần như không sử dụng được.

Vấn đề không nằm ở AI, mà nằm ở cách con người sử dụng AI.

Sau khi rà soát lại kết quả, các yêu cầu đối với AI được điều chỉnh rõ ràng hơn:

  • Phân tích toàn bộ danh sách thể loại

  • Không gom vào “Other” khi chưa đánh giá đầy đủ

  • Đảm bảo mỗi nhóm có ý nghĩa phân tích và đủ số lượng để thống kê

Kết quả ở lần xử lý tiếp theo cải thiện rõ rệt: các nhóm dữ liệu hợp lý hơn, insight trở nên rõ ràng và có thể đi sâu phân tích từng dòng nhạc để phát hiện xu hướng.

Những điểm rút ra:

  • AI là công cụ, không phải phép màu. Giá trị chỉ xuất hiện khi người dùng hiểu mình đang làm gì.

  • Cần biết khi nào để AI tự động xử lý và khi nào cần can thiệp.

  • Chạy nhanh không bằng chạy đúng. AI giúp tăng tốc, nhưng con người phải hiểu logic phía sau kết quả.

=> AI không thay thế con người trong công việc phân tích. AI chỉ thực sự nâng cấp giá trị công việc khi được sử dụng đúng cách.