Ngày 04/11, Zalo AI Challenge 2022 chính thức công bố bộ 3 đề thi và mở cổng cho các đội đăng ký tham gia thi đấu tại https://bit.ly/ZALO-AIChallenge2022.
Sau hơn 4 tháng làm việc liên tục, cuối cùng 7 thành viên ban cố vấn và hơn 20 kỹ sư thuộc ban tổ chức chương trình cũng đã kỳ công hoàn thành 3 đề bài và bộ dữ liệu huấn luyện với sự tham gia đóng góp của hơn 1,000 người, hy vọng mang đến ý nghĩa lớn trong nghiên cứu và thực hành cho cộng đồng AI Việt Nam.
Mỗi đề bài tương ứng với một mảng đang là xu hướng trong lĩnh vực AI. Cụ thể, đề bài thuộc lĩnh vực xử lý ảnh số/video là Liveness Detection – xác định khuôn mặt người trong video là thật hay giả mạo.
Mảng xử lý ngôn ngữ tự nhiên có đề E2E Question Answering – tìm câu trả lời chính xác nhất từ Wikipedia cho một câu hỏi. Đề bài Lyric Alignment – tìm giải pháp để cân chỉnh trùng khớp lời bài hát và nhạc – thuộc mảng xử lý âm thanh.
Theo ông Châu Thành Đức – Data Science Manager tại Zalo AI, đồng thời là phó trưởng ban tổ chức chương trình, các đề bài 2022 dựa trên các vấn đề “nóng hổi” của xã hội Việt Nam và cũng là nhu cầu thiết thực trong cuộc sống thường ngày. “Xác định hình ảnh/video giả mạo, tìm kiếm thông tin trực tuyến, karaoke giải trí là những nhu cầu rất lớn mỗi ngày” – ông bổ sung.
Điểm nổi bật nhất ở Zalo AI Challenge 2022 là yếu tố thời sự của đề bài. Hiện nay, các hoạt động chuyển đổi số định danh bằng khuôn mặt đang diễn ra ở nhiều lĩnh vực quan trọng như ngân hàng, y tế, giáo dục…
Thông qua xác minh khuôn mặt trên điện thoại, người dân không cần trực tiếp đến các cơ sở để giải quyết một số thủ tục, từ đó có thể tiết kiệm thời gian và công sức. Tuy nhiên, việc làm giả khuôn mặt trong hình ảnh, video đang trở nên ngày càng tinh vi.
Với đề bài Liveness Detection, các đội tham gia phải vượt qua thử thách xây dựng mô hình AI có khả năng phân loại các video chứa khuôn mặt thu trực tiếp từ người thật, video giả mạo từ khuôn mặt giả hay video giả đã thu từ trước.
Với thí sinh, đây là đề bài thách thức nhất, còn với ban tổ chức, Liveness Detection chính là bài toán cần chuẩn bị cầu kỳ nhất bởi dữ liệu được thu thập từ người thật.
Để tăng kịch tính, ban tổ chức đã nâng độ khó của đề thi bằng cách cho các tình nguyện viên mang khẩu trang. Sau đó, nguồn dữ liệu giả được tạo ra tương ứng. Nhiệm vụ của các đội là phân loại các dữ liệu giống hệt nhau về mặt hiển thị.
Một thử thách gay cấn khác dành cho các đội thi năm nay là tìm được giải pháp cho đề bài E2E Question Answering. Khi nhập câu hỏi trên internet, mọi người thường sẽ nhận về hàng triệu kết quả, trong đó có rất nhiều kết quả không đúng như mong muốn.
Trong thử thách này, các đội tham gia phải xây dựng được hệ thống có thể đưa ra câu trả lời chính xác cho một câu hỏi cụ thể từ nguồn dữ liệu Wikipedia, giúp người hỏi có được đúng thông tin đang cần.
Về đề bài E2E Question Answering, ông Nguyễn Trường Sơn – Research Science Manager tại Zalo AI – thành viên ban tổ chức cho biết, vẫn là dạng xử lý ngôn ngữ tự nhiên nhưng đề bài năm 2022 thách thức hơn các năm trước.
Ông Sơn giải thích: “Kho dữ liệu của Wikipedia tương đối lớn, các đội phải xây dựng hệ thống gồm nhiều thành phần một cách khéo léo, mỗi thành phần phải hoạt động cho hiệu quả cao thì mới có thể tìm được câu trả lời chính xác trong thời gian cho phép”. Ông cũng chia sẻ, bài toán này rất thực tế bởi hệ thống hỏi đáp là một phần quan trọng của các sản phẩm AI hiện nay như giao tiếp người-máy, các trợ lý giọng nói hoạt động trong các sản phẩm như loa thông minh, nhà thông minh…
Lyric Alignment là bài toán đáp ứng được hình thức giải trí rất phổ biến của người dân Việt Nam, đó là karaoke. Điểm khó là làm sao căn chỉnh phần lời hiển thị (lyric) trùng khớp với phần giai điệu (audio). Trong thử thách này, các đội thi sẽ xây dựng mô hình AI có khả năng căn chỉnh trùng khớp lời bài hát chạy trên nền âm nhạc.
Thành viên ban cố vấn – PGS.TS Quản Thành Thơ – Phó trưởng khoa Khoa Khoa học và Kỹ thuật Máy tính, trường ĐH Bách Khoa, Đại học Quốc gia TP.HCM nhận định: “Bài toán Lyric Alignment có tính học thuật ở cả xử lý âm thanh và xử lý ngôn ngữ tự nhiên. Tính thực tế cũng khá cao khi có thể ứng dụng nhiều hoàn cảnh thực tế, chẳng hạn hỗ trợ sách nói, học phát âm…”.
Theo ban tổ chức, bài toán này còn có thể mở rộng ra áp dụng tạo phụ đề (subtitle) cho các bộ phim, chương trình truyền hình…
Dù trở ngại về mặt địa lý, những nhân sự “nồng cốt” của chương trình cũng đã cố gắng sắp xếp lịch trình dày đặc và nén dung lượng các buổi họp sao cho quá trình thảo luận ý tưởng được thuận tiện và phối hợp nhịp nhàng, đạt hiệu quả cao nhất với mong muốn cuối cùng là tạo nên một cuộc thi chất lượng. Ban tổ chức kỳ vọng, khi vượt qua các đề bài mang tính thử thách cao của Zalo AI Challenge 2022, các sinh viên, kỹ sư trẻ sẽ có thêm kinh nghiệm làm AI thực tiễn, góp nhặt hành trang để tự tin theo đuổi lĩnh vực AI chuyên nghiệp.
Kết quả thi đấu của các đội tham gia trong Zalo AI Challenge 2022 sẽ được chấm điểm tự động và được xếp hạng trên leaderboard real-time tương tự thể thức thi đấu của các nền tảng uy tín trên thế giới. Thời gian thi đấu diễn ra liên tục từ 04.11 đến 06.12.2022.
Chương trình năm nay nâng tổng giá trị giải thưởng lên 15.000 USD. Trong đó, 3 đội quán quân tương ứng với 3 bảng thi đấu sẽ nhận được phần thưởng 3.500 USD/giải, 3 đội á quân sẽ giành về 1.500 USD/giải.
Zalo AI Challenge là cuộc thi thường niên được Zalo tổ chức với mục đích tạo điều kiện thúc đẩy việc nghiên cứu AI trên quy mô rộng, khuyến khích các bạn trẻ tài năng trong lĩnh vực AI tham gia giải quyết các bài toán thực tiễn nhằm đưa trí tuệ nhân tạo vào phục vụ cuộc sống con người. Cuộc thi được tổ chức lần đầu vào năm 2018, đến nay mỗi năm thu hút hàng nghìn đội trong và ngoài nước tham gia thử sức và chứng thực năng lực. |