Tại sự kiện Google I/O, Google đã công bố MUM, mô hình học sẵn được cho biết là mạnh hơn 1000 lần so với BERT.

Dưới đây là thông tin từ Google:

Khi tôi nói với mọi người rằng tôi phát triển Google Tìm kiếm, tôi hay được hỏi, “Vẫn còn việc gì để làm nữa sao?” Câu trả lời ngắn gọn là “Có!” Vẫn còn vô số thách thức mà chúng tôi đang cố gắng giải quyết để Google Tìm kiếm hoạt động tốt hơn cho bạn. Hôm nay, chúng tôi sẽ chia sẻ cách mình giải quyết một vấn đề mà nhiều người trong chúng ta có thể gặp phải: phải nhập nhiều truy vấn và thực hiện nhiều lượt tìm kiếm để nhận được câu trả lời bạn cần.

YouTube video

Hãy xem xét thử trường hợp này: Bạn đã chinh phục ngọn núi Adams. Bây giờ bạn muốn tiếp tục chinh phục núi Phú Sĩ vào mùa thu tới và bạn muốn biết cần phải chuẩn bị gì khác. Hiện tại, Google có thể giúp bạn làm điều này nhưng sẽ phải mất nhiều lượt tìm kiếm được cân nhắc kỹ lưỡng, chẳng hạn như phải tìm kiếm độ cao của từng ngọn núi, nhiệt độ trung bình vào mùa thu, độ khó của các con đường mòn lên núi, thiết bị phù hợp để sử dụng, và nhiều hơn nữa. Phải sau một cơ số lượt tìm kiếm như vậy, cuối cùng bạn mới có thể nhận được câu trả lời mình cần.

Nhưng nếu bạn đang nói chuyện với một chuyên gia leo núi, bạn có thể chỉ cần hỏi một câu: “Tôi nên chuẩn bị gì khác?” Bạn sẽ nhận được câu trả lời chỉn chu bao gồm sự khác biệt của mục tiêu hiện tại và hướng dẫn bạn nhiều yếu tố cần xem xét.

Google công bố MUM, bước tiến mới về AI trong xử lý ngôn ngữ

Ví dụ trên không phải là cá biệt, nhiều người trong chúng ta đang phải đương đầu với đủ các loại công việc đòi hỏi nhiều bước tìm kiếm trên Google mỗi ngày. Trên thực tế, chúng tôi nhận thấy rằng trung bình mọi người cần khoảng tám truy vấn cho các tác vụ phức tạp như thế này.

Các công cụ tìm kiếm hiện nay không đủ phức tạp để trả lời theo cách của một chuyên gia. Nhưng với một công nghệ mới được gọi là Mô hình Hợp nhất Đa nhiệm hay MUM, chúng tôi đang tiến gần hơn đến việc hỗ trợ những loại nhu cầu phức tạp này của bạn. Để rồi trong tương lai, bạn sẽ cần ít lượt tìm kiếm hơn để thực hiện việc cần làm.

Trợ giúp bạn khi không có một câu trả lời đơn giản

MUM sở hữu tiềm năng thay đổi cách Google trợ giúp bạn với các tác vụ phức tạp. Giống như BERT, MUM được xây dựng trên kiến trúc Transformer nhưng mạnh gấp 1.000 lần. MUM không chỉ hiểu ngôn ngữ mà còn tạo ra được ngôn ngữ.

Mô hình này được huấn luyện cùng một lúc qua 75 ngôn ngữ và nhiều tác vụ khác nhau cho phép nó phát triển sự hiểu biết toàn diện hơn về thông tin và kiến thức về thế giới so với các mô hình trước đó. Và MUM là mô hình đa phương thức, do đó nó có thể hiểu được thông tin trên văn bản lẫn hình ảnh, và có thể mở rộng sang nhiều phương thức hơn nữa như video và âm thanh trong tương lai.

Lấy ví dụ câu hỏi về việc leo núi Phú Sĩ: MUM có thể hiểu rằng bạn đang so sánh hai ngọn núi, vì vậy thông tin về độ cao và đường mòn có thể được xem là phù hợp. Mô hình này cũng có khả năng hiểu được, trong ngữ cảnh leo núi, việc “chuẩn bị” có thể bao gồm những thứ như rèn luyện thể lực cũng như tìm kiếm thiết bị phù hợp.

Nhờ có thể đưa ra những hiểu biết sâu sắc dựa trên kiến thức sâu rộng của mình về thế giới, MUM có thể đưa ra các thông tin nổi bật như mặc dù cả hai ngọn núi có độ cao gần như nhau nhưng mùa thu là mùa mưa trên Núi Phú Sĩ nên bạn có thể cần một chiếc áo khoác chống thấm nước. MUM cũng có thể hiển thị các chủ đề phụ hữu ích giúp bạn khám phá sâu hơn như thiết bị được xếp hạng hàng đầu hoặc các bài tập rèn luyện tốt nhất với các gợi ý đến các bài báo, video và hình ảnh hữu ích từ khắp nơi trên web.

Xóa bỏ rào cản ngôn ngữ

Google công bố MUM, bước tiến mới về AI trong xử lý ngôn ngữ

Ngôn ngữ có thể là một rào cản đáng kể trong việc tiếp cận thông tin. MUM có tiềm năng phá vỡ những ranh giới này bằng cách chuyển giao kiến thức giữa các ngôn ngữ khác nhau. Nó có thể học từ các nguồn không được viết bằng ngôn ngữ mà bạn đã dùng viết truy vấn tìm kiếm, và giúp mang thông tin đó đến cho bạn.

Chẳng hạn như có những thông tin thực sự hữu ích về Núi Phú Sĩ viết bằng tiếng Nhật; hiện tại, bạn có thể sẽ không tìm thấy thông tin này nếu bạn không tìm kiếm bằng tiếng Nhật. Nhưng MUM có thể chuyển kiến thức từ các nguồn giữa các ngôn ngữ khác nhau và sử dụng những thông tin chi tiết đó để tìm ra kết quả phù hợp nhất bằng ngôn ngữ bạn chọn. Nhờ đó, trong tương lai, khi bạn đang tìm kiếm thông tin về việc tham quan Núi Phú Sĩ, bạn có thể thấy các kết quả như nơi có tầm nhìn đẹp nhất ra núi, suối nước nóng trong khu vực và các cửa hàng lưu niệm nổi tiếng – tất cả thông tin thường chỉ được tìm thấy khi tìm kiếm bằng tiếng Nhật.

Hiểu được đa dạng các thể loại thông tin

MUM là mô hình đa phương thức, nghĩa là nó có thể hiểu đồng thời thông tin từ các định dạng khác nhau như trang web, hình ảnh và hơn thế nữa. Cuối cùng, bạn sẽ có thể chụp ảnh đôi giày leo núi của mình và hỏi, “Tôi có thể sử dụng chúng để leo núi Phú Sĩ không? ” MUM sẽ hiểu hình ảnh và kết nối nó với câu hỏi của bạn để cho bạn biết rằng liệu đôi giày của bạn sẽ phù hợp hay không. Sau đó, nó có thể hướng bạn đến một blog gồm danh sách các dụng cụ được đề xuất.

Google công bố MUM, bước tiến mới về AI trong xử lý ngôn ngữ

Ứng dụng công nghệ Trí tuệ nhân tạo (AI) tiên tiến vào Google Tìm Kiếm một cách có trách nhiệm

Bất cứ khi nào chúng tôi thực hiện một bước tiến với AI để làm cho thông tin của thế giới trở nên dễ tiếp cận hơn, chúng tôi đều làm một cách có trách nhiệm. Mọi cải tiến đối với Google Tìm kiếm đều trải qua một quá trình đánh giá nghiêm ngặt để đảm bảo chúng tôi đang cung cấp các kết quả hữu ích, phù hợp hơn. Những người dùng góp phần đánh giá chất lượng kết quả tìm kiếm tuân theo Nguyên tắc Xếp hạng Chất lượng Tìm kiếm của chúng tôi sẽ giúp chúng tôi hiểu những kết quả tìm kiếm mà chúng tôi cung cấp giúp mọi người tìm được thông tin hiệu quả như thế nào.

Cũng như cách chúng tôi đã thử nghiệm cẩn thận nhiều ứng dụng của BERT từ khi nó được ra mắt từ năm 2019, MUM sẽ trải qua quá trình tương tự khi chúng tôi ứng dụng các mô hình này trong Google Tìm kiếm. Cụ thể, chúng tôi sẽ tìm kiếm các mẫu có thể cho thấy sự thiên lệch trong học máy (machine learning / ML) để tránh đưa sự thiên lệch vào hệ thống của chúng tôi. Chúng tôi cũng sẽ ứng dụng những kết quả từ nghiên cứu mới nhất về cách giảm lượng khí thải carbon từ quá trình huấn luyện các hệ thống như MUM để đảm bảo Google Tìm kiếm tiếp tục hoạt động hiệu quả nhất có thể.

Chúng tôi sẽ mang đến các tính năng và cải tiến được hỗ trợ bởi MUM cho các sản phẩm của mình trong nhiều tháng và nhiều năm tới. Mặc dù chúng ta đang trong những ngày đầu khám phá MUM nhưng đây là một cột mốc quan trọng hướng tới một tương lai mà Google có thể hiểu tất cả những cách khác nhau mà mọi người giao tiếp và diễn giải thông tin một cách tự nhiên.


Mời bạn gửi ý kiến ở phần bình luận nhé.

Góc quảng cáo