Có gì mới Facebook áp dụng AI giải quyết nội dung xấu độc

Facebook áp dụng AI giải quyết nội dung xấu độc

Người gửi:

18/11/2020

Mới đây, Facebook đã tổ chức một buổi họp báo trực tuyến để giới thiệu cách mà mạng xã hội này áp dụng công cụ trí tuệ nhân tạo (AI) nhằm giải quyết những nội dung độc hại trên nền tảng của mình.

Mỗi ngày có tới 1,82 tỷ người truy cập Facebook từ khắp nơi trên thế giới, nói hàng nghìn ngôn ngữ, đăng hàng tỷ nội dung từ ảnh, video cho đến văn bản.

Hơn 10 năm trước, khi bắt đầu xem xét nội dung, Facebook dựa vào báo cáo của người dùng về những điều họ thấy và cho là không phù hợp. Những nội dung này sau đó được gửi cho nhóm Hoạt động Toàn cầu xem xét và gỡ bỏ những nội dung vi phạm các quy tắc.

Theo Facebook với quy mô hoạt động hiện tại, đây không phải là một mô hình hiệu quả và bền vững. Chính vì thế, khi công nghệ phát triển, hãng sẽ tiếp tục chuyển đổi cách tiếp cận của mình để kiểm duyệt nội dung tốt hơn nữa.

Tại Facebook, có rất nhiều đội ngũ đang làm việc để xác định những nội dung độc hại trên nền tảng của chúng tôi. Trong đó có ba nhóm nắm vai trò quan trọng nhất trong việc kiểm duyệt nội dung:

1. Chính sách nội dung (Content Policy): Nhóm này chính là những người phát triển bộ Tiêu chuẩn cộng đồng, nêu ra những gì được phép và không được phép trên Facebook, tập hợp những người có chuyên môn trong các chủ đề như khủng bố, an toàn trẻ em và nhân quyền, thuộc các lĩnh vực đa dạng như học thuật, luật, thực thi pháp luật và chính phủ.

2. Liêm chính Cộng đồng (Community Integrity): Đội ngũ này chịu trách nhiệm về việc phát triển các công nghệ giúp Facebook thực thi Tiêu chuẩn Cộng đồng trên toàn bộ nền tảng của mình.

3. Hoạt động toàn cầu (Global Operation): Nhóm này thực thi Tiêu chuẩn Cộng đồng thông qua đội ngũ kiểm duyệt viên. Facebook có khoảng 15.000 người kiểm duyệt nội dung cho hơn 50 ngôn ngữ, làm việc tại hơn 20 văn phòng trên toàn thế giới, có mặt tại hầu hết các múi giờ chính – đồng nghĩa với việc họ có thể kiểm duyệt các báo cáo của người dùng 24/7.

Trong những năm vừa qua, công nghệ đóng vai trò rất lớn trong việc kiểm duyệt nội dung tại Facebook.

Công nghệ của Facebook đang ngày một hoàn thiện hơn trong việc phát hiện các nội dung vi phạm Tiêu chuẩn Cộng đồng và tự động gỡ bỏ những nội dung này trước khi được người dùng nhìn thấy. Điều này có nghĩa là Facebook nắm vai trò chủ động trong việc tìm kiếm và loại bỏ nội dung mà không phải phụ thuộc vào báo cáo của người dùng.

Một số cách thức hoạt động của công nghệ trong việc kiểm duyệt nội dung có thể kể đến như:

Phát hiện các báo cáo bị trùng lặp từ người dùng Facebook: Nếu có 1.000 người báo cáo về một nội dung, mạng xã hội này không sử dụng 1.000 người để kiểm duyệt một nội dung giống nhau.
Đảm bảo rằng Facebook sẽ chuyển các báo cáo một cách nhanh chóng tới những người kiểm duyệt nội dung phụ trách đúng chủ đề hoặc có chuyên môn về ngôn ngữ.
Xác định ảnh và video khỏa thân/khiêu dâm trước đây đã bị xóa do vi phạm Tiêu chuẩn Cộng đồng, và tự động xóa những nội dung này nếu chúng xuất hiện ở những nơi khác trên Facebook hoặc Instagram. Mạng xã hội này cũng sử dụng công nghệ xử lý hình ảnh để ngăn chặn việc đăng tải các nội dung về lạm dụng trẻ em và hình ảnh thân mật không có sự đồng thuận.
Ngăn chặn phát tán một số loại nội dung vi phạm rõ ràng Tiêu chuẩn Cộng đồng, như thư rác với mục đích thương mại, hoặc đường dẫn tới các trang web kinh doanh nội dung khiêu dâm.
Ngăn chặn đăng tải các nội dung khủng bố thông qua công nghệ content matching, cho phép Facebook xác định các bản sao của những nội dung xấu độc đã được phát hiện từ trước, và đánh giá xem nội dung đó có khả năng vi phạm chính sách của chúng tôi hay không.

Phần lớn nội dung xóa khỏi Facebook hiện được phát hiện một cách chủ động: Từ tháng 4 đến tháng 6 năm nay, 99,6% tài khoản giả mạo, 99,8% tin rác, 99,5% nội dung và hình ảnh bạo lực, 98,5% nội dung khủng bố và 99,3% ảnh khỏa thân trẻ em và nội dung xâm hại tình dục, 95% nội dung đã xóa khỏi Facebook đã được xác định và xóa bằng công nghệ mà không cần người dùng báo cáo.

Mặc dù Facebook luôn ưu tiên các loại nội dung có hại nhất để kiểm duyệt (chẳng hạn như tự tử, lạm dụng trẻ em hoặc khủng bố), các loại nội dung khác thông thường sẽ được gửi tới đội ngũ kiểm duyệt viên theo trình tự thời gian với các báo cáo của người dùng được ưu tiên hơn nội dung được công nghệ của chúng tôi chủ động gắn cờ.

Tuy nhiên, nhờ vào những tiến bộ của công nghệ trong những năm gần đây, chúng tôi hiện có thể ưu tiên nội dung cần kiểm duyệt, sau khi xem xét một số yếu tố khác như:

Tốc độ lan truyền: Nội dung có khả năng vi phạm đang được chia sẻ nhanh chóng sẽ có sức nặng lớn hơn so với nội dung không có lượt chia sẻ hoặc lượt xem.
Mức độ nghiêm trọng: Nội dung có liên quan đến tác hại trong thế giới thực như tự tử, tự gây thương tích hoặc bóc lột trẻ em sẽ được ưu tiên hơn các danh mục khác như tin rác.
Khả năng vi phạm: Nội dung có các dấu hiệu tương tự với nội dung khác đã vi phạm chính sách của Facebook sẽ được ưu tiên xét duyệt hơn so với các nội dung không giống như đã vi phạm chính sách trước đó.

Việc ưu tiên nội dung theo cách này cho phép mạng xã hội xem xét nội dung có mức độ nghiêm trọng cao nhất trước, bất kể thời điểm nó được chia sẻ trên Facebook hay được người dùng báo cáo hoặc bị phát hiện bởi công nghệ.

Điều đó cũng có nghĩa là kiểm duyệt viên trong nhóm Hoạt động toàn cầu của Facebook dành nhiều thời gian hơn cho các vấn đề nội dung phức tạp, cần có sự cân nhắc kỹ lưỡng và ít thời gian hơn cho các báo cáo có mức độ nghiêm trọng thấp hơn mà công nghệ có khả năng xử lý.

Mặc dù công nghệ ngày càng đóng vai trò quan trọng trong cách kiểm duyệt nội dung trên Facebook, nhưng mạng xã hội này vẫn sử dụng kết hợp công nghệ + báo cáo từ cộng đồng + đánh giá của con người để xác định và kiểm duyệt nội dung theo Tiêu chuẩn Cộng đồng. Bởi vốn dĩ công nghệ không thể hiểu được ngữ cảnh của nội dung tốt như con người.

Khi một người trong nhóm Hoạt động toàn cầu xem một bài đăng trên Facebook, họ sẽ xem toàn bộ bài đăng – bao gồm hình ảnh, văn bản kèm theo và các nhận xét để xác định xem bài đăng đó có vi phạm Tiêu chuẩn Cộng đồng hay không.

Cho đến gần đây, hầu hết công nghệ Facebook sử dụng để kiểm duyệt nội dung đều xem xét từng phần của bài đăng một cách riêng biệt trên hai khía cạnh: loại nội dung và loại vi phạm. Một bộ phân loại sẽ xem ảnh để đánh giá xem ảnh đó có vi phạm chính sách về ảnh khỏa thân hay không, và một bộ phân loại khác sẽ tìm kiếm bằng chứng về bạo lực. Một bộ phân loại riêng biệt khác có thể xem xét văn bản của bài đăng hoặc các nhận xét. Điều này có thể gây khó khăn cho việc hiểu được toàn bộ ngữ cảnh của bài đăng.

Để hiểu toàn diện hơn về nội dung, chúng tôi đã tạo ra công nghệ có tên là Whole Post Integrity Embeddings hoặc WPIE. Nói một cách dễ hiểu, công nghệ này xem xét toàn bộ bài đăng, cho dù đó là hình ảnh, video hay văn bản. Nó cũng tìm kiếm các vi phạm chính sách khác nhau đồng thời bằng cách sử dụng một bộ phân loại, thay vì nhiều bộ phân loại khác nhau cho các nội dung và loại vi phạm khác nhau.

Theo truyền thống, khi phát triển công nghệ để kiểm duyệt nội dung bằng các ngôn ngữ khác nhau, Facebook sẽ cần phát triển một bộ phân loại cho mỗi ngôn ngữ. Với hàng nghìn ngôn ngữ và phương ngữ được sử dụng trên khắp thế giới và hàng triệu ví dụ nội dung được yêu cầu để xây dựng nên một bộ phân loại, đây không phải là một cách tiếp cận có thể mở rộng.

XLM-R là công nghệ mới do Facebook phát triển để có thể hiểu văn bản bằng nhiều ngôn ngữ. Mô hình này được xây dựng trên một ngôn ngữ và sau đó được sử dụng với các ngôn ngữ khác mà không cần thêm dữ liệu đào tạo hoặc ví dụ nội dung.

Với việc mọi người trên Facebook đăng nội dung bằng hơn 160 ngôn ngữ, XLM-R thể hiện một bước quan trọng đối với tầm nhìn của hãng về khả năng kiểm duyệt nội dung trên toàn cầu. Nó giúp mạng xã hội này chuyển đổi sang phương pháp tiếp cận một bộ phân loại cho nhiều ngôn ngữ – trái ngược với một bộ phân loại cho mỗi ngôn ngữ. Điều này đặc biệt quan trọng đối với các ngôn ngữ ít phổ biến hơn, nơi có thể không có sẵn khối lượng lớn dữ liệu để xây dựng thuật toán.

Trí tuệ nhân tạo (AI): Một thuật ngữ rộng đề cập đến khoa học chế tạo máy móc thông minh. AI giúp máy móc có thể học hỏi kinh nghiệm và thực hiện các tác vụ cụ thể (chẳng hạn như kiểm duyệt nội dung).

Học máy/ Máy học (ML): Một loạt AI cho phép máy móc học từ dữ liệu mà không cần phải được lập trình trước.

Thuật toán: Một quy trình hoặc tập hợp các hướng dẫn được máy móc làm theo để giải quyết vấn đề.

Bộ phân loại: Bộ phân loại là sản phẩm cuối cùng sau khi quá trình học máy đã hoàn thành. Bộ phân loại chạy liên tục để ‘phân loại’ (hoặc sắp xếp) dữ liệu thành các danh mục khác nhau.

Học có giám sát: Một loại học máy trong đó con người xây dựng thuật toán bằng cách sử dụng khối lượng lớn dữ liệu. Dữ liệu này được gắn nhãn để giúp máy học và sau khi được đào tạo, hệ thống có thể áp dụng các nhãn này cho dữ liệu mới, ví dụ như phân loại email là thư rác và không phải thư rác.

Học không có giám sát: Một loại học máy trong đó thuật toán cố gắng xác định các mẫu trong dữ liệu, tìm kiếm các điểm tương đồng có thể được sử dụng để phân loại dữ liệu đó. Thuật toán không được đào tạo trước để chọn ra các loại dữ liệu cụ thể, nó chỉ đơn giản là tìm kiếm dữ liệu có thể được nhóm theo các đặc điểm tương đồng, ví dụ như Google Tin tức nhóm các tin bài với nhau về các chủ đề tương tự mỗi ngày.

Cách tất cả những điều này kết hợp cùng nhau: Máy học liên quan đến việc đào tạo các thuật toán với dữ liệu được gắn nhãn, để tạo ra một bộ phân loại có thể tự động phân loại (hoặc sắp xếp) dữ liệu liên tục.

Góc quảng cáo