Có gì mới Nỗ lực xử lý thông tin sai lầm của YouTube

Nỗ lực xử lý thông tin sai lầm của YouTube

Người gửi:

Trịnh Chi

18/02/2022

Xem nhanh

Phát hiện thông tin sai lệch mới trước khi chúng lan truyền rộng rãi
Giải quyết vấn đề chia sẻ thông tin sai lệch trên nhiều nền tảng
Tăng cường nỗ lực ngăn chặn thông tin sai lệch trên khắp thế giới
Tiếp tục xây dựng tính minh bạch

Hàng tỷ người trên khắp thế giới tìm đến YouTube vì nhiều lý do. Bất kể bạn muốn xem những cảnh quay của một buổi hoà nhạc hiếm hoi hay dự định học một kỹ năng mới, YouTube là nơi kết nối người xem với một kho tàng nội dung đặc sắc với những tiếng nói đa dạng.

Nhưng tất cả những điều này sẽ không thể thành hiện thực nếu không có cam kết của chúng tôi nhằm bảo vệ cộng đồng YouTube. Đây là nguyên tắc cốt lõi làm nên mọi hệ thống và mọi khía cạnh trong các sản phẩm của chúng tôi.

Cứ vài lần mỗi năm, tôi sẽ công bố về những việc chúng tôi làm ở hậu trường để giải quyết một số thách thức lớn nhất mà YouTube phải đối mặt và sự đánh đổi đằng sau mỗi hành động mà chúng tôi cân nhắc. Trong những bài đăng sau này, chúng tôi có thể sẽ chia sẻ những chủ đề như quá trình phát triển chính sách, và cung cấp thông tin chi tiết về cách giải quyết một vấn đề hóc búa hoặc tóm tắt những cột mốc quan trọng về việc làm tròn trách nhiệm. Ở bài đăng đầu tiên này, tôi muốn tập trung vào nỗ lực hiện tại của chúng tôi trong việc giải quyết thông tin sai lệch có khả năng gây hại trên YouTube.

Trong 5 năm qua, chúng tôi đã đầu tư rất nhiều vào một khung quy chuẩn gọi là 4 nguyên tắc làm tròn trách nhiệm. Chúng tôi kết hợp công nghệ máy học và con người để nhanh chóng gỡ bỏ nội dung vi phạm, gia tăng những nguồn có căn cứ đáng tin và giảm sự lan truyền của những nội dung có vấn đề (tôi đã trình bày cụ thể về lý do có những biện pháp này trong một bài đăng trên blog tại đây). Sự kết hợp của những biện pháp này đóng một vai trò quan trọng trong việc giảm mức độ hiển thị của nội dung chất lượng kém trong khi vẫn duy trì quyền tự do biểu đạt trên YouTube. Tuy nhiên, khi những câu chuyện chứa thông tin sai lệch xuất hiện nhanh chóng và lan truyền rộng rãi hơn bao giờ hết, cách thức xử lý của chúng tôi cũng cần phát triển để bắt kịp. Sau đây là 3 thách thức tiếp theo mà các nhóm của chúng tôi đang tìm cách giải quyết.

Phát hiện thông tin sai lệch mới trước khi chúng lan truyền rộng rãi

Trong nhiều năm, bối cảnh thông tin sai lệch trên mạng chủ yếu chỉ có một số ít câu chuyện chính, chẳng hạn như phong trào đòi sự thật về sự kiện 11/9, thuyết âm mưu về việc con người đặt chân lên mặt trăng và thuyết trái đất phẳng. Những thuyết âm mưu có từ lâu đời này đã xây dựng nên một kho lưu trữ nội dung. Nhờ vậy, chúng tôi có thể huấn luyện hệ thống máy học giảm thiểu việc đề xuất các video đó và những video tương tự dựa trên những đặc điểm chung của loại nội dung đó. Nhưng một câu chuyện hoàn toàn mới có thể nhanh chóng xuất hiện và thu hút nhiều lượt xem, và tình huống này đang ngày một tăng. Ngoài ra, các câu chuyện cũng có thể chuyển từ chủ đề này sang chủ đề khác, ví dụ như đi từ nội dung sức khoẻ nói chung sang việc trì hoãn tiêm vắc-xin. Mỗi câu chuyện cũng có thể có hình thức và thông điệp tuyên truyền khác nhau và đôi khi mang đậm tính địa phương.

Trong giai đoạn đầu của đại dịch COVID-19, chúng tôi đã phải đối mặt với những thách thức này. Có một thuyết âm mưu cho rằng các trạm phát sóng 5G làm lây lan vi-rút corona, khiến người dân phóng hoả đốt các trạm phát sóng tại Vương quốc Anh. Do loại nội dung này rõ ràng có nguy cơ gây ra thiệt hại thực tế, nên chúng tôi đã ứng phó bằng cách cập nhật nguyên tắc và coi đó là nội dung vi phạm. Trong trường hợp này, chúng tôi có thể phản ứng nhanh nhạy nhờ có sẵn các chính sách liên quan đến thông tin sai lệch về COVID-19 dựa trên hướng dẫn của các cơ quan y tế địa phương và toàn cầu.

Nhưng trong tương lai, không phải câu chuyện chuyển biến nhanh nào cũng có sẵn hướng dẫn chuyên môn để giúp chúng tôi đưa ra chính sách phù hợp. Thông tin sai lệch càng mới thì chúng tôi càng có ít ví dụ để huấn luyện hệ thống của mình. Để giải quyết vấn đề này, chúng tôi liên tục huấn luyện hệ thống bằng dữ liệu mới. Chúng tôi cố gắng kết hợp các thuật toán phân loại nhắm đến mục tiêu cụ thể hơn, các từ khoá ở các ngôn ngữ khác, và thông tin từ các nhà phân tích trong khu vực để phát hiện những câu chuyện mà thuật toán phân loại chính của chúng tôi không phát hiện được. Theo thời gian, cách này sẽ giúp hệ thống của chúng tôi hoạt động nhanh hơn và chính xác hơn trong việc phát hiện những câu chuyện sai lệch lan truyền rộng rãi.

Ngoài việc giảm thiểu sự lan truyền của một số loại nội dung, hệ thống của chúng tôi còn giới thiệu cho người xem những video có căn cứ đáng tin trong các kết quả tìm kiếm và video đề xuất. Tuy nhiên, một số chủ đề lại thiếu một lượng lớn nội dung đáng tin cậy (chúng tôi gọi đây là những khoảng trống dữ liệu). Ví dụ: Khi tin tức một vụ thiên tai nổi lên và lan truyền nhanh chóng, hệ quả chúng tôi có thể thấy ngay lập tức là những nội dung chưa được kiểm chứng, trong đó suy đoán về nguyên nhân và số thương vong. Các nguồn đáng tin cậy có thể cần thời gian tạo nội dung video mới. Khi thông tin sai lệch lan truyền nhanh chóng, không phải lúc nào cũng có đủ nội dung có căn cứ đáng tin để chúng tôi có thể cung cấp cho mọi người tham khảo trong thời gian ngắn.

Đối với những sự kiện tin tức lớn, như thiên tai, chúng tôi sẽ hiển thị các bảng tin tức cung cấp diễn biến để hướng người xem đến các bài viết về sự kiện tin tức lớn. Đối với những chủ đề chuyên biệt mà truyền thông có thể không đưa tin, chúng tôi sẽ cung cấp cho người xem các hộp xác minh tính xác thực. Tuy nhiên, việc xác minh tính xác thực cũng mất thời gian và không phải chủ đề mới nổi nào cũng được xác minh. Đối với những trường hợp này, chúng tôi đang thử nghiệm những dạng nhãn khác để thêm vào video hoặc đầu phần kết quả tìm kiếm, giống như một tuyên bố từ chối trách nhiệm để thông báo cho người xem rằng nội dung họ xem thiếu thông tin chất lượng cao. Chúng tôi cũng phải cân nhắc xem việc hiển thị nhãn có vô tình gây chú ý cho một chủ đề có thể không thu hút sự quan tâm hay không. Các nhóm của chúng tôi đang tích cực thảo luận về những điểm đáng cân nhắc này trong quá trình tìm kiếm phương án phù hợp.

Giải quyết vấn đề chia sẻ thông tin sai lệch trên nhiều nền tảng

Một thách thức khác là sự lan truyền các video gần ranh giới vi phạm chính sách bên ngoài YouTube. Đây là những video không thật sự vi phạm các chính sách của YouTube đến mức bị gỡ bỏ, nhưng là những video chúng tôi không thật sự muốn đề xuất cho mọi người. Chúng tôi đã cải tiến toàn bộ hệ thống đề xuất của mình để giảm đáng kể lượt xem của nội dung gần ranh giới vi phạm chính sách do chúng tôi đề xuất xuống dưới 1%. Nhưng ngay cả khi chúng tôi không đề xuất một video gần ranh giới vi phạm chính sách, video đó vẫn có thể nhận được lượt xem từ những trang web nhúng hoặc liên kết đến video đó trên YouTube.

Một phương án khả thi để giải quyết vấn đề này là tắt nút chia sẻ hoặc huỷ đường liên kết trên những video mà chúng tôi đã hạn chế trong phần đề xuất. Phương án này sẽ có hiệu quả trong việc ngăn người dùng nhúng hoặc liên kết một video gần ranh giới vi phạm chính sách đến một trang web khác. Tuy nhiên, chúng tôi gặp khó khăn khi cân nhắc rằng việc chặn tính năng chia sẻ có thể là biện pháp quá mạnh gây hạn chế quyền tự do của người xem. Hệ thống của chúng tôi giảm nội dung gần ranh giới vi phạm chính sách trong phần đề xuất. Tuy nhiên, việc chia sẻ đường liên kết là lựa chọn chủ động của người dùng, khác hẳn với các hoạt động thụ động hơn như xem video đề xuất.

Bối cảnh cũng là một điều quan trọng hàng đầu cần lưu ý. Các video gần ranh giới vi phạm chính sách được lồng ghép trong một nghiên cứu hoặc bản tin có thể cần phương án xử lý ngoại lệ hoặc một phương án khác biệt hoàn toàn. Chúng tôi cần khéo léo cân bằng giữa việc hạn chế sự lan truyền thông tin sai lệch có khả năng gây hại và tạo không gian để thảo luận và cung cấp kiến thức về những chủ đề nhạy cảm và gây tranh cãi.

Một phương án khác là hiển thị một thông báo xen kẽ trước khi người dùng xem video gần ranh giới vi phạm chính sách được nhúng hoặc được liên kết, để thông báo rằng nội dung họ sắp xem có thể chứa thông tin sai lệch. Những thông báo xen kẽ này giống như những chiếc gờ giảm tốc độ trên đường. Bước bổ sung này khiến người xem tạm dừng trước khi xem hoặc chia sẻ nội dung. Trên thực tế, chúng tôi đã dùng thông báo xen kẽ cho nội dung bị giới hạn độ tuổi và video có nội dung bạo lực hoặc phản cảm. Chúng tôi coi đây là một công cụ quan trọng giúp người xem có quyền lựa chọn đối với nội dung họ sắp xem.

Chúng tôi sẽ tiếp tục tìm hiểu kỹ lưỡng các biện pháp khác nhau để đảm bảo việc hạn chế sự lan truyền thông tin sai lệch gây hại trên Internet.

Tăng cường nỗ lực ngăn chặn thông tin sai lệch trên khắp thế giới

Nỗ lực của chúng tôi nhằm hạn chế thông tin sai lệch đã thu về những kết quả bước đầu. Tuy nhiên, các vấn đề phức tạp vẫn còn đó và chúng tôi sẽ cố gắng tăng cường nỗ lực này đến hơn 100 quốc gia và hàng chục ngôn ngữ trong phạm vi hoạt động của chúng tôi.

Quan điểm về những điều làm nên một nguồn thông tin đáng tin cậy sẽ khác nhau theo văn hoá. Tại một số quốc gia, các đài truyền hình công, như BBC tại Vương quốc Anh, được nhiều người công nhận là bên cung cấp tin tức có căn cứ đáng tin cậy. Còn ở những quốc gia khác, các đài truyền hình nhà nước được cọi là mang tính chất tuyên truyền nhiều hơn. Hệ sinh thái nội dung và thông tin tại các quốc gia cũng rất đa dạng, từ các cơ quan truyền thông yêu cầu những tiêu chuẩn xác minh tính xác thực nghiêm ngặt cho đến những cơ quan ít bị giám sát hoặc xác minh. Môi trường chính trị, bối cảnh lịch sử và các sự kiện tin tức nổi bật có thể dẫn đến những câu chuyện chứa thông tin sai lệch mang đậm tính địa phương mà không xuất hiện ở nơi nào khác trên thế giới. Ví dụ: Trong suốt đợt bùng phát dịch bệnh Zika tại Brazil, một số người đổ lỗi rằng các thuyết âm mưu trên thế giới đã gây ra căn bệnh này. Hay gần đây ở Nhật Bản, các tin đồn sai lệch cho rằng một trận động đất đã xảy ra do có con người can thiệp đã lan truyền trên mạng.

Sự đa dạng này của các khu vực đã khiến các nhóm của chúng tôi gặp những vấn đề tương tự như với thông tin sai lệch mới nổi, những câu chuyện liên tục thay đổi và việc thiếu hụt các nguồn thông tin có căn cứ đáng tin cậy. Ví dụ: Hồi đầu đại dịch COVID-19, chúng tôi thấy rằng không phải quốc gia nào cũng có nghiên cứu mới nhất từ các cơ quan y tế địa phương và những cơ quan này đôi lúc lại có hướng dẫn khác nhau.

Nội dung bị coi là gần ranh giới vi phạm chính sách cũng có thể khác nhau đáng kể. Chúng tôi luôn tính đến việc các nguyên tắc dành cho nhân viên đánh giá nội dung có thể được hiểu theo những cách khác nhau ở nhiều ngôn ngữ và nền văn hoá. Chúng tôi cần có thời gian làm việc và truyền đạt với các nhóm cũng như chuyên gia tại địa phương về bối cảnh văn hoá có thể ảnh hưởng đến việc phân loại một video là gần ranh giới vi phạm chính sách hoặc không.

Ngoài việc mở rộng các nhóm của chúng tôi để có thêm nhân sự hiểu rõ những sắc thái riêng theo khu vực liên quan đến thông tin sai lệch, chúng tôi cũng đang tìm hiểu việc đầu tư thêm để hợp tác với các chuyên gia và tổ chức phi chính phủ trên toàn thế giới. Ngoài ra, tương tự như phương pháp tiếp cận những chủ đề mới nổi lên rộng rãi, chúng tôi đang nỗ lực tìm cách cập nhật các mô hình thường xuyên hơn để phát hiện thông tin sai lệch mang đậm tính địa phương, trong đó có tính năng hỗ trợ các ngôn ngữ địa phương.

Tiếp tục xây dựng tính minh bạch

Tại YouTube, chúng tôi sẽ tiếp tục nỗ lực giảm thiểu thông tin sai lệch gây hại trên tất cả các sản phẩm và chính sách của mình, đồng thời tạo điều kiện để những tiếng nói đa dạng được cất lên. Chúng tôi biết rằng mình không có lời giải đáp cho mọi câu hỏi. Tuy nhiên, chúng tôi cho rằng điều quan trọng là phải chia sẻ về những câu hỏi và vấn đề mình đang cân nhắc để đưa ra quyết định. Đây là thời điểm cấp bách hơn bao giờ hết và chúng tôi cần đẩy mạnh những nỗ lực của mình để đảm bảo sự an toàn và ổn định cho cộng đồng YouTube. Tôi sẽ cung cấp thông tin cho các bạn trong suốt quá trình này.

Neal Mohan, Giám đốc sản phẩm, YouTube

Góc quảng cáo