Mạng xã hội đang có trào lưu đăng tải hình ảnh 10 năm trước và hiện tại. Tuy nhiên đây có thể là kịch bản nhằm thu thập dữ liệu người dùng.
Một xu hướng đang rộ lên gần đây trên khắp các trang mạng xã hội Facebook, Instagram và Twitter là đăng ảnh từ 10 năm trước và hiện tại. Tuy nhiên có một vài ý kiến trái chiều xoay quanh phong trào này. Kate O’Neill, một phóng viên công nghệ trang Wired, chia sẻ ý kiến của mình lên Twitter:
Bài tweet nhận được rất nhiều quan tâm với 19.000 likes và hơn 8000 bình luận.
“Tôi không cho rằng bản thân của trào lưu này là nguy hiểm. Nhưng tôi nghĩ đây là một kịch bản để khá hợp lý nhằm vào việc thu thập dữ liệu nhận diện khuôn mặt và mọi người nên cẩn thận. Một lượng dữ liệu cá nhân khổng lồ đang được chia sẻ mà không cần bất kỳ sự yêu cầu nào từ người dùng.” – Kate O’Neill chia sẻ trong bài viết mới nhất của mình trên Wired.
Cũng có nhiều người phản bác lại ý kiến của nữ phóng viên Wired, họ lập luận rằng những bức ảnh vốn đã có sẵn trên mạng xã hội. “Dữ liệu đó đã có sẵn. Facebook đã có tất cả các hình ảnh đó.”
Thật ra thì điều đó cũng có cơ sở. Người dùng mạng xã hội đã đăng hình ảnh của họ lên từ 10 năm trước. Những hình ảnh này tồn tại, có hiển thị mốc thời gian và nhiều người để chế độ công khai và ai cũng có thể thấy được.
Nhưng hãy xem xét ý tưởng này.
Hãy tưởng tượng rằng bạn muốn chuẩn bị một thuật toán nhận dạng khuôn mặt về các đặc điểm liên quan đến tuổi tác, ví dụ, cách mọi người trông như thế nào khi già đi. Hẳn bạn sẽ cần có một bộ dữ liệu rộng và chi tiết với nhiều hình ảnh của mọi người. Sẽ thật hữu ích nếu bạn có một kho ảnh với khoảng thời gian cụ thể, 10 năm chẳng hạn.
Chắc chắn rằng ai cũng có thể khai thác hình ảnh trên Facebook, xem ngày đăng hoặc dữ liệu EXIF. Nhưng những hình ảnh đó chưa chắc đã hữu dụng bởi vì thời gian đăng ảnh không hẳn sẽ trùng với ngày chụp. Ngay cả siêu dữ liệu EXIF trên ảnh cũng sẽ không thể đánh giá chắc chắn được đúng thời điểm. Thêm nữa, đôi khi người dùng đăng ảnh của một ai đó khác chứ không phải mình. Bạn có thể lướt qua ảnh đại diện trên Facebook của bạn bè mình, khá nhiều trong số đó là hình ảnh chó mèo, nhân vật hoạt hình hoặc một ai đó mà họ thần tượng…
Nói cách khác, sẽ tốt hơn nếu bạn có một bộ dữ liệu ảnh sạch sẽ, đơn giản, được chia sẵn mốc thời gian quá khứ – hiện tại, lại có thể dễ truy xuất bằng hashtag.
Thông qua meme trên Facebook mà hầu hết mọi người đều tham gia, các trang mạng xã hội đã bổ sung được mốc thời gian thực một cách hữu ích (ví dụ: Tôi năm 2008 và tôi năm 2018) cũng như có được các thông tin thêm, trong nhiều trường hợp, về nơi và sự kiện trong bức ảnh (ví dụ: được Joe chụp, năm 2008 tại một trường đại học nào đó, năm 2018 đến thăm New City…)
Nói cách khác, nhờ vào trào lưu này, giờ đây các mạng xã hội đã có một bộ dữ liệu rất lớn về những bức ảnh được chọn lựa cẩn thận của mọi người từ khoảng 10 năm trước và bây giờ.
Tất nhiên, không phải tất cả các bình luận bác bỏ trong Twitter của Kate O’Neill đều đề cập đến những bức ảnh đã có sẵn. Một số người phê bình lưu ý rằng có quá nhiều dữ liệu trôi nổi có thể sử dụng được. Các nhà nghiên cứu dữ liệu và nhà khoa học biết làm thế nào để giải thích cho vấn đề này. Như các hashtag bị virus, bạn thường tin tưởng vào tính hợp lệ của dữ liệu trong trào lưu – cho đến khi bị tin tặc tấn công dựa vào hashtag cho các mục đích không liên quan.
Đối với những hình ảnh không có thật, thuật toán nhận dạng hình ảnh đủ tinh vi để chọn ra một khuôn mặt người. Nếu bạn đã tải lên một hình ảnh của một con mèo cách đây 10 năm và bây giờ mẫu dữ liệu này sẽ bị loại bỏ một cách dễ dàng.
Facebook phủ nhận việc có bất kỳ sự can thiệp nào trong #10YearChallenge. Một phát ngôn viên của Facebook cho biết “Đây là một meme do người dùng tạo ra và tự lan truyền. Facebook không khởi đầu xu hướng này và hành vi sử dụng những bức ảnh đã tồn tại trên Facebook từ lâu. Facebook không thu được gì từ trào lưu này. Xin nhắc lại, người dùng Facebook có thể chọn bật/tắt nhận diện khuôn mặt bất cứ lúc nào.”
Thật ngay cả khi meme này không phải là một kịch bản của kỹ thuật xã hội thì vài năm qua đã đầy rẫy những ví dụ về các trò chơi trên mạng xã hội và các trào lưu được thiết kế để trích xuất và thu thập dữ liệu người dùng. Đơn cử là việc trích xuất dữ liệu hàng loạt của hơn 70 triệu người dùng Facebook Hoa Kỳ được thực hiện bởi Cambridge Analytica.
Câu hỏi đặt ra cho vấn đề này là khi một tổ chức nào đó sử dụng ảnh Facebook của bạn để đào tạo một thuật toán nhận dạng khuôn mặt thì có hại gì hay không? Theo một cách nào đó thì điều này là không thể tránh khỏi. Tuy nhiên, điều đáng nói ở đây là mọi người có quyền được lưu ý các tương tác của mình và xem xét các dữ liệu tạo ra. Đồng thời người dùng phải kiểm soát dữ liệu cá nhân của mình có thể được sử dụng ở quy mô nào.
Kate O’Neill đưa ra ba trường hợp sử dụng hợp lý để nhận dạng khuôn mặt: một đúng đắn, một bình thường và một rủi ro.
Trường hợp đúng đắn: Công nghệ nhận dạng khuôn mặt, cụ thể là khả năng tiến triển theo tuổi, có thể giúp tìm kiếm những đứa trẻ bị mất tích. Năm ngoái cảnh sát ở New Delhi đã báo cáo theo dõi gần 3.000 trẻ em mất tích chỉ sau bốn ngày bằng cách sử dụng công nghệ nhận dạng khuôn mặt. Nếu những đứa trẻ đã mất tích một thời gian thì có thể trông hơi khác so với bức ảnh gần nhất được chụp, vì vậy một thuật toán về sự tiến triển tuổi tác đáng tin cậy có thể thực sự hữu ích ở đây.
Tiềm năng nhận diện khuôn mặt chủ yếu là bình thường: Nhận dạng tuổi có lẽ hữu ích nhất cho quảng cáo có mục tiêu. Quảng cáo hiển thị kết hợp camera hoặc cảm biến và có thể điều chỉnh tin nhắn cho phù hợp với một nhóm tuổi (hoặc các đặc điểm dễ nhận biết trực quan khác và bối cảnh rõ ràng) có thể đã phổ biến trước đó rất lâu. Ứng dụng đó không thú vị, nhưng giúp quảng cáo trở nên phù hợp hơn. Nhưng khi dữ liệu đó được kết hợp với các hành vi khác như theo dõi vị trí, phản hồi , mua hàng… thì có thể mang lại một số tương tác đáng sợ khó lường.
Giống như hầu hết các công nghệ mới nổi có khả năng gây ra hậu quả xấu, sự tiến bộ của tuổi tác một ngày nào đó có thể là yếu tố đánh giá bảo hiểm và chăm sóc sức khỏe. Ví dụ, nếu bạn già đi nhanh hơn so với bạn bè cùng nhóm tuổi, bạn sẽ không phải là một rủi ro bảo hiểm tốt. Bạn có thể sẽ phải trả nhiều hơn hoặc bị từ chối bảo hiểm.
Sau khi Amazon giới thiệu dịch vụ nhận dạng khuôn mặt theo thời gian thực vào cuối năm 2016, hãng bắt đầu bán các dịch vụ này cho các cơ quan thực thi pháp luật và chính phủ, chẳng hạn như các sở cảnh sát ở Orlando và Hạt Washington, Oregon. Công nghệ này làm tăng mối quan tâm riêng tư lớn, cảnh sát có thể sử dụng công nghệ này không chỉ để theo dõi những người bị nghi ngờ phạm tội, mà cả những người không phạm tội, như người biểu tình và những người khác mà cảnh sát cho là phiền toái.
Liên minh Tự do Dân sự Mỹ đã yêu cầu Amazon ngừng bán dịch vụ này. Một phần của các cổ đông và nhân viên của Amazon cũng đã yêu cầu tạm dừng dịch vụ này vì lo ngại về giá trị và uy tín của công ty.
Thật khó để nói một cách đầy đủ về cách thức công nghệ tác động đến nhân loại. Luôn có cơ hội để chúng ta để làm cho mọi thứ tốt lên, nhưng để làm được điều đó thì cũng phải nhận thức kịp thời những cách làm cho công nghệ trở nên tệ hơn. Một khi mọi người hiểu các rủi ro của vấn đề thì sẽ cân nhắc được mọi thứ.
Vấn đề ở đây là không phải những điều xấu sẽ xảy ra, bởi vì mọi người đã đăng hình ảnh công khai lên tường của mình. Việc đào tạo các thuật toán nhận dạng khuôn mặt để theo dõi tiến triển tuổi tác và nhận dạng tuổi cũng không phải là xấu.
Điểm chính yếu là tất cả mọi người đều nên hiểu biết hơn về dữ liệu mình tạo ra và chia sẻ, các quyền truy cập mà mọi người cho phép và tổ chức nào sẽ sử dụng các dữ liệu này. Nếu bối cảnh là một ứng dụng trò chơi tuyên bố rõ ràng rằng họ đang thu thập các hình ảnh để nghiên cứu về sự tiến bộ của tuổi tác, thì bạn có thể chọn tham gia hay không, với nhận thức đúng về việc cấp quyền truy cập vào hình ảnh của mình cho một đối tượng rõ ràng.
Bỏ qua các chi tiết về trào lưu hay nền tảng xã hội, thông điệp muốn được truyền tải ở đây là: con người chính là nguồn dữ liệu phong phú nhất cho hầu hết các công nghệ đang nổi lên trên thế giới. Chúng ta nên biết điều này với sự siêng năng và tinh tế.
Con người là mối liên kết giữa thế giới vật lý và kỹ thuật số. Tương tác của mọi người làm cho Internet of Things trở nên thú vị hơn. Dữ liệu của chúng ta là nhiên liệu giúp doanh nghiệp thông minh hơn và có nhiều lợi nhuận hơn.
Dù rằng nên yêu cầu các doanh nghiệp xử lý dữ liệu của chúng ta với sự tôn trọng bằng mọi cách nhưng trước đó, chúng ta cũng nên cẩn thận với dữ liệu của chính mình.