Mytour blogimg_logo
27/12/202350

Hạn chế Dữ liệu Mới Của Facebook Sẽ Ràng Buộc Ngay Cả Các Nhà Nghiên Cứu Trung Thực năm 2025

Tuần trước, khi tin tức (một lần nữa) lan truyền rằng Cambridge Analytica đã được cho là đã lạm dụng dữ liệu của 50 triệu người dùng Facebook, điều này ngay lập tức đặt ra một câu hỏi khó khăn: Khi một công ty sở hữu thông tin về khoảng 2 tỷ người, trách nhiệm hàng đầu của nó là chia sẻ thông tin đó hay bảo vệ nó?

Câu trả lời không đơn giản như bạn có thể nghĩ. Đối với các nhà khoa học xã hội và máy tính, Facebook có lẽ là kho dữ liệu có giá trị nhất trên trái đất. Có thể có những thông tin quan trọng về nhiều vấn đề bức xúc nhất của thời đại chúng ta, từ vai trò của truyền thông xã hội trong quá trình chính trị đến tác động của công nghệ đối với sức khỏe cá nhân, có thể nằm trong các máy chủ mạng xã hội này - điều này đã khiến nhiều nhà khoa học và nhà quyết định chính sách kêu gọi có thêm các ranh giới thâm nhập hơn giữa những người nghiên cứu công cộng và dữ liệu riêng tư của Facebook.

Nhưng sau đó, Cambridge Analytica đã xảy ra, và khiến nhiều nhà nghiên cứu hoảng sợ: Việc tiếp cận dữ liệu của Facebook đã khó khăn hơn nhiều so với những gì mà họ muốn. Phản ứng của công ty sau một trong những thảm họa công cộng tàn khốc nhất của nó đến nay sẽ ảnh hưởng như thế nào đến quyền truy cập của họ trong tương lai?

Vào ngày thứ Tư, họ nhận được dấu hiệu đầu tiên của một câu trả lời. Trong một bài đăng trên tường Facebook của mình, Mark Zuckerberg thừa nhận sự thất bại của công ty mình trong việc bảo vệ dữ liệu người dùng và phác thảo cách mạng xã hội sẽ bảo vệ dữ liệu đó trong tương lai. Điều quan trọng đối với nhà nghiên cứu là bước thứ hai trong kế hoạch ba bước của Facebook:

...chúng tôi sẽ hạn chế truy cập dữ liệu của các nhà phát triển thêm nữa để ngăn chặn các loại lạm dụng khác. Ví dụ, chúng tôi sẽ loại bỏ quyền truy cập của các nhà phát triển vào dữ liệu của bạn nếu bạn không sử dụng ứng dụng của họ trong 3 tháng. Chúng tôi sẽ giảm số liệu mà bạn cung cấp cho một ứng dụng khi bạn đăng nhập - chỉ còn tên của bạn, ảnh đại diện và địa chỉ email của bạn. Chúng tôi sẽ yêu cầu các nhà phát triển không chỉ được phê duyệt mà còn phải ký hợp đồng để yêu cầu bất kỳ ai để truy cập vào bài đăng hoặc dữ liệu riêng tư khác của họ. Và chúng tôi sẽ có thêm các thay đổi để chia sẻ trong vài ngày tới.

Để hiểu được cách những thay đổi này có thể ảnh hưởng đến nghiên cứu, việc hiểu các cách mà các nhà khoa học hiện tại có thể tiếp cận dữ liệu người dùng của Facebook sẽ giúp ích.

Phương pháp một là rõ ràng: Làm việc tại Facebook. Trước đây, các công ty sẽ giao việc phân tích dữ liệu cho bên thứ ba, nhưng Facebook có đủ khả năng để thuê các nhà tâm lý học, nhà xã hội học và nhà khoa học dữ liệu làm việc toàn thời gian. Điều đó không có nghĩa là nhân viên của công ty được cấp quyền hoàn toàn tự do: Không một nhân viên nào của Facebook có quyền truy cập vào toàn bộ dữ liệu của công ty vào mọi thời điểm. Đáng để khen ngợi, Facebook có một quy trình xem xét đạo đức nội bộ để đánh giá các nghiên cứu của công ty, điều này có nghĩa là quyền truy cập thông tin được cấp dựa trên nhu cầu sử dụng và được kiểm toán. (Chính sách này được tạo ra sau nghiên cứu lan truyền cảm xúc nổi tiếng của Facebook, một trong những sai lầm của công ty.) Theo một cựu thành viên của nhóm Nghiên cứu Dữ liệu cốt lõi của Facebook, người từ chối tiết lộ tên trong câu chuyện này, quy trình này được kiểm soát nghiêm ngặt. "Nếu bạn đào sâu vào bất cứ điều gì mà rõ ràng bạn không được phép, bạn sẽ bị sa thải."

Phương pháp thứ hai là hợp tác với Facebook như một đối tác theo một cách thức chính thức nào đó. Điều này có thể có nhiều ý nghĩa khác nhau. Ví dụ, gần đây, Facebook đã cấp quyền cho nhà kinh tế học của Stanford là Raj Chetty và một nhóm nhà nghiên cứu truy cập vào một lượng lớn dữ liệu người dùng không nhận dạng được, để hỗ trợ các cuộc điều tra về bất bình đẳng thu nhập ở Mỹ. (Những biểu đồ thống kê của New York Times về số phận của các chàng trai da đen ở Mỹ? Chúng được dựa trên công việc của Chetty.)

Nhưng mối quan hệ của Chetty với Facebook khá độc đáo. Một trong những cách thông thường hơn mà Facebook hợp tác với giới học thuật là thuê các ứng viên tiến sĩ làm thực tập có trả lương, biến họ thành nhân viên toàn thời gian có thời hạn cố định. Điều đó cũng có nghĩa là họ ký tất cả những điều nhân viên ký, bao gồm các thỏa thuận về tài sản trí tuệ và không tiết lộ thông tin. Sinh viên tiến sĩ có thể dành nhiều thời gian với dữ liệu nguyên thủy, nhưng mọi phân tích đều diễn ra hoàn toàn trên cơ sở hạ tầng của Facebook. Và khi kỳ thực tập của ứng viên kết thúc, các nhóm chính sách và bảo mật của Facebook đảm bảo mọi dữ liệu họ mang theo - để tiếp tục làm việc để xuất bản ví dụ - chỉ tồn tại dưới dạng tổng hợp. (Một cách hợp tác liên quan khác là thuê các nhà nghiên cứu làm nhà thầu; họ cũng có quyền truy cập - và các thỏa thuận không tiết lộ thông tin.)

Cấp độ truy cập thứ ba là tận dụng dữ liệu của Facebook thông qua giao diện lập trình ứng dụng của nó (API). Đây là cách mà nhà tâm lý học Aleksandr Kogan đã có thông tin về khoảng 50 triệu người dùng Facebook, thông qua một trò quiz trên ứng dụng được gọi là thisismydigitallife. Các nhà nghiên cứu vẫn sử dụng các ứng dụng để thu thập dữ liệu từ người dùng đồng ý tham gia nghiên cứu - mặc dù ít hơn nhiều so với khi Kogan làm vào năm 2014. Ngôn ngữ trong bài đăng của Zuckerberg cho thấy Facebook sẽ hạn chế truy cập dữ liệu thông qua ứng dụng thêm nữa trong tương lai, tuy nhiên không chỉ rõ mức độ của hạn chế đó, hoặc cách áp dụng vào nhà nghiên cứu cụ thể.

"Tôi nghĩ rằng mối quan tâm chính của Facebook với loại vấn đề đó sẽ chủ yếu liên quan đến các nhà phát triển ứng dụng và các tập đoàn, nhưng nó có thể chắc chắn ảnh hưởng đến các nhà khoa học như một phản ứng phụ," nhà khoa học xã hội của MIT Dean Eckles nói, người thường xuyên tích hợp dữ liệu từ Facebook vào nghiên cứu của mình. Điều này cũng có thể đồng nghĩa với việc có nhiều công việc giấy tờ hơn đối với bất kỳ ai muốn truy cập dữ liệu thông qua API - điều này không nhất thiết là điều tồi tệ; các nhà nghiên cứu có uy tín, Eckles nói, "sẽ sẵn lòng vượt qua những rào cản đó."

Không rõ ràng là các hạn chế của Facebook sẽ ảnh hưởng đến những nhà nghiên cứu không tiến hành nghiên cứu dựa trên ứng dụng. Solomon Messing, giám đốc của Trung tâm Nghiên cứu Dữ liệu của Viện Nghiên cứu Pew, phụ thuộc vào Giao diện lập trình ứng dụng (API) của Facebook để nghiên cứu tác động của lời nói của quốc hội trên nền tảng này. "Chúng tôi quan tâm đến việc giao tiếp của cử tri, cách khán giả của họ phản ứng với các dạng tin nhắn khác nhau, và API cho chúng tôi khả năng nhận văn bản về những gì các thành viên nói và dữ liệu tương tác người dùng - như, bình luận, chia sẻ, và những điều tương tự." Ông nói rằng việc có ảnh hưởng của việc kiểm soát của Facebook đối với nghiên cứu của ông sẽ phụ thuộc vào những điều cụ thể - cách mà công ty chọn để hạn chế truy cập dữ liệu, và những loại quy trình phê duyệt mà ông sẽ cần phải trải qua trong tương lai. "Nhưng tôi hy vọng rằng nhà nghiên cứu học thuật sẽ có thể truy cập vào bất cứ điều gì cần thiết cho họ để thực hiện nghiên cứu của mình một cách đạo đức và hợp pháp."

Oh, và một số tính minh bạch cũng sẽ rất tốt, theo Catherine Brooks, giám đốc của Trung tâm Xã hội và Nghiên cứu Dữ liệu tại Đại học Arizona. "Có một thế giới tri thức bên trong Facebook, và những câu hỏi mà chúng ta không thể trả lời trừ khi chúng ta có quyền truy cập vào dữ liệu đó," bà nói. "Nhưng công chúng cũng cần thông tin hơn về cách thức thu thập và sử dụng dữ liệu đó, cũng như có cơ hội đồng ý cung cấp nó."

Thách thức cho Facebook sẽ là phân bổ các nguồn lực cần thiết để thực hiện điều đó. Hiện tại, công ty sở hữu một số dữ liệu xã hội tốt nhất trên thế giới. Trách nhiệm chính của họ là chia sẻ hoặc bảo vệ dữ liệu? Những nhà nghiên cứu có trách nhiệm nghĩ rằng câu trả lời là có.

Đối Mặt với Sự Controversy

  • Sau những ngày im lặng về vụ bê bối Cambridge Analytica, Mark Zuckerberg đã viết một bài đăng trên Facebook.
  • Facebook đã gặp khó khăn trong việc đáp ứng với những phát hiện về Cambridge Analytica.
  • Đọc câu chuyện của blog.mytour.vn về hai năm gian khó bên trong Facebook.
Trần Minh Hoạt

0 Thích

Đánh giá : 4.2 /163