Cho tất cả những gì chúng ta đã học về—và từ—trí tuệ nhân tạo trong suốt khoảng 60 năm phát triển, một phần nền tảng của mối quan hệ của chúng ta với nó thường xuyên được giữ lại: sự hiểu biết sâu sắc của con người về cách mô hình học máy phức tạp nghĩ ở mức độ toàn cầu.
Tiến sĩ Jan Ittner, Giám đốc Sở Hữu Trí Tuệ Nhân Dữ Liệu tại BCG, có thể cuối cùng đã có một câu trả lời.
Hãy chào đón FACET, một giải pháp mã nguồn mở do BCG GAMMA xây dựng, nhằm cung cấp các giải thích toàn cầu chính xác về mô hình học máy. Được phát triển bởi Ittner để đáp ứng mong muốn của khách hàng muốn hiểu rõ và tối ưu hóa quy trình sản xuất của họ, FACET được xây dựng để trang bị cho những nhà khoa học dữ liệu có khả năng đi một bước xa hơn so với quan điểm cục bộ chỉ của một dự đoán duy nhất—thay vào đó, giúp họ cuối cùng hiểu và đánh giá sự phụ thuộc và tương tác của tất cả các biến trong một mô hình "hộp đen" như một toàn bộ. Lần đầu tiên, các nhà khoa học có một công cụ tiện lợi để giúp các mô hình học máy giải thích những gì đang diễn ra sau bức màn của chúng ở mức độ toàn cầu.
"Tôi vẫn nghe thấy các nhà thống kê và nhà khoa học dữ liệu nói—không biết đến FACET—rằng loại công việc mà nó thực hiện là không thể thực hiện được," Ittner nói.
Nhờ có Ittner và đội của anh, giờ đây có thể thực hiện được. Được ra mắt phối hợp với scikit-learn, một thư viện học máy phổ biến cho Python, FACET được xây dựng theo mô hình của lý thuyết trò chơi—một lĩnh vực nghiên cứu gần 100 năm về cách các yếu tố cá nhân kết hợp để ảnh hưởng đến một kết quả cuối cùng đã thu hút sự quan tâm ngày càng tăng từ các nghiên cứu trí tuệ nhân tạo trong những năm gần đây.
"Nếu bạn nghĩ về một trò chơi với những người chơi, và có năm người chơi trong trò chơi... và họ đều đưa ra lựa chọn và đóng góp chung vào một kết quả, họ (mỗi người) nên được đánh giá như thế nào về kết quả đó?" Ittner nói. "Cơ bản là câu hỏi chính là, nếu bạn loại bỏ người chơi khỏi trò chơi, kết quả sẽ cải thiện hoặc tồi tệ đi như thế nào?"
Lịch sử cho thấy không thiếu những phương pháp khác nhau để trả lời câu hỏi đó. Nhưng Ittner tìm thấy nguồn cảm hứng cho FACET trong SHAP (SHapley Additive exPlanations), một phương pháp lý thuyết trò chơi mới và phổ biến để giải thích các đầu ra của một mô hình học máy.
"Điểm sáng của phương pháp SHAP là chúng ta chỉ cần nói rằng các biến khác nhau là những người chơi, và dự đoán là trò chơi," Ittner nói. "Vì vậy, tôi yêu cầu mô hình đưa ra dự đoán—dự đoán này sẽ thay đổi như thế nào sau khi loại bỏ một hoặc nhiều biến này?"
Nhưng việc giải thích hành vi tổng quát của mô hình vượt ra ngoài các dự đoán cá nhân của nó—và tổ hợp các tương tác phức tạp giữa các biến—đơn giản không khả thi mà không có một thuật toán có thể sử dụng. Xác định sự phụ thuộc và tương tác giữa một tập hợp được lựa chọn cẩn thận các biến trước đây là một quy trình thủ công và thám hiểm. Bây giờ FACET có thể làm điều đó nhanh chóng và toàn diện—tất cả chỉ bằng một cú nhấn nút. Mượn ý tưởng từ phương pháp SHAP, FACET đánh giá hàng nghìn dự đoán cá nhân để xác định mối quan hệ mà một mô hình phát hiện ra giữa các biến trong quá trình đào tạo của nó.
"Luôn có sự đánh đổi này—hoặc bạn có một mô hình đơn giản... và bạn khá hiểu nó đang làm gì, hoặc bạn có một mô hình 'hộp đen' mạnh mẽ, nhưng lại phức tạp đến mức không có con người nào có thể hiểu nó," Ittner nói. "Và đó là nơi mà FACET chạm tới—nó lấy một mô hình 'hộp đen' phức tạp, nhưng giải thích nó một cách dễ tiếp cận cho những nhà khoa học dữ liệu."
Chuyển từ dự đoán sang giải thích
Tác động kinh doanh của FACET đối với cả Ittner và khách hàng của ông là đáng kể—điều này có nghĩa là họ cuối cùng cũng có thể giải quyết những câu hỏi phổ biến về cách một mô hình học máy đưa ra dự đoán của nó. Nhưng tác động đầy đủ của FACET vượt xa khỏi chỉ BCG. Thực sự, sự xuất hiện của nó có thể giúp định rõ ranh giới mới của ngành khoa học dữ liệu—sử dụng trí tuệ nhân tạo để giải thích, chứ không chỉ là dự đoán.
“Nhìn chung, tôi nghĩ sự xuất hiện của công nghệ trí tuệ nhân tạo có thể giải thích như FACET sẽ chuyển sự tập trung từ 'sử dụng trí tuệ nhân tạo để dự đoán' sang 'sử dụng trí tuệ nhân tạo để giải thích'—đào tạo các mô hình dự đoán với mục tiêu cuối cùng là phân giải chúng và rút ra các lý thuyết mà mô hình đã phát triển về thế giới thực," Ittner nói.
Đó là một sự khác biệt khá sâu sắc. Hãy xem ngành công nghiệp dược phẩm ví dụ, nơi quy trình sản xuất thuốc yêu cầu hàng nghìn tham số cho nguyên liệu thô, cấu hình thiết bị và thực hiện quy trình. Truyền thống, một thuật toán học máy đánh giá các biến như vậy sẽ được sử dụng đơn giản để dự đoán kết quả của quy trình sản xuất (như chất lượng hoặc lợi suất). Nhưng với FACET, một mô hình có thể hoạt động như một công cụ cho thử nghiệm ảo, xác định sự tương tác của các tham số quy trình để quy trình sản xuất như một toàn bộ có thể được hiểu và được tối ưu hóa—qua các mô phỏng có thông tin. Nói cách khác, đó là bước chuyển từ 'lợi suất của bạn sẽ là X' sang 'đây là những gì bạn cần phải làm để sản xuất lợi suất X'.
“Luôn luôn là về, 'Mô hình dự đoán một cách chính xác mức gián đoạn như thế nào?', hoặc 'Nó có thể dự đoán mong muốn của người tiêu dùng một cách chính xác như thế nào?'?,” Ittner nói. “Tôi đang nói rằng trong nhiều trường hợp chúng ta thậm chí không sử dụng (các mô hình) để dự đoán—sự thay đổi thực sự là, tôi đào tạo một mô hình, và sau đó tôi đi phân tích nó và tôi không bao giờ có ý định sử dụng nó để đưa ra dự đoán.”
BCG đã chứng kiến sự áp dụng sớm trong số các khách hàng sản xuất của mình. Sự áp dụng này có thể mở rộng trong năm 2021: trang bị những thông tin cấp độ toàn cầu như vậy, các nhà khoa học dữ liệu ở mọi ngành công nghiệp và trường hợp sử dụng có thể chuyển đến các mô hình học máy để hiểu và cải thiện các kết quả thương mại, xã hội và đạo đức thực tế một cách chưa từng có.
Thương mại
Từ sản xuất đến vận chuyển, các trường hợp sử dụng thương mại của FACET có vẻ không có giới hạn. Các tối ưu hóa chuỗi cung ứng là mục tiêu dễ dàng, nơi mà các nhà khoa học dữ liệu có thể xác định một cách hiệu quả hơn các yếu tố hệ thống góp phần vào việc chậm trễ sản xuất, chất lượng sản phẩm kém, hoặc hết hàng. Bầu trời có lẽ là giới hạn cho các ứng dụng kinh tế khác. Các nhà sản xuất thời trang có thể dễ dàng chứng minh việc sản xuất các sản phẩm mới khi họ hiểu rõ về tại sao chúng có khả năng thành công trên thị trường. Nhà bán lẻ có thể tối ưu hóa chiến lược khuyến mãi và đa dạng hàng hóa dựa trên việc hiểu rõ hơn về những gì thúc đẩy nhu cầu của khách hàng ở các địa điểm và mùa khác nhau. Các đội thể thao có thể làm rõ hơn các kết hợp yếu tố dinh dưỡng, huấn luyện và thời gian nghỉ nghơi dẫn đến hiệu suất thể thao cao nhất. BCG thậm chí còn lạc quan rằng FACET có thể vẫn có tác động tích cực đối với hiệu suất sản xuất của một số loại vaccine COVID-19.
Xã hội
Hiểu biết về số lượng biến vô hạn ảnh hưởng đến kết quả sức khỏe công cộng từ một cộng đồng—để không nói đến một cá nhân—đã lâu nay là thách thức lớn đối với các nhà làm chính sách và nhà nghiên cứu. Nhưng để thiết kế chính sách hoặc biện pháp can thiệp thực sự hiệu quả đối với, ví dụ, béo phì ở trẻ em hoặc ung thư da, yêu cầu phải hiểu rõ tất cả các biến xã hội liên quan đang tham gia—đó là sự khác biệt giữa giải quyết vấn đề thực sự, so với chỉ một cái nhìn chung về vấn đề. FACET giải quyết chính xác vấn đề đó. Nó không thay thế sự cần thiết của lý thuyết khoa học đúng đắn hoặc xác nhận các biến chính quan trọng, nhưng nó có thể cung cấp một đánh giá mạnh mẽ (hoặc bác bỏ) các giả thuyết, và thậm chí có thể phát hiện ra các kết nối không ngờ giữa các biến tạo nên các lý thuyết mới để kiểm tra tiếp theo.
Đạo đức
Mọi người luôn khó khăn để thực sự khách quan. Chúng ta quá dễ bị tác động bởi quá nhiều tiềm ẩn tư duy không tự ý, ngay cả khi chúng ta nghĩ rằng mình đang giữ vững lập trường. Vấn đề trở nên phức tạp khi chúng ta thiết kế một mô hình học máy sử dụng dữ liệu lịch sử để đưa ra dự đoán—những dữ liệu như vậy bị ô nhòm bởi các quyết định trước đó của những con người không tự ý thiên vị, và điều này hiện đang chuyển qua mô hình. “Làm mù” mô hình cũng không giúp: thậm chí khi chúng ta giữ lại thông tin có độ chệch từ mô hình (giới tính, dân tộc, v.v.), một trí tuệ nhân tạo được thiết kế để suy luận ra bất kỳ độ chệch nào từ các biến phụ trong dữ liệu lịch sử chúng ta cung cấp, và sau đó lặp lại độ chệch đó ngay trong dự đoán cuối cùng của nó. Độ chệch đã lan rộng; mô hình chỉ thực sự khách quan như người thiết kế của nó và dữ liệu của nó. Một công cụ như FACET, tuy nhiên, có thể phát hiện ra loại độ chệch này, cho thấy những người phân tích cách một mô hình đưa ra các dự đoán cuối cùng của mình—và tự do làm nổi bật nơi nó (giống như những người tiền nhiệm con người của nó) dựa trên tiêu chí không phù hợp. Điều này có tác động sâu sắc trong các quy trình thường gặp khó khăn với độ chệch tiềm ẩn, như đơn xin vay mượn hoặc thị thực nhập cư.
Nói ngắn gọn, Ittner và đội ngũ của anh ấy đã mở rộng trên một thế kỷ lý thuyết toán—và sự giàu có từ nghiên cứu của cộng đồng trí tuệ nhân tạo—với một công cụ có thể, theo thời gian, ảnh hưởng đến gần như mọi khía cạnh của cuộc sống con người. Nếu điều đó nghe có vẻ đột phá, phải rồi—bởi vì đó là sự đột phá.
“FACET là, theo kiến thức của tôi, lần đầu tiên bạn có một công cụ rất mạnh mẽ—với một lý thuyết mạnh mẽ ở phía dưới nó—để có được cái nhìn toàn cầu về cách các biến trong mô hình kết nối với nhau—mô hình làm gì,” Ittner nói.
“Đối với các nhà khoa học dữ liệu, đó là một bước tiến lớn.”
Chuyện này được sản xuất bởi blog.mytour.vn Brand Lab cho Boston Consulting Group.
0 Thích