Mytour blogimg_logo
27/12/2023150

Khi Ở Trong Tự Nhiên, Google Lens Làm Những Gì Não Bộ Con Người Không Thể năm 2025

Công cụ tìm kiếm hình ảnh được trang bị trí tuệ nhân tạo, như Google Lens và Bing Visual Search, hứa hẹn một cách mới để tìm kiếm thế giới - nhưng hầu hết mọi người vẫn nhập liệu vào ô tìm kiếm thay vì đưa camera vào một đối tượng. Chúng ta đã quen với việc tìm kiếm thủ công các vật thể trong khoảng 25 năm qua, thời gian mà các công cụ tìm kiếm đã sẵn có ngay trên đầu ngón tay chúng ta. Hơn nữa, không phải tất cả các đối tượng đều ở ngay trước mắt chúng ta khi chúng ta đang tìm kiếm thông tin về chúng.

Một lĩnh vực mà tôi thấy công cụ tìm kiếm hình ảnh hữu ích là ngoại ô, trong thế giới tự nhiên. Tôi thường xuyên đi bộ đường dài, một hình thức thu xếp từ sự tương tác kỹ thuật số liên tục khiến tôi nghĩ rằng mình đang sống cuộc sống "tốt nhất" của mình trực tuyến. Gần đây, tôi đã trở nên quen thuộc với việc sử dụng Google Lens để nhận diện những thứ tôi thấy dọc đường. Tôi đưa camera điện thoại của mình - trong trường hợp này là một chiếc điện thoại Android với Lens tích hợp vào ứng dụng Google Assistant - vào một cái cây hoặc bông hoa tôi không nhận ra. Ứng dụng đề xuất đối tượng có thể là gì, giống như một phiên bản hiện đại của các bảng giảng giáo dục bạn thường thấy ở các địa điểm nổi tiếng và trong bảo tàng.

Tôi nhận ra sự trớ trêu khi đưa điện thoại của mình vào thiên nhiên trong chính khoảnh khắc tôi đang sử dụng thiên nhiên như một nơi trú ẩn tránh khỏi điện thoại. Nhưng chiếc điện thoại thông minh thực sự là công cụ tối ưu trong trường hợp này. Tôi không kiểm tra Twitter hoặc gửi email. Tôi đang cố gắng đi sâu hơn vào trải nghiệm mà tôi đã có sẵn.

Việc khi ở ngoại ô là ngay cả khi bạn nghĩ bạn biết những thứ là gì, thì thực sự bạn không biết. Có hơn 60,000 loài cây trên thế giới, theo một nghiên cứu từ Tạp chí Kỹ thuật Lâm nghiệp Bền vững. Có 369,000 loại thực vật có hoa, với khoảng 2,000 loài thực vật mạch mới được phát hiện mỗi năm.

Tôi có thể nhận biết được cây hoa gạo ở bờ biển phía đông của Hoa Kỳ (nơi tôi lớn lên) hoặc cây redwood khổng lồ ở Bắc California (nơi tôi sống hiện tại). Nhưng ngoài ra, “bộ não của chúng ta có nhược điểm như cơ sở dữ liệu,” nói Marlene Behrmann, một nhà nghiên cứu não học tại Đại học Carnegie Mellon chuyên về độ chệch nhận thức hình ảnh. “‘Cơ sở dữ liệu’ - bộ não con người - có thông tin về cây cỏ như một danh mục, nhưng trừ khi chúng ta có kinh nghiệm hoặc chuyên môn, một số điều đó sẽ được định nghĩa một cách lô cốt.”

Gõ một loạt từ vào ô tìm kiếm của Google không nhất thiết mang lại kết quả cụ thể, mặc dù cơ sở dữ liệu là rất rộng lớn. “Cây xanh bóng ba lá” đưa ra hơn 51 triệu kết quả. Nhưng Google Lens có thể nhận diện loại cây đó là dầu chó Thái Bình Dương trong vài giây. Ngay trước khi một người bạn và tôi bắt đầu cuộc đi bộ đường dài vào tháng trước, chúng tôi đi qua một đám hoa và cô ấy tự hỏi về bông hoa trắng mềm mại với những chiếc cánh giấy nhăn. Sử dụng Google Lens, chúng tôi biết đó là hoa cúc California. (Sau này, một khám phá sâu sắc cho thấy đó có thể là hoa cúc Matilija.)

Thậm chí tôi còn sử dụng Google Lens để cứu sống một cây cảnh mà một vài người bạn bỏ lại khi họ chuyển đi khỏi thị trấn. "Tên nó là Edwin," họ nói. "Nó chỉ cần rất ít nước và ánh sáng mặt trời. Nó rất dễ giữ sống," họ nói.

Nó đã gần như chết khi tôi cố gắng tìm hiểu qua Google đó là cái gì. Hầu hết lá của nó đã rơi rụng, và thậm chí là cảm giác nhẹ nhàng của gió cũng có thể kích thích sự chết chóc của vài chiếc lá còn lại. Tìm kiếm "cây cảnh xanh nhạt dễ chăm sóc" đưa ra hơn một triệu kết quả. Google Lens, may mắn thay, nhận diện nó là một loại cây trầu bà nào đó. Nghiên cứu thêm nói cho tôi biết rằng việc cứu sống Edwin sẽ là một sự kiện ấn tượng: Tôi sẽ phải cắt cây xuống thành đốn, và hy vọng vào điều tốt nhất. Edwin bây giờ đang cho thấy dấu hiệu của sự sống lại - mặc dù lá mới của nó quá nhỏ, đến nỗi Google Lens chỉ nhận diện nó là một bình hoa.

Lens của Google không phải là một giải pháp hoàn hảo. Ứng dụng, được ra mắt lần đầu tiên vào năm ngoái và được cập nhật vào mùa xuân này, hoạt động khá tốt khi sử dụng trong Google Assistant hoặc trong máy ảnh gốc trên điện thoại Android, miễn là bạn có dịch vụ di động. Việc sử dụng Google Lens trong Google Photos trên iOS - lựa chọn duy nhất cho iPhone - trở thành một vấn đề về việc bò đến mức nó đã được che giấu như thế nào khi bạn nhìn thấy nó, hoặc độ sắc nét của bức ảnh của bạn. Một con thằn lằn năm dòng có một cái đuôi màu xanh đặc biệt, nhưng tính năng Lens trong Google Photos trên iOS vẫn không thể nói cho tôi đó là cái gì. Ứng dụng ngay lập tức nhận diện một con rùa sa mạc mà tôi chụp ở Công viên Quốc gia Joshua Tree vài tháng trước. (Tôi không cần Google Lens nói cho tôi rằng động vật có vẻ ồn ào nằm ở gốc cây, cảnh báo tôi tránh xa, là một rắn lục.)

Tôi hỏi Berhmann cách não bộ xử lý thông tin một cách khác biệt so với (hoặc giống nhau với) những gì Google Lens làm. Điều gì xảy ra khi chúng ta nhận ra rõ ràng một thứ gì đó, nhưng sau đó gặp khó khăn với chi họa; ví dụ, tôi biết đó là một cái cây, nhưng tôi không thể gọi tên nó là cây eucalyptus màu xanh lam. Berhmann nói không có câu trả lời đơn giản, vì có "một số quá trình đang diễn ra đồng thời."

Một số quá trình này là "từ dưới lên," và một số là "từ trên xuống," Berhmann nói. Từ dưới lên mô tả một con đường thông tin từ võng mạc đến vỏ thị giác; bạn nhìn vào một thứ gì đó, như một cái cây, và thông tin nhúng gây ra một mô hình hoạt động trên võng mạc. Thông tin này sau đó di chuyển đến các khu vực thị giác của não bộ của bạn, nơi não bộ của bạn bắt đầu xử lý dữ liệu và cố gắng hiểu ra các dấu hiệu thị giác.

Quá trình xử lý từ trên xuống dựa nhiều vào thông tin ngữ cảnh hoặc thông tin mà người quan sát có từ trước trong môi trường đó. Đó là ít gánh nặng hơn đối với hệ thống thị giác. "Ngay khi họ nhận được cảm giác về những gì họ đang nhìn thấy, phiên từ trên xuống hạn chế khả năng" của nó có thể là gì, Berhmann nói. Cô sử dụng ví dụ về việc ở trong một nhà bếp, thay vì ở ngoại ô với nhiều tác nhân không rõ nguồn gốc. Bạn nhìn thấy một tủ lạnh, vì vậy bạn biết đó là một nhà bếp, và sau đó não bộ của bạn có thể nhanh chóng nhận diện cái nồi trên bếp, cái có ống và tay cầm, như một ấm nước.

Google Lens dựa rất nhiều vào quá trình xử lý từ dưới lên. Nhưng thay vì sử dụng võng mạc của bạn, nó sử dụng máy ảnh điện thoại thông minh của bạn. Thông tin đó sau đó được so khớp với một cơ sở dữ liệu khổng lồ để hiểu được những gì đang được truyền qua ống kính máy ảnh. So với não bộ chúng ta, Google giữ một cơ sở dữ liệu rộng lớn hơn nhiều.

Tất nhiên, Google Lens vẫn là một sản phẩm của Google, điều đó có nghĩa là nó cuối cùng được hỗ trợ bởi quảng cáo. Dù nó mang lại niềm hứng thú nhỏ khi có cơ hội sở hữu cơ sở dữ liệu của thế giới trong túi khi não bộ riêng của tôi bất lực, tôi nhận ra rằng tôi đang giúp đỡ dịch vụ của Google mỗi khi tôi thực hiện một tìm kiếm, mỗi khi tôi chụp một bức ảnh. Và trí tuệ nhân tạo cũng dễ dàng bị độc giả, giống như chúng ta. Nhầm lẫn một bông hoa là một điều, nhầm lẫn một con người là một điều khác.

Nhưng tìm kiếm trực quan cũng khiến tôi cảm thấy như tôi somehow đang tham gia sâu hơn vào thế giới thực trong những khoảnh khắc mà tôi đang trải nghiệm nó, thay vì bị kéo ra khỏi nó bởi cuộc trò chuyện trực tuyến vô tận. Đó là lý do tốt nhất để mang theo điện thoại của bạn khi đi bộ đường dài kế tiếp.

Trần Minh Hoạt

0 Thích

Đánh giá : 4.4 /309