Hầu hết mọi người trên Trái đất có thể nói hai hoặc nhiều ngôn ngữ, nhưng trợ lý ảo hoạt động bằng giọng nói luôn buộc họ phải chọn và sử dụng chỉ một ngôn ngữ—ít nhất là cho đến hôm nay.
Google Assistant hiện là trợ lý ảo đa ngôn ngữ đầu tiên. Người dùng có thể chỉ định rằng họ muốn lắng nghe bằng hai ngôn ngữ trong cài đặt ứng dụng trên điện thoại hoặc loa thông minh Google Home của họ. Sau đó, người có thể gọi ra các yêu cầu hoặc lệnh bằng bất kỳ ngôn ngữ nào. Hét lên “Hey Google, tắt đèn hành lang!” khi bạn rời khỏi nhà, và bóng tối sẽ buông xuống. “¡Hey Google, apaga la luz del pasillo!” cũng sẽ hoạt động.
Johan Schalkwyk, phó chủ tịch của đội kỹ sư âm thanh của Google, cho biết tính linh hoạt mới đó sẽ giúp mọi người cảm thấy tự nhiên hơn khi nói chuyện với loa thông minh của công ty, Google Home—đặc biệt là trong các hộ gia đình nơi không phải ai cũng nói cùng một ngôn ngữ. “Tôi kỳ vọng chúng ta có thể thấy một số hành vi khác nhau, và sự tăng lên trong việc sử dụng,” ông thêm.
Dylan Zwick, đồng sáng lập Pulse Labs, một công ty giúp các doanh nghiệp kiểm thử ứng dụng cho các nền tảng giọng nói như Amazon's Alexa, đồng ý. Trong những ngôi nhà có ông bà hoặc các thành viên khác của gia đình không nói thành thạo ngôn ngữ chính của gia đình, việc biết rằng Google Home hỗ trợ nhiều ngôn ngữ có thể làm cho thiết bị trở nên hữu ích hơn, anh nói.
Hiện tại, Google Assistant có thể được thiết lập để hoạt động bằng hai trong số sáu ngôn ngữ: Tiếng Anh, Tiếng Tây Ban Nha, Tiếng Pháp, Tiếng Đức, Tiếng Ý và Tiếng Nhật. Công ty cho biết sẽ thêm năm ngôn ngữ khác được hỗ trợ bởi trợ lý—Tiếng Hindi, Tiếng Indonesia, Tiếng Hàn, Tiếng Bồ Đào Nha (Brazil) và Tiếng Thái—nhưng từ chối xác định thời gian cụ thể.
Khi danh sách mở rộng, tính năng mới có thể giúp Google thực hiện ambisious của mình là đăng ký người dùng mới trong các thị trường mới nổi như Ấn Độ và Indonesia, nơi thị trường quảng cáo trực tuyến đang phát triển nhanh hơn so với phương Tây.
Để tính năng đa ngôn ngữ hoạt động, Google đã phải đào tạo các thuật toán của mình để xác định đáng tin cậy ngôn ngữ mà người đó đang nói. Đầu tiên, trợ lý cố gắng xác định ngôn ngữ chỉ bằng âm thanh của giọng nói—tương tự như cách một người không thể nói tiếng Đức hoặc tiếng Pháp vẫn có thể biết khi họ nghe thấy những ngôn ngữ đó được nói. Để kiểm tra lại, hệ thống cũng chạy âm thanh qua các bộ nhận diện cho cả hai ngôn ngữ mà người dùng đã kích hoạt. Việc kiểm tra kết quả để xem ngôn ngữ nào hợp lý nhất giúp trợ lý quyết định bằng ngôn ngữ nào để phản hồi.
Trước đó, Google đã phát triển công nghệ nói đa ngôn ngữ. Dịch vụ tìm kiếm bằng giọng nói và nhập văn bản bằng giọng nói trên di động của họ cho phép người dùng sử dụng đến sáu ngôn ngữ. Schalkwyk nói rằng việc mang tính năng đó đến trợ lý mất nhiều thời gian hơn vì nó khó khăn hơn trong việc xác định đúng ngôn ngữ trong một bối cảnh hội thoại—và rủi ro cao hơn khi phần mềm sẽ thực hiện hành động dựa trên những gì nó nghĩ bạn muốn.
Trong quá trình kiểm thử suốt chín tháng qua, khả năng nhận diện ngôn ngữ của Google Assistant đã cải thiện đáng kể, từ khoảng 90% lên khoảng 99%. Đó là điểm mà một công nghệ giọng nói trở nên hữu ích và có thể được tung ra rộng rãi, theo Schalkwyk. “Nếu nó thất bại một trong mười, thì nó tệ,” ông nói. “Một trong một trăm? Wow, tuyệt vời!”
Một phần của sự cải tiến đó đến từ việc đào tạo thuật toán để tốt hơn trong việc nhận biết khi một người có giọng đặc trưng của một ngôn ngữ, như tiếng Anh, thực sự đang nói một ngôn ngữ khác, như tiếng Pháp.
Emre Akkas, đồng sáng lập và CEO của Globalme, một công ty thu thập dữ liệu giọng nói được sử dụng bởi các công ty phát triển giao diện giọng nói, cho biết bước tiến của Google để làm cho trợ lý đa ngôn ngữ cho thấy công nghệ đang trưởng thành: “Đó là một điều phức tạp và có tham vọng để thực hiện."
Akkas rất tò mò xem hệ thống mới của Google sẽ làm thế nào trong các giọng điệu và tình huống đa dạng trong các ngôi nhà của người dùng. Khi Globalme giúp The Washington Post kiểm thử Google Assistant và Amazon's Alexa trên các giọng điệu khác nhau, họ phát hiện ra rằng hiệu suất thay đổi. Google Assistant hiểu tốt hơn người nói từ quê nhà Silicon Valley của nó tại California, so với những người nói với giọng miền Nam Hoa Kỳ, ví dụ. Các giọng đặc trưng của tiếng Tây Ban Nha và tiếng Trung—không phải là hiếm gặp ở Mỹ—thường bị hiểu lầm hơn nhiều. “Nghiên cứu thực tế cho thấy công nghệ này vẫn còn một quãng đường dài để đi,” Akkas nói.
Schalkwyk của Google thừa nhận rằng công nghệ không hoàn hảo, nhưng nói rằng việc sử dụng đa ngôn ngữ hơn sẽ cung cấp dữ liệu ví dụ có thể được sử dụng để đào tạo thuật toán để xử lý tốt hơn với các giọng điệu khác nhau. Anh cũng đang nghĩ về cách làm cho nó thực sự đa ngôn ngữ hơn.
Một thách thức: sự kết hợp của hai ngôn ngữ trong giao tiếp hằng ngày, như Spanglish, hoặc sự pha trộn của tiếng Hindi và tiếng Anh được nói trong một số cộng đồng ở Ấn Độ. Schalkwyk mơ mộng rằng một ngày nào đó Google Assistant sẽ đủ thông minh để tham gia vào những cuộc trò chuyện đó. “Một thách thức trong tương lai là xây dựng một bộ nhận diện duy nhất có thể nhận diện tất cả các ngôn ngữ mà bạn có thể nói,” ông nói.
0 Thích