Bạn, một người hiện đang trên internet nói tiếng Anh vào Năm Đại dịch, chắc chắn đã thấy thông tin dịch vụ công cộng về Covid-19. Bạn có thể đã không tránh khỏi việc thấy rất nhiều thông tin về nó, cả online và offline, từ poster về rửa tay đến băng keo giữ khoảng cách xã hội, đến các video hướng dẫn về đeo khẩu trang.
Nhưng nếu chúng ta muốn tránh dịch lan đến tất cả mọi người trên thế giới, thông tin này cũng phải đến được tất cả mọi người trên thế giới—điều đó có nghĩa là dịch các thông điệp về Covid sang càng nhiều ngôn ngữ càng tốt, một cách chính xác và phù hợp văn hóa.
Dễ dàng bỏ qua tầm quan trọng của ngôn ngữ đối với sức khỏe nếu bạn trên internet tiếng Anh, nơi mà "cơn đau đầu này có đáng lo lắng không?" chỉ cần một bài viết trên Wikipedia hoặc tìm kiếm trên WebMD là có ngay câu trả lời. Đối với hơn một nửa dân số thế giới, người ta không thể trông chờ vào việc tìm kiếm triệu chứng trên Google, hoặc thậm chí không thể nhận được một cuốn tờ từ bác sĩ giải thích về chẩn đoán của họ, bởi vì nó không có bằng ngôn ngữ họ hiểu.
Khoảng cách ngôn ngữ về sức khỏe này không độc đáo chỉ riêng Covid. Wuqu' Kawoq|Maya Health Alliance là một tổ chức phi lợi nhuận tại Guatemala đã cung cấp hỗ trợ sức khỏe bằng ngôn ngữ bản địa của người Maya như Kaqchikel và Kʼicheʼ trong suốt 13 năm qua. Một phụ nữ nói tiếng Kaqchikel, một khách hàng sớm của Wuqu' Kawoq, đã biết mình mắc bệnh tiểu đường—cô có thể lặp lại tên mà các bác sĩ nói bằng tiếng Tây Ban Nha, nhưng một phần lớn trong việc kiểm soát tiểu đường là cân nhắc cẩn thận lượng đường trong máu thông qua chế độ ăn uống, điều mà một cái tên không rõ ràng, không dịch được, không giúp cô. Cho đến khi Wuqu' Kawoq phát triển một tên gọi cho bệnh tiểu đường trong tiếng Kaqchikel—kab’kïk’el, chính xác là "máu ngọt," sau khi tham khảo ý kiến của các chuyên gia y tế. Thuật ngữ mới giúp cho những nhân viên y tế của Wuqu' Kawoq dễ dàng giải thích cách điều trị bệnh bằng ngôn ngữ mẹ đẻ của cô: Máu của bạn quá ngọt, bạn cần làm cho nó ít ngọt hơn bằng cách ăn ít thứ ngọt hơn. Với thông tin này, phụ nữ đã có thể quay lại và giải thích với gia đình cách họ cần nấu ăn để giúp cô.
Giống như tiểu đường, Covid, tạm thời, là một căn bệnh theo lối sống—cho đến khi chúng ta có vắc xin hoặc các phương pháp điều trị khác, cách tốt nhất hiện tại của chúng ta để điều trị là thay đổi cách sống. Tất cả những poster về rửa tay và giữ khoảng cách xã hội. Một bác sĩ có thể cho thuốc hoặc tiêm cho người không hiểu cách nó hoạt động, nhưng vì chúng ta chưa có điều đó cho SARS-CoV-2, chúng ta đang đối mặt với những gì Chương trình Dịch vụ Thông tin Dịch tễ học của Trung tâm Kiểm soát và Phòng ngừa Dịch bệnh coi là một tình trạng khẩn cấp về giao tiếp—điều mà WHO gọi là một "thông tin đại dịch."
Trong vài tháng qua, Wuqu' Kawoq đã mở rộng phạm vi từ nhiệm vụ thông thường của mình (vấn đề chăm sóc sức khỏe cơ bản như tiểu đường, y học bà mẹ, suy dinh dưỡng ở trẻ em, và đi kèm với khách hàng bản địa đến bệnh viện nói tiếng Tây Ban Nha để phiên dịch và bảo vệ) bằng cách kết hợp dịch giả trong cuộc gọi điện thoại y tế với bác sĩ và sản xuất podcast về Covid bằng ngôn ngữ Maya để phát sóng trên đài phát thanh địa phương—phương pháp phổ biến nhất để truyền thông tin ở xa trong các khu vực nông thôn nơi dịch vụ internet không luôn luôn có sẵn.
Đó chỉ là một trong những dự án dịch Covid nảy sinh trên khắp thế giới. Adivasi Lives Matter đã tạo thông tin bằng ngôn ngữ ở Ấn Độ bao gồm Kodava, Marathi, và Odia. Chính phủ Lãnh thổ Bắc Australia đã sản xuất video bằng ngôn ngữ của các dân tộc bản địa bao gồm Yolŋu Matha, Pintupi-Luritja, và Warlpiri. Quận King của Seattle đã sản xuất thông tin bằng ngôn ngữ của cộng đồng người nhập cư và người tị nạn địa phương, như Amharic, Khmer, và Marshallese. VirALLanguages đã sản xuất video bằng ngôn ngữ của Cameroon, bao gồm Oshie, Aghem, và Bafut, với sự tham gia của các nhân vật nổi tiếng trong cộng đồng như "người ảnh hưởng" địa phương. Ngay cả Trung Quốc, nơi mà từ lâu đã khuyến khích ngôn ngữ Quan Thoại (Phổ thông ngữ) là ngôn ngữ quốc gia duy nhất, cũng đã phát thông tin Covid bằng tiếng Quan Thoại Hồ Bắc, tiếng Mông Cổ, Yi, tiếng Triều Tiên, và nhiều ngôn ngữ khác.
Theo danh sách được cập nhật đều đặn do Dự án Ngôn ngữ Nguy cấp quản lý, thông tin về Covid từ các nguồn đáng tin cậy (như chính phủ, tổ chức phi lợi nhuận và nhóm tình nguyện viên rõ ràng trích dẫn nguồn gốc của lời khuyên sức khỏe của họ) đã được tạo ra trên 500 ngôn ngữ và vẫn đang tiếp tục, bao gồm hơn 400 video trong hơn 150 ngôn ngữ. Một số dự án này là thông tin ngắn gọn, chuẩn hóa hơn trong nhiều ngôn ngữ toàn cầu, chẳng hạn như dịch năm hướng dẫn của WHO thành poster trong hơn 220 ngôn ngữ hoặc dịch bản tin phá hoại thông tin của WHO thành hơn 60 ngôn ngữ. Nhưng nhiều dự án, đặc biệt là những dự án bằng ngôn ngữ không được đại diện tốt trên sân khấu toàn cầu, được tạo ra bởi các nhóm địa phương cá nhân, nhóm cảm thấy trách nhiệm với một khu vực cụ thể, bao gồm chính phủ, tổ chức phi lợi nhuận và các dịch giả tình nguyện có một chút học vấn hoặc truy cập internet hơn.
Vẫn còn những khoảng trống: Chính phủ Nam Phi đã bị chỉ trích trên mạng xã hội vì tổ chức các buổi thông cáo chủ yếu bằng tiếng Anh, thay vì ít nhất hai trong số 10 ngôn ngữ chính thức khác của nó: một ngôn ngữ Nguni (như Zulu hoặc Xhosa) và một ngôn ngữ Sotho (như Setswana hoặc Sesotho). Anh đã phải đối mặt với các vụ kiện pháp lý vì không bao gồm dịch thuật ngôn ngữ ký hiệu Anh trong các buổi thông cáo chính phủ thường xuyên như Scotland, Wales và Bắc Ireland đã có. (Nhiều quốc gia khác cũng tích cực bổ sung thông dịch ngôn ngữ ký hiệu, từ Hà Lan đến New Zealand.)
Nhưng nói chung, có sự nhận thức rằng ngôn ngữ là một phần quan trọng của phản ứng trước Covid, một sự hiểu biết đến từ kinh nghiệm khó khăn. Khi các chuyên gia về bệnh đường hô hấp nói về tiền đề của Covid-19, họ thường nói về SARS và MERS; khi các chuyên gia về ngôn ngữ nói về đại dịch, có hai tiền lệ khác nhau liên tục được đề cập: trận động đất năm 2010 tại Haiti và đợt dịch Ebola ở Tây Phi (2013–2016) và Cộng hòa Dân chủ Congo (từ 2018).
Trong cả hai trường hợp, ngôn ngữ được nói bởi người dân địa phương không phải là ngôn ngữ được rộng rãi sử dụng bởi những người làm việc cứu trợ. Tại Haiti, điều này dẫn đến một sáng kiến gọi là Nhiệm vụ 4636, nơi người Haiti có thể gửi tin nhắn yêu cầu trợ giúp—như phát hiện ai đó bị kẹt trong một tòa nhà, hoặc cần sự trợ giúp y tế—đến mã số SMS 4636, và các tình nguyện viên từ cộng đồng Haiti trên khắp thế giới sẽ dịch hàng chục nghìn yêu cầu từ tiếng Creole Haiti sang tiếng Anh và chuyển tiếp chúng cho những người làm việc cứu trợ nói tiếng Anh trên địa bàn, trong khoảng 10 phút trung bình.
Đối với đợt dịch Ebola, thách thức về ngôn ngữ càng phức tạp hơn. Ở DRC, có ít nhất bảy ngôn ngữ chính—tiếng Pháp, Kikongo (Kituba), Lingala, tiếng Swahili, Tsiluba, Ngôn ngữ ký hiệu Phi châu Á, và Ngôn ngữ ký hiệu Mỹ—và còn nhiều ngôn ngữ nhỏ khác phổ biến tại các khu vực cụ thể, theo bản đồ được tạo bởi Translators Without Borders. Một nghiên cứu gần đây của Translators Without Borders chỉ ra những tài nguyên như thế nào, phản ánh những gì chúng ta có thể gọi là mong muốn con người chung để kiểm tra bệnh của bạn trên WebMD: "Các người tham gia nghiên cứu thể hiện sự thất vọng với thông tin như 'Bạn phải đến sớm tại trung tâm điều trị Ebola để được chữa trị.' Họ muốn một giải thích chi tiết và phức tạp hơn về cách hoạt động của các loại thuốc điều trị và tại sao chúng được chọn … Mọi người muốn thông tin chi tiết về những vấn đề phức tạp để hỗ trợ quyết định của họ, và họ muốn những thông tin này được trình bày bằng 'ngôn ngữ cộng đồng'—có nghĩa là bằng một ngôn ngữ và phong cách họ hiểu, sử dụng từ ngữ và khái niệm mà họ quen thuộc."
Không hiểu được ngôn ngữ cộng đồng có thể bị xem là bất cẩn—dựa vào ngôn ngữ chung như tiếng Pháp và tiếng Swahili gây tổn thương lớn cho phụ nữ ở DRC, họ có khả năng chỉ nói tiếng Nande và các ngôn ngữ địa phương khác. Điều này còn có thể làm ngược lại. Rob Munro, người đã làm việc trong lĩnh vực công nghệ ngôn ngữ cho cả trận động đất tại Haiti và Ebola, kể một câu chuyện tại Sierra Leone trong thời kỳ dịch Ebola, khi những người làm việc thiện nguyện thiếu kiến thức đã đến để tạo ra thông báo dịch vụ công cộng về Ebola, nhưng chỉ để phát hiện ra rằng, theo lời khuyên của bên đang cầm quyền nói tiếng Mande vào thời điểm đó, họ đã phát những thông báo bằng tiếng Mande trên loa ở khu vực nói tiếng Temne, gây ra các lý thuyết âm mưu rằng virus được sử dụng như một công cụ để đàn áp đối thủ chính trị.
Khả năng ngôn ngữ cũng quan trọng không kém cho Covid-19: Cung cấp bối cảnh đủ về cách một căn bệnh hoạt động cho phép mọi người tìm ra biện pháp phòng ngừa hợp lý trong các tình huống không mong đợi, và việc cung cấp thông tin này bằng ngôn ngữ cộng đồng phù hợp cũng giúp thuyết phục mọi người rằng lời khuyên là đáng tin cậy và nên được tuân theo. Đừng nói đến việc khi các quốc gia tăng cường việc theo dõi liên hệ để hỗ trợ việc mở cửa trở lại, điều này cũng cần phải diễn ra bằng tất cả các ngôn ngữ được sử dụng trong cộng đồng. (Nhu cầu hiện tại về các nhân viên theo dõi liên hệ nói tiếng Tây Ban Nha tại Mỹ chỉ là khởi đầu.)
Nhưng trong một đại dịch, thách thức không chỉ là dịch một hoặc vài ngôn ngữ chính trong một vùng duy nhất—nó trên quy mô có thể hàng nghìn ngôn ngữ, ít nhất là từ 1,000 đến 2,000 trong hơn 7,000 ngôn ngữ tồn tại hiện nay, theo ước tính tổng hợp từ các chuyên gia mà tôi đã trò chuyện, tất cả đều nhấn mạnh rằng con số này rất không chắc chắn nhưng chắc chắn là con số lớn nhất họ từng đối mặt cùng một lúc.
Dịch máy có thể hữu ích trong một số trường hợp, nhưng cần tiếp cận cẩn thận. Đây là một ví dụ về những gì có thể sai lầm với một cụm từ đơn giản như "rửa tay." Phiên bản tiếng Nhật của "rửa tay" được cung cấp bởi Google Dịch là 手を洗いなさい (te o arainasai), theo tôi được biết là kỹ thuật ngữ pháp nhưng cũng phong cách phù hợp cho một bậc cha mẹ nói với con cái. Chắc chắn phù hợp trong một số trường hợp, nhưng cũng có khả năng để lại ấn tượng xấu ("giảm tuân thủ" trong ngôn ngữ của y tế công cộng) trên các poster dành cho người lớn.
Vì vậy, tôi đã thách thức các người theo dõi Twitter của tôi để tìm bất kỳ ngôn ngữ mà họ thành thạo, trong đó phiên bản của Google Dịch cho "rửa tay" được thiết kế đặc biệt cho phong cách của thông báo dịch vụ công cộng hoặc poster. Một lần nữa, nhiều ngôn ngữ đã tạo ra kết quả ngữ pháp, nhưng đối với các ngôn ngữ châu Âu, trang web thường trả về các hình thức không chính thức, số ít của "bạn" (các hình thức "tu" hoặc "du"). Các phiên bản không chính thức thường phù hợp trong lời nói—nhưng không phổ biến trên các poster chính thức, nơi hầu hết người nói mong đợi các cụm từ vô nhân ("Yêu cầu rửa tay") hoặc các hình thức lịch sự như "vous" hoặc "usted" hoặc "Sie." Trong hơn mười ngôn ngữ, chúng tôi chỉ tìm thấy hai ngôn ngữ phù hợp cho biểu ngữ: tiếng Hàn và tiếng Swahili. Sự phù hợp có thể dường như không quan trọng, nhưng hãy tưởng tượng bác sĩ của bạn hỏi bạn, một người lớn, nếu bụng bạn bị đau thay vì hỏi bạn có đau bụng không. Điều đó… không thực sự truyền cảm hứng tin tưởng.
That's not to say that machine translation isn't helpful for some tasks, where getting the gist quickly is more important than the nuanced translations humans excel at, such as quickly sorting and triaging requests for help as they come in or keeping an eye on whether a new misconception is bubbling up. But humans need to be kept in the loop, and both human and machine language expertise needs to be invested in during calmer times so that it can be used effectively in a crisis.
Tuy nhiên, điều lớn hơn với dịch máy là nó thậm chí còn không phải là một lựa chọn cho nhiều trong số các ngôn ngữ tham gia. Translators Without Borders đang dịch thông tin Covid sang 89 ngôn ngữ, phản ứng lại các yêu cầu cụ thể từ các tổ chức tại địa phương, và 25 trong số đó (khoảng một phần ba) không có trong Google Dịch. Dịch máy thường làm việc không cân xứng cho những ngôn ngữ thiếu tài nguyên, với các yếu tố như trang tin tức và từ điển có thể được sử dụng như dữ liệu huấn luyện. Đôi khi, như tiếng Pháp và tiếng Tây Ban Nha, những ngôn ngữ có tài nguyên tốt từ các cường quốc thuộc quyền cũ cũng hoạt động như ngôn ngữ ký hiệu cho mục đích dịch thuật. Trong những trường hợp khác, có sự không phù hợp giữa việc dễ dàng dịch bằng máy so với việc hữu ích cho TWB: Nhóm đã nhận được rất nhiều yêu cầu thông tin Covid bằng Kanuri, Dari và Tigrinya, không có trong Google Dịch, nhưng chưa nhận được yêu cầu nào cho tiếng Hà Lan hoặc tiếng Do Thái (có trong Google Dịch nhưng không cần sự trợ giúp của TWB—họ đã có chính phủ quốc gia sản xuất tài liệu của riêng họ).
Google Dịch hỗ trợ 109 ngôn ngữ, Bing Dịch có 71 ngôn ngữ, và thậm chí Wikipedia cũng chỉ tồn tại trong 309 ngôn ngữ—số liệu mờ nhạt so với hơn 500 ngôn ngữ trên danh sách từ Dự Án Ngôn Ngữ Đang Nguy Cơ, tất cả đều là tài nguyên do con người tạo ra. Anna Belew, người đã tổng hợp danh sách kể từ giữa tháng Ba, nói với tôi rằng cô đã thêm vào hàng chục ngôn ngữ mỗi ngày và nếu có gì, đó chỉ là một con số không đủ—danh sách có chủ ý loại bỏ những ngôn ngữ quốc gia có nguồn lực tốt như tiếng Hà Lan (trừ khi chúng cũng là ngôn ngữ ký hiệu, như tiếng Pháp), dựa trên những ưu tiên tương tự với TWB. Tất nhiên, dễ dàng hơn khi dịch một số tài liệu hơn là tạo ra một hệ thống dịch máy hoàn chỉnh, nhưng điều đầu tiên cũng có thể giúp ích cho việc thứ hai.
Một cuộc khủng hoảng như đại dịch có thể làm lộ ra cả những điểm yếu và tiềm năng đã có sẵn trong một hệ thống. Một mặt, số lượt đi lại bằng ô tô và máy bay ít hơn dẫn đến chất lượng không khí cải thiện và giảm lượng khí thải carbon, một cơ hội tiềm năng để giải quyết một vấn đề xã hội to lớn khác trong quá trình mở cửa trở lại. Mặt khác, những người bị ảnh hưởng nhiều nhất bởi Covid là những người đã bị cách ly, bao gồm công nhân di dân, người tị nạn và người bản địa—một vấn đề xã hội lớn khác mà việc mở cửa chỉ làm tồi tệ hơn.
Lỗi trong cấu trúc ngôn ngữ của internet là các nền tảng công nghệ đã chủ yếu hỗ trợ khoảng 30 đến 100 ngôn ngữ chính giàu có—số liệu không tăng đáng kể kể từ khi tôi bắt đầu theo dõi vào năm 2016 khi viết Bởi Vì Internet. Tiềm năng là các mạng lưới dịch giả, cả chuyên nghiệp và tình nguyện, đã có khả năng cung cấp thông tin Covid trong hơn 500 ngôn ngữ chỉ trong vài tháng. Trong những ngày đầu của internet, có thể xem nhẹ rằng người dùng internet đều thoải mái với vài ngôn ngữ thống trị, nhưng tình hình này đã thay đổi rõ rệt—những nỗ lực cơ bản đã, trong vài tháng, tạo ra tài nguyên trong gần gấp đôi số ngôn ngữ mà Wikipedia có trong 19 năm, trong gần năm lần số ngôn ngữ mà Google Dịch có trong 14 năm. Những con số này chứng tỏ rằng có đủ người nói được tiếp cận thông qua internet cho rất nhiều ngôn ngữ hơn so với những gì Thung Lũng Silicon thường hỗ trợ—và các nền tảng công nghệ cần phải tìm cách để bắt kịp với hiện thực mới này. Mọi người xứng đáng được truy cập ngôn ngữ đầy đủ hơn chỉ những thông báo về Covid.
Trong dài hạn, Translators Without Borders nhằm hỗ trợ vấn đề công nghệ này, thông qua dự án được biết đến với tên gọi Chiến Dịch Dịch Covid-19 (TICO-19). TWB đang làm việc với các nhà nghiên cứu tại Đại học Carnegie Mellon và một số công ty công nghệ lớn bao gồm Microsoft, Google, Facebook và Amazon (với sự ngoại lệ đáng chú ý của Apple) để dịch tài liệu liên quan đến Covid trong 36 ngôn ngữ thông qua các mạng lưới dịch giả của những công ty này (và trên chi phí của họ). Bước tiếp theo sẽ là tái sử dụng tài liệu đã được dịch mới này như dữ liệu huấn luyện—lượng lớn văn bản và bản ghi cần thiết trong mỗi ngôn ngữ như nguyên liệu cho các công cụ như dịch máy và nhận diện giọng nói tự động.
Không phải là 500, và cũng không phải là danh sách dài hơn của TWB với 89 ngôn ngữ, nhưng mỗi phần đều hỗ trợ. "Tôi chỉ ước," Antonis Anastasopoulos, một nghiên cứu viên sau đại học tại CMU đang làm việc trên dự án TICO-19, nói, "rằng tất cả những sáng kiến tuyệt vời khác đang phát hành các bản dịch trong những ngôn ngữ ít được đại diện cũng sẽ phát hành dữ liệu của họ dưới dạng văn bản đơn giản, được cấp phép mở, cùng với những tệp PDF hoặc hình ảnh dễ chia sẻ trên mạng xã hội nhưng khó đọc đối với máy móc."
Một lần nữa, mối quan hệ hiện có quan trọng—TICO-19 đã có thể triển khai nhanh chóng vì Translators Without Borders đã làm việc trên một dự án tương tự nhỏ hơn từ năm 2017 dưới tên Gamayun, cùng với các công ty công nghệ để dịch tài liệu trong 10 ngôn ngữ quan trọng ít được đại diện và tái sử dụng chúng như dữ liệu huấn luyện, để có sự hỗ trợ của sản phẩm công nghệ trong các ngôn ngữ chính như Kanuri (dành cho người bị di tản nội địa ở bắc đông Nigeria) và Rohingya (cho người tị nạn Rohingya tại Bangladesh).
Giống như những nỗ lực tốt nhất của chúng ta trong việc chống lại virus là một loạt quyết định nhỏ bé, không hào nhoáng của nhiều người—ở nhà, rửa tay, kiểm tra cẩn thận các ứng cử viên vaccine—điều tương tự cũng đúng trong phần giao tiếp. Vẫn cần có vai trò cho công nghệ—gửi mẫu poster và kịch bản video cho các dịch giả, theo dõi những ngôn ngữ nào được cập nhật để không làm trùng lặp công việc, gửi poster và video qua các nhóm WhatsApp gia đình. Tất cả điều này sẽ là điều không thể trong thời kỳ trước internet, đặc biệt là với việc duy trì khoảng cách xã hội. Nhưng chúng phụ thuộc vào các công cụ khiêm tốn, được trung gian bởi con người như bảng tính chia sẻ và danh sách email và điện thoại di động, chứ không phải trí tuệ nhân tạo sáng tạo."
Nhà sử học và nhà văn Ada Palmer đã chỉ ra rằng đây là đại dịch đầu tiên trong lịch sử nhân loại mà chúng ta đã có hiểu biết về bệnh tật và vệ sinh, nơi chúng ta thực sự đã biết những gì chúng ta cần phải làm để chống lại nó đủ lâu để phát triển vaccine, khiến cho việc duy trì khoảng cách xã hội trở thành một chiến lược có thể thực hiện, ngay cả khi nó làm đảo lộn cuộc sống của chúng ta. Điều này cũng, vì vậy, là đại dịch đầu tiên trong lịch sử nhân loại mà chúng ta đã có sức mạnh và trách nhiệm để chia sẻ hiểu biết này, một mạng lưới chăm sóc ngôn ngữ cuối cùng bao phủ mọi ngóc ngách của hành tinh."
Bức ảnh: John Moore/Getty Images; Alberto Pizzoli/Getty Images
0 Thích