Mytour blogimg_logo
27/12/2023120

Cấy Ghép Não Hỗ Trợ Người Tàn Tật Nói Chuyện Đạt Kỷ Lục Mới năm 2025

Tình trạng tê liệt đã lấy đi khả năng nói chuyện của hai phụ nữ. Đối với một người, nguyên nhân là bệnh động kinh cơ nơi, hoặc ALS, một căn bệnh ảnh hưởng đến các tế bào thần kinh chuyển động. Người kia đã bị đột quỵ ở thân não. Mặc dù họ không thể phát âm rõ ràng, nhưng họ nhớ cách hình thành từng từ ngữ.

Bây giờ, sau khi tình nguyện nhận cấy ghép não, cả hai đều có thể giao tiếp thông qua máy tính với tốc độ tiệm cận nhịp điệu của cuộc trò chuyện bình thường. Bằng cách phân tích hoạt động thần kinh liên quan đến các cử động của khuôn mặt trong quá trình nói chuyện, các thiết bị giải mã lời nói dự định của họ với tốc độ lần lượt là 62 và 78 từ mỗi phút, lần lượt — một vài lần nhanh hơn so với kỷ lục trước đó. Các trường hợp của họ được mô tả chi tiết trong hai bài báo được công bố vào thứ Tư bởi các đội ngũ khác nhau trên tạp chí Nature.

“Bây giờ, có thể tưởng tượng được một tương lai nơi chúng ta có thể khôi phục cuộc trò chuyện mượt mà cho người tàn tật, giúp họ tự do nói những gì họ muốn nói với độ chính xác đủ cao để hiểu được đáng tin cậy,” nói Frank Willett, một nhà nghiên cứu tại Phòng thí nghiệm Chuyển đổi Prosthetics Thần kinh của Đại học Stanford, trong cuộc họp báo truyền thông vào thứ Ba. Willett là tác giả của một bài báo do nhóm nghiên cứu Stanford sản xuất; bài báo khác được công bố bởi một nhóm ở Đại học California, San Francisco.

Mặc dù chậm hơn so với tốc độ khoảng 160 từ mỗi phút trong cuộc trò chuyện tự nhiên của người nói tiếng Anh, các nhà khoa học nói rằng đây là một bước tiến thú vị trong việc khôi phục lời nói thời gian thực bằng cách sử dụng giao diện não-máy tính, hay BCI. “Nó đang gần sử dụng trong đời sống hàng ngày,” nói Marc Slutzky, một bác sĩ thần kinh tại Đại học Northwestern không liên quan đến các nghiên cứu mới.

BCI thu thập và phân tích tín hiệu não, sau đó dịch chúng thành các lệnh để thực hiện bởi một thiết bị bên ngoại. Những hệ thống như vậy đã cho phép những người tàn tật kiểm soát cánh tay robot, chơi trò chơi video và gửi email bằng trí óc của họ. Nghiên cứu trước đây của hai nhóm đã chỉ ra rằng có thể dịch lời nói dự định của một người tàn tật thành văn bản trên màn hình, nhưng với tốc độ, độ chính xác và từ vựng hạn chế.

Trong nghiên cứu của Stanford, các nhà nghiên cứu phát triển một BCI sử dụng mảng Utah, một cảm biến vuông bé như một lược tóc với 64 sợi lông giống kim. Mỗi sợi được đầu bằng một điện cực, và cùng nhau chúng thu thập hoạt động của các tế bào thần kinh cá thể. Sau đó, các nhà nghiên cứu đã huấn luyện một mạng thần kinh nhân tạo để giải mã hoạt động não và dịch nó thành từ ngữ hiển thị trên màn hình.

Họ thử nghiệm hệ thống trên tình nguyện viên Pat Bennett, bệnh nhân ALS, nay đã 68 tuổi. Vào tháng 3 năm 2022, một bác sĩ đã chèn bốn cảm biến nhỏ này vào vỏ não của Bennett—lớp ngoại cùng của não. Dây mảng kết nối các mảng với nón đặt trên đầu bà, có thể kết nối với máy tính qua cáp.

Trong vòng bốn tháng, các nhà khoa học huấn luyện phần mềm bằng cách yêu cầu Bennett thử nói câu ra to. (Bennett vẫn có thể tạo ra âm thanh, nhưng lời nói của bà không hiểu được.) Cuối cùng, phần mềm tự học cách nhận diện các tín hiệu thần kinh đặc biệt liên quan đến các chuyển động của môi, hàm và lưỡi mà bà đang tạo ra để tạo ra các âm thanh khác nhau. Từ đó, nó học hoạt động thần kinh tương ứng với các chuyển động được sử dụng để tạo ra âm thanh tạo nên từ ngữ. Sau đó, nó có thể dự đoán chuỗi từ đó và kết hợp các câu trên màn hình máy tính.

Với sự giúp đỡ của thiết bị, Bennett có thể giao tiếp ở mức trung bình 62 từ mỗi phút. BCI mắc lỗi 23,8% trong một từ vựng 125.000 từ. Kỷ lục trước đó chỉ là 18 từ mỗi phút—kỷ lục được thiết lập vào năm 2021, khi các thành viên của đội ngũ Stanford công bố một bài báo mô tả một BCI chuyển đổi chữ viết tưởng của người tàn tật thành văn bản trên màn hình.

Trong bài báo thứ hai, các nhà nghiên cứu tại UCSF xây dựng một BCI sử dụng một mảng đặt trên bề mặt não thay vì bên trong. Một hình chữ nhật mảnh mỏng có 253 điện cực, nó phát hiện hoạt động của nhiều tế bào thần kinh trên bề mặt vỏ não nói. Họ đặt mảng này lên não của bệnh nhân đột quỵ tên là Ann và huấn luyện một mô hình học sâu để giải mã dữ liệu thần kinh nó thu thập khi bà di chuyển môi mà không làm ra âm thanh. Trong vài tuần, Ann lặp lại các cụm từ từ một từ vựng hội thoại 1.024 từ.

Giống như trí tuệ nhân tạo của Stanford, thuật toán của đội ngũ UCSF được huấn luyện để nhận ra các đơn vị ngôn ngữ nhỏ nhất, gọi là nguyên âm, thay vì toàn bộ từ. Cuối cùng, phần mềm có thể dịch lời nói dự định của Ann với tốc độ 78 từ mỗi phút—cao hơn nhiều so với 14 từ mỗi phút mà bà đã quen trên thiết bị giao tiếp bằng cách gõ.

Nhóm UCSF, dưới sự chỉ đạo của bác sĩ phẫu thuật não Edward Chang, trước đây đã sử dụng một mảng bề mặt tương tự với ít điện cực hơn để chuyển đổi lời nói dự định từ một người đàn ông tàn tật thành văn bản trên màn hình. Kỷ lục của họ là khoảng 15 từ mỗi phút. BCI hiện tại của họ không chỉ nhanh hơn, nó còn đi xa hơn bằng cách chuyển đổi tín hiệu não của Ann thành lời nói có thể nghe được do máy tính phát ra.

Các nhà nghiên cứu đã tạo ra một “avatar số” để truyền đạt lời nói dự định của Ann toàn bộ. Họ tùy chỉnh một phụ nữ hoạt hình để có mái tóc nâu giống với Ann và sử dụng đoạn video từ đám cưới của bà để làm cho giọng của avatar giống giọng của bà. “Giọng điệu và biểu cảm của chúng ta là một phần của bản tính của chúng ta, vì vậy chúng tôi muốn hiện thân thành một lời nói giả mạo có thể làm cho nó trở nên tự nhiên, linh hoạt và biểu cảm,” Chang nói trong cuộc họp báo vào thứ Ba. Ông nghĩ rằng công việc của đội ngũ ông cuối cùng có thể cho phép những người tàn tật tương tác cá nhân hóa hơn với gia đình và bạn bè của họ.

Có nhược điểm cho cả hai phương pháp của nhóm. Các điện cực được cấy, giống như những cái mà đội ngũ Stanford sử dụng, ghi lại hoạt động của các tế bào thần kinh cá thể, điều này cung cấp thông tin chi tiết hơn so với một bản ghi từ bề mặt não. Nhưng chúng cũng không ổn định hơn, vì các điện cực được cấy di chuyển trong não. Ngay cả sự di chuyển một vài milimét cũng gây ra thay đổi trong hoạt động được ghi lại. “Khó khăn để ghi lại từ cùng một tế bào thần kinh trong suốt vài tuần, chưa kể đến vài tháng hoặc nhiều năm,” Slutzky nói. Và theo thời gian, mô sẹo hình thành xung quanh nơi cấy đặt điện cực, điều này cũng có thể ảnh hưởng đến chất lượng của bản ghi.

Ngược lại, một mảng bề mặt ghi lại hoạt động não ít chi tiết hơn nhưng bao phủ một khu vực lớn hơn. Tín hiệu mà nó ghi lại ổn định hơn so với những đỉnh của các tế bào thần kinh cá thể vì chúng tạo ra từ hàng nghìn tế bào thần kinh, Slutzky nói.

Trong buổi họp báo, Willett cho biết công nghệ hiện tại bị hạn chế do số lượng điện cực có thể được đặt an toàn trong não cùng một lúc. “Giống như cách một máy ảnh với nhiều pixel tạo ra một hình ảnh sắc nét hơn, việc sử dụng nhiều điện cực sẽ mang lại cho chúng ta cái nhìn rõ ràng hơn về những gì đang xảy ra trong não,” ông nói.

Leigh Hochberg, một bác sĩ thần kinh tại Bệnh viện Chung Massachusetts và Đại học Brown, người đã làm việc với nhóm Stanford, nói rằng 10 năm trước ít người nghĩ rằng sẽ có một ngày nào đó có thể giải mã lời nói cố gắng của một người chỉ bằng cách ghi lại hoạt động não của họ. “Tôi muốn có khả năng nói với bệnh nhân ALS của mình, hoặc đột quỵ thân não, hoặc các dạng bệnh hoặc chấn thương thần kinh khác, rằng chúng ta có thể khôi phục khả năng giao tiếp của họ một cách dễ dàng, tự nhiên và nhanh chóng,” Hochberg nói.

Mặc dù vẫn chậm hơn so với lời nói bình thường, những BCI mới này nhanh hơn các hệ thống giao tiếp thay thế hiện tại, Betts Peters, một người chuyên ngành ngôn ngữ của Trường Đại học Y tế và Khoa học Oregon viết. Những hệ thống này đòi hỏi người dùng phải gõ hoặc chọn tin nhắn bằng cách sử dụng ngón tay hoặc ánh nhìn. “Có khả năng theo kịp với dòng cuộc trò chuyện có thể mang lại lợi ích lớn cho nhiều người bị khuyết tật giao tiếp, giúp họ dễ dàng tham gia đầy đủ vào mọi khía cạnh của cuộc sống,” bà nói với blog.mytour.vn qua email.

Vẫn còn một số thách thức về công nghệ để tạo ra một thiết bị có khả năng cấy ghép với những khả năng này. Đối với một điều, Slutzky nói rằng tỷ lệ lỗi cho cả hai nhóm vẫn khá cao để sử dụng hàng ngày. So với đó, các hệ thống nhận diện lời nói hiện tại được phát triển bởi Microsoft và Google có tỷ lệ lỗi khoảng 5 phần trăm.

Thách thức khác là tuổi thọ và độ tin cậy của thiết bị. Một BCI thực tế sẽ cần phải liên tục ghi lại tín hiệu trong nhiều năm mà không cần điều chỉnh hàng ngày, Slutzky nói.

BCIs cũng sẽ cần phải không dây, không cần những sợi cáp cồng kềnh như những hệ thống hiện tại để họ có thể sử dụng mà không cần bệnh nhân phải kết nối với máy tính. Các công ty như Neuralink, Synchron và Paradromics đều đang nghiên cứu về các hệ thống không dây.

“Đã có những kết quả đáng kinh ngạc,” Matt Angle, người sáng lập và CEO của Paradromics đóng ở Austin, người không tham gia vào các bài báo mới. “Tôi nghĩ chúng ta sẽ bắt đầu thấy sự tiến triển nhanh chóng hướng tới một thiết bị y tế cho bệnh nhân.”

Trần Minh Hoạt

0 Thích

Đánh giá : 5.0 /439