Новости

Ученые создали мозговой имплантат, который преобразует мысли в речь

Ученые создали мозговой имплантат, который преобразует мысли в речь

Американка, которая из-за инсульта в 30 лет потеряла способность говорить, спустя почти два десятилетия вновь обрела возможность выражать свои мысли словами благодаря новому методу нейрокомпьютерного интерфейса (BCI).

Фото: Unsplash

Исследователи в США разработали инновационный метод, который анализирует активность мозга с частотой 80 миллисекунд и преобразует ее в синтезированную версию голоса. Эта технология устраняет раздражающую задержку, характерную для предыдущих моделей.

Способность организма воспроизводить звуки так, как они слышатся, часто воспринимается как нечто само собой разумеющееся. Однако лишь в тех случаях, когда человека сталкивается с необходимостью делать паузу для использования переводчика или когда слышит свою речь с задержкой через динамик, приходит осознание того, насколько быстро работает анатомия людей.

Мозговые импланты могут помочь тем, чья способность произносить звуки нарушена из-за повреждений речевых центров мозга, например из-за бокового амиотрофического склероза или травм в ключевых участках нервной системы. Традиционные методы преобразования мысли в речь часто требуют, чтобы программа сначала проанализировала весь текстовый фрагмент, прежде чем приступить к его расшифровке. Этот подход может существенно замедлить связь между мыслью и ее озвучиванием, создавая нежелательную, неестественную задержку, что смущает как говорящего, так и собеседника.

Фото: Unsplash

Исследователи из Калифорнийского университета в Беркли и Сан-Франциско подчеркивают важность уменьшения задержки синтеза речи и повышения скорости декодирования.

«Синтез речи требует времени не только для воспроизведения звуков, но и для того чтобы как пользователь, так и слушатель могли понять сгенерированный звук», — объясняет команда под руководством инженера-вычислителя, Кайло Литтлджона.

Большинство существующих методов предполагают, что «говорящий» обучает интерфейс, явно воспроизводя звуки. Это может стать серьезной проблемой для людей, которые давно не практиковались в речи или у которых изначально были трудности с речевой коммуникацией, поскольку им может быть сложно предоставить достаточное количество данных для работы программного обеспечения декодирования.

Чтобы справиться с этими препятствиями, исследователи разработали гибкую нейронную сеть на основе глубокого обучения, обучив ее на активностях сенсомоторной коры 47-летней участницы эксперимента, которая молча «произносила» 100 разных предложений из словаря, содержащего чуть более 1 тыс. слов. Кроме того, Литтлджон и его команда использовали вспомогательную форму общения, основанную на 50 фразах с использованием уменьшенного словарного запаса.

В отличие от предыдущих методик, в данном процессе участница не произносила слова вслух, а просто проговаривала предложения про себя. Система продемонстрировала высокую эффективность, успешно декодируя оба способа общения, и при этом средняя скорость перевода слов в минуту почти удвоилась по сравнению с предыдущими подходами.

Фото: Unsplash

Использование метода прогнозирования, который позволял непрерывно интерпретировать речь в реальном времени, дало возможность участнице исследования общаться гораздо более естественно и в восемь раз быстрее, чем при применении других методов. Кроме того, благодаря программе синтеза голоса, основанной на ранее записанных образцах ее речи, результат звучал как ее собственный голос.

Команда провела процесс в автономном режиме без временных ограничений и доказала, что их стратегия может интерпретировать нейронные сигналы, соответствующие словам, на которых женщина не была специально обучена.

Авторы исследования подчеркивают, что метод все еще требует доработки, прежде чем его можно будет использовать в клинической практике. Несмотря на то что декодированная речь была разборчивой, она значительно уступала более традиционным методам текстового декодирования. 

Ранние исследования показали, что люди с одной из групп крови А имеют большую вероятность перенести инсульт в возрасте до 60 лет по сравнению с другими. Группы крови описывают богатое разнообразие химических веществ, находящихся на поверхности наших эритроцитов. Среди наиболее известных — те, что называются A и B, которые могут присутствовать вместе как AB, по отдельности или отсутствовать вообще как O.