今日,来自麻省总医院、哈佛医学院和布朗大学的研究团队在学术期刊《自然·神经科学》上发表了一项突破性研究成果:一种新型植入式脑机接口(iBIC)打字神经假体,通过解码使用者尝试性的手指动作意图,使其能够使用熟悉的 QWERTY 键盘进行文本输入。



论文链接:https://doi.org/10.1038/s41593-026-02218-y


研究结果显示,一位言语和运动功能严重受损的参与者(T17),能够达到每分钟 47 个字符的速度。


视频 | T17 按屏幕提示以自身节奏逐字打字,研究人员按下按钮来结束每句的解码过程。


另一位因脊髓损伤导致四肢瘫痪的参与者(T18)使用该系统达到了每分钟110 个字符(即 22 个单词)的打字速度相当于其同龄健全人智能手机打字速度的81%,而词错误率仅约 1.6%。这一速度超过了此前基于手写解码的脑机接口所报道的最先进水平。


除预设的句子复制任务外,参与者还可以自由键入任意想表达的句子,系统同样能够准确解码并输出。值得注意的是,这套系统仅需 30 个句子的练习即可开始有效工作。


视频 | T18 以自身节奏输入屏幕提示的每句话,研究人员按下按钮终止每句话的解码。



iBCI 打字神经假体


与以往依赖逐个点选屏幕虚拟键盘或解码手写轨迹的脑机接口不同,该神经假体的核心设计理念在于利用大多数人已经熟悉的 QWERTY 键盘布局,从而避免了使用者学习全新操作模式的必要。

系统的工作原理始于对患者尝试性手指运动意图的精准捕捉与解码,包含四个流程。


1.研究团队将每个手指的三种典型运动(上伸、下按及弯曲)分别映射到虚拟键盘的上下三行按键上。

2.当患者在脑海中尝试或想象这些手指动作时,植入大脑运动皮层的微电极阵列能够实时捕捉与这些特定运动意图相关的神经电活动。

3.循环神经网络(RNN)对这些信号进行实时分析,预测患者意图敲击的字符并在屏幕上高亮显示。

4.为了进一步提升输出的连贯性与准确性,系统还引入了 5-gram 语言模型,该模型通过统计概率对字母序列进行智能纠错与预测,确保最终生成的句子通顺且符合语言习惯。


图 | 键盘布局高度还原标准 QWERTY 键盘。用户界面配备的手指引导和文字提示,帮助用户将手指动作与键盘字符精准对应。参与者通过执行与键盘布局对应的系列手指动作来构建句子。字符概率由神经特征 RNN 预测,语言模型持续更新字符概率,并实时在屏幕上显示最新预测的句子。


图 | c. 指示延迟孤立手指运动任务。每位受试者被要求在试验间返回静息状态,并在整个 Go 指令期间保持手指姿势。d. 静息位置、“向上伸展”、“向下伸直”及“向掌心内收”动作。


在实际应用中,该系统展现出显著的技术优势。其校准过程极为高效,仅需约 30 个句子的训练数据即可完成系统初始化并达到可用状态。同时,打字节奏完全由患者的思维节奏自主控制,实现了真正的自我调节式交流。此外,由于键位布局符合常规认知,随着使用熟练度的提升,患者无需持续紧盯屏幕即可进行类似“盲打”的操作,这极大地提升了使用的便利性与自由度



为何这项研究更有优势?


基于 QWERTY 键盘的技术路径在处理解码错误方面具有特定优势。


在手写过程中,字形相似的字符(如“a”与“o”)容易被混淆,而这些字符在语言学统计上往往具有较高的互换性,导致语言模型难以进行有效纠错。 相比之下,QWERTY 键盘上物理位置相邻的键位在语言构造中的互换性较低,因此由相邻键位引发的输入错误更容易被统计模型识别并修正,从而在系统层面保证了更高的词级准确率。此外,这种设计充分利用了患者既有的键盘操作记忆,大幅降低了学习成本


图 | a,b,T17(a)  和 T18(b)离线字符替换 RNN 在打字任务中的解码错误。c,T5 离线字符替换 RNN 在手写任务中的解码错误。字符顺序和手指对应的彩色方框与手写任务无关,但为便于比较而显示。


该研究还揭示了大脑对双侧精细手指动作的编码能力。两位参与者中,T18 在双侧运动皮层植入了微电极阵列,而 T17 仅在左侧运动皮层植入阵列。研究结果显示,即使仅凭单侧半球记录,也能解码双手的手指动作意图,这表明大脑对双侧手部运动存在复杂的表征机制。这一发现不仅支撑了当前打字系统的实现,也为未来恢复更复杂的双手运动功能奠定了基础。


图 | a,左半球T17微电极阵列位置。在以下皮质区域各放置两个阵列:背侧中央前回(6d)、中部中央前回(55b)和腹侧中央前回(6v)。b,T18微电极阵列位置的左右半球视图。左半球背侧中央前回放置四个阵列,右半球背侧中央前回(区域6d)放置两个阵列。



未来展望


展望未来,研究团队计划将打字神经假体与邮件、短信、社交媒体等数字通信界面相连接,使患者能够像健全人一样进行多样化的数字交互。打出的句子可通过文本转语音系统发声,也可保留在屏幕上用于文字交流,从而在一定程度上恢复患者的沟通隐私和操作自主性。


在功能拓展方面,未来版本将整合手腕动作识别,用于实现数字键、符号键的切换,以及Shift、退格等特殊按键的访问,进一步丰富表达能力和使用场景。


针对长期使用中的神经信号非平稳性问题,研究团队正在探索在线训练算法。该策略可使解码器在患者日常自由打字的过程中持续更新,减少对周期性句子复制校准任务的依赖,从而提升系统的便捷性和实用性。


作者:王跃然

如需转载或投稿,请直接在本文章评论区内留言。


内容中包含的图片若涉及版权问题,请及时与我们联系删除