الذكاء الاصطناعي يحوّل موجات الدماغ إلى كلام طبيعي في الوقت الحقيقي

في إنجاز علمي غير مسبوق يمثل نقلة نوعية في مجال واجهات التخاطب بين الدماغ والحاسوب (BCIs)، كشف فريق بحثي من جامعتي كاليفورنيا في بيركلي وسان فرانسيسكو عن تقنية مبتكرة تتيح استعادة القدرة على إنتاج كلام طبيعي لدى الأفراد الذين يعانون شللًا حادًا يؤثر في قدرتهم على التواصل اللفظي.
حل جذري لمشكلة تأخير الاستجابة
لطالما واجهت تقنيات الأطراف الاصطناعية العصبية المخصصة للكلام تحديًا جوهريًا يتمثل في زمن الانتقال، وهو التأخير الزمني بين نية الشخص المصاب التحدث وبين إنتاج الصوت فعليًا. وقد أدى هذا التأخير إلى جعل التواصل غير طبيعي وبطيئًا. ولكن باستخدام تقنيات الذكاء الاصطناعي الحديثة، نجح الباحثون في تطوير نهج بث مباشر يتيح تحويل الإشارات الدماغية المعقدة إلى كلام مسموع لحظيًا، في وقت يقترب كثيرًا من التوقيت الفعلي لمحاولة الكلام.
تقنيات ذكاء اصطناعي مستلهمة من “أليكسا” و”سيري”
اعتمد الفريق البحثي بقيادة الدكتور “جوبالا أنومانشيبالي” والدكتور “إدوارد تشانج” على خوارزميات ذكاء اصطناعي متقدمة قادرة على فك تشفير الإشارات العصبية بسرعة تعادل تلك التي تعتمدها المساعدات الذكية مثل “سيري” و”أليكسا”. وصرّح د. أنومانشيبالي:
“نهجنا الجديد يمكّن واجهات التخاطب العصبية من تحقيق بث صوتي شبه متزامن، ما يجعل توليف الكلام أكثر طبيعية وطلاقة.”
كيف تعمل التقنية؟
تعتمد هذه الواجهة على تسجيل الإشارات العصبية من القشرة الحركية المسؤولة عن التحكم في الكلام، ثم تُستخدم خوارزميات ذكاء اصطناعي لفك تشفير هذه الإشارات وتحويلها إلى صوت منطوق. وكما أوضح الباحث تشول جون تشو، فإن هذه الإشارات تلتقط في لحظة ما بعد اتخاذ القرار بالكلام، أي بعد تكوين الجملة ذهنيًا وقبل تحريك العضلات المسؤولة عن النطق.
تجربة سريرية واعدة
لإثبات فعالية التقنية، استعان الباحثون بحالة متطوعة تُدعى “آن”، والتي تعاني شللًا يمنعها من التحدث. طُلب منها محاولة نطق جمل ظاهرية على الشاشة دون إصدار أي صوت، وتم تسجيل إشارات دماغها خلال هذه المحاولة. ولتعويض غياب المخرجات الصوتية، استخدم الفريق نموذج تحويل نص إلى كلام مدعومًا بصوت آن المسجل سابقًا قبل إصابتها، مما منح الصوت الناتج طابعًا شخصيًا.
تقليص التأخير من 8 ثوانٍ إلى ثانية واحدة
في الدراسة السابقة، كان فك تشفير جملة واحدة يستغرق نحو 8 ثوانٍ. أما الآن، فقد نجح الفريق في تقليص الزمن إلى ثانية واحدة فقط، ما يتيح توليد الصوت بشكل شبه فوري بعد محاولة التحدث، وبشكل متواصل دون توقف. والأهم من ذلك، أن السرعة المتزايدة لم تؤثر في دقة الأداء، إذ حافظت الواجهة على مستوى عالٍ من الدقة في فهم وتحويل الإشارات العصبية إلى كلام.
مرونة تقنية تناسب أنواعًا متعددة من الواجهات
ما يجعل هذه التقنية أكثر إثارة هو مرونتها العالية، إذ لا تقتصر على نوع واحد من واجهات الدماغ، بل نجحت الخوارزمية نفسها في العمل بكفاءة مع مصفوفات أقطاب كهربائية دقيقة (MEAs) تغوص في الدماغ، وكذلك مع واجهات غير جراحية مثل (sEMG) التي تعتمد على مستشعرات خارجية لقراءة نشاط العضلات.
آفاق مستقبلية واعدة
أكد الدكتور إدوارد تشانج أن هذه التقنية تحمل وعودًا هائلة بإحداث تحول جذري في حياة الأشخاص الذين فقدوا قدرتهم على الكلام، مشيرًا إلى أن التطورات المتسارعة في الذكاء الاصطناعي تعجل بتحويل واجهات التخاطب العصبي إلى أدوات عملية قابلة للاستخدام اليومي.
أمازون تريدك أن تتوقف عن التحدث إلى أليكسا كثيرًا