تبدیل امواج مغزی به کلمات با کمک هوش مصنوعی
سرگرمی کامپیوتری: پژوهشگران مستقر در کالیفرنیا یک سیستم مجهز به هوش مصنوعی توسعه داده اند که می توان از آن برای بازیابی گفتار طبیعی در افراد گرفتار فلج اندام ها در لحظه و با بهره گیری از صدای واقعی خود فرد استفاده کرد.
به گزارش سرگرمی کامپیوتری به نقل از ایسنا، این تکنولوژی جدید توسط پژوهشگران دانشگاه کالیفرنیا برکلی و دانشگاه کالیفرنیا سانفرانسیسکو توسعه یافته است و از دستگاه هایی بهره می برد که می توانند برای اندازه گیری فعالیت عصبی مغز استفاده شوند. علاوه بر این هوش مصنوعی یاد می گیرد که صدای فرد بیمار را بازسازی کند.
به نقل از نیواطلس، این قدمی بسیار جلوتر نسبت به پیشرفت های سال قبل در حوزه رابط های مغز و کامپیوتر است.
گوپالا آنومانچیپالی (Gopala Anumanchipalli)، استادیار مهندسی برق و علوم کامپیوتر در دانشگاه کالیفرنیا برکلی و محقق اصلی این مطالعه توضیح می دهد: رویکرد ما، ظرفیتی مشابه رمزگشایی سریع گفتار توسط دستگاه هایی مانند الکسا و سیری را به پروتزهای عصبی می آورد. با بهره گیری از نوع مشابهی از الگوریتم، متوجه شدیم که می توانیم داده های عصبی را رمزگشایی نماییم و برای نخستین بار، جریان صدای تقریباً همزمانی را فعال نماییم. نتیجه، بازسازی گفتار طبیعی تر و روان تر است.
نکته جالب در مورد این فناوری این است که می تواند بطور موثر با طیف وسیعی از رابط های مغز کار کند که شامل آرایه های الکترودی با چگالی بالا که فعالیت عصبی را مستقیما از سطح مغز ثبت می کنند و همین طور میکروالکترودهایی که به سطح مغز نفوذ می کنند و همین طور سنسورهای غیرتهاجمی الکترومیوگرافی سطحی (sEMG) روی صورت برای اندازه گیری فعالیت عضلات می شود.
ابتدا، پروتز عصبی، از داده های عصبی از قشر حرکتی مغز بیمار که تولید گفتار را کنترل می کند، نمونه برداری می کند. سپس هوش مصنوعی این داده ها را به صورت گفتار رمزگشایی می کند. یکی از نویسندگان این مقاله، توضیح داد: آن چه را که ما رمزگشایی می نماییم، پس از وقوع یک فکر رخ داده است، بعد از آن که تصمیم گرفتیم چه بگوییم، بعد از آن که تصمیم گرفتیم از چه کلماتی استفاده نمائیم و چگونه ماهیچه های دستگاه صوتی خودرا حرکت دهیم.
هوش مصنوعی بر روی داده های عملکرد مغزی بیماری که در کوشش برای گفتن کلماتی بود که روی صفحه نمایش جلوی او ظاهر می شد، آموزش دیده است. این کار به پژوهشگران اجازه داد تا فعالیت عصبی و کلماتی را که فرد می خواست بیان کند، ترسیم کنند.
علاوه بر این، یک مدل تبدیل متن به گفتار که با بهره گیری از صدای خود بیمار پیش از لطمه و فلج شدن به وجود آمده است، صدایی را تولید می کند که مشابه صحبت کردن بیمار است.
بااینکه انگار گفتار به دست آمده کاملا طبیعی نیست، اما بسیار نزدیک به آنست. سیستم رمزگشایی، سیگنال های مغزی و خروجی گفتار را در یک ثانیه از زمانی که بیمار تلاش می کند صحبت کند، شروع می کند. این در مقایسه با هشت ثانیه در مطالعه قبلی که این گروه در سال ۲۰۲۳ انجام داده بود، بهبود داشته است.
این فناوری می تواند کیفیت زندگی افراد فلج و ناتوان را با کمک به آنها در برقراری ارتباط برای رفع نیازهای روزمره گرفته تا بیان افکار پیچیده و ارتباط طبیعی تر با عزیزانشان، تا حد زیادی بهبود بخشد.
قدمهای بعدی پژوهشگران موجب می شود که آنها سرعت پردازش هوش مصنوعی را برای تولید سریع تر گفتار بالا برند و راه هایی را برای رساتر کردن صدای خروجی بررسی نمایند.
منبع: سرگرمی كامپیوتری
این مطلب را می پسندید؟
(0)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب