دانشمندان سیستم هوش مصنوعی متمرکز بر تبدیل افکار به متن را توسعه دادند

الکس هوث (سمت چپ)، شیلی جین (مرکز) و جری تانگ (راست) برای جمع‌آوری داده‌های مربوط به فعالیت مغز در مرکز تصویربرداری زیست پزشکی در دانشگاه تگزاس در آستین آماده می‌شوند. محققان رمزگشای معنایی خود را بر روی ده ها ساعت داده های مربوط به فعالیت مغزی شرکت کنندگان، که در یک اسکنر fMRI جمع آوری شده بود، آموزش دادند.

عکس: نولان زانک/دانشگاه تگزاس در آستین.

بر اساس مطالعه ای که روز دوشنبه در مجله Nature Neuroscience منتشر شد، دانشمندان یک سیستم هوش مصنوعی غیرتهاجمی ایجاد کرده اند که بر ترجمه فعالیت مغز افراد به یک جریان متن متمرکز است.

این سیستم که رمزگشای معنایی نامیده می‌شود، در نهایت می‌تواند برای بیمارانی مفید باشد که پس از سکته، فلج یا سایر بیماری‌های دژنراتیو توانایی خود را در برقراری ارتباط فیزیکی از دست داده‌اند.

محققان دانشگاه تگزاس در آستین این سیستم را تا حدی با استفاده از یک مدل ترانسفورماتور توسعه دادند که شبیه مدل‌هایی است که از چت ربات Google Bard و چت ربات OpenAI ChatGPT پشتیبانی می‌کنند.

شرکت‌کنندگان در این مطالعه رمزگشا را با گوش دادن به پادکست‌های چند ساعته در یک اسکنر fMRI، که قطعه بزرگی از دستگاه است که فعالیت مغز را اندازه‌گیری می‌کند، آموزش دادند. این سیستم به هیچ نوع ایمپلنت جراحی نیاز ندارد.

PH.D. دانشجوی جری تانگ برای جمع آوری داده های فعالیت مغز در مرکز تصویربرداری زیست پزشکی در دانشگاه تگزاس در آستین آماده می شود.

عکس: نولان زانک/دانشگاه تگزاس در آستین.

هنگامی که سیستم هوش مصنوعی آموزش داده شد، می‌تواند جریانی از متن را زمانی که شرکت‌کننده در حال گوش دادن به یا تصور گفتن یک داستان جدید است تولید کند. متن به دست آمده رونوشت دقیقی نیست، اما محققان آن را با هدف گرفتن افکار یا ایده های کلی طراحی کردند.

طبق یک نسخه، سیستم آموزش دیده متنی را تولید می کند که تقریباً یا دقیقاً با معنای مورد نظر کلمات اصلی شرکت کننده مطابقت دارد در حدود نیمی از مواقع.

به عنوان مثال، هنگامی که یکی از شرکت‌کنندگان در طی آزمایشی کلمات “من هنوز گواهینامه رانندگی خود را ندارم” را شنید، این افکار به این جمله تبدیل شد که “او هنوز شروع به یادگیری رانندگی نکرده است.”

الکساندر هوث، یکی از رهبران این مطالعه، در این نشریه گفت: «برای یک روش غیرتهاجمی، این یک جهش واقعی در مقایسه با آنچه قبلا انجام شده است، که معمولاً تک کلمات یا جملات کوتاه است، است. “ما در حال دریافت مدلی برای رمزگشایی زبان پیوسته برای مدت زمان طولانی با ایده های پیچیده هستیم.”

همچنین از شرکت‌کنندگان خواسته شد تا چهار ویدیو را بدون صدا در حین حضور در اسکنر تماشا کنند و سیستم هوش مصنوعی قادر به توصیف دقیق «رویدادهای خاص» از آنها بود.

از روز دوشنبه، رمزگشا را نمی توان خارج از محیط آزمایشگاهی استفاده کرد زیرا به اسکنر fMRI متکی است. اما محققان بر این باورند که در نهایت می‌توان از طریق سیستم‌های تصویربرداری قابل حمل‌تر مغزی استفاده کرد.

محققان برجسته این مطالعه یک درخواست ثبت اختراع PCT برای این فناوری ثبت کرده اند.