تقلید هوش مصنوعی از مغز انسان برای استفاده از مدل های زبانی

باشگاه خبرنگاران

به گزارش باشگاه خبرنگاران جوان، در سال 2019، مجله MIT Press Reader دو مصاحبه با نوام چامسکی و استیون پینکر، دو نفر از برجسته‌ترین دانشمندان زبان‌شناسی و شناختی جهان منتشر کرد. هنگامی که موضوع یادگیری ماشین و سهم آن در علوم شناختی مطرح می شود، نظرات آنها رنگ و بویی از شک و تردید و چیزی نزدیک به ناامیدی به خود می گیرد.. چامسکی می‌گوید: « صرف نظر از ارزشی که ممکن است برای ساخت وسایل مفید یا کاوش ویژگی‌های آن داشته باشد تقریباً از هر جنبه، بررسی اینکه چگونه یادگیری ماشینی به علم کمک می‌کند دشوار است به‌ویژه در علم شناختی که فرآیندهای محاسباتی به کار گرفته شده است.»

در حالی که پینکر می گوید: «خود علم شناختی در دهه 1990 تحت الشعاع علوم اعصاب و هوش مصنوعی در این دهه قرار گرفت، اما من فکر می‌کنم که این رشته‌ها باید بر عقیم بودن نظری خود غلبه کنند و با مطالعه شناخت دوباره ادغام شوند. فیزیولوژی عصبی و یادگیری ماشینی هرکدام زمانی که به موانعی بر می خورند به هوش روشنگر می رسد.»

به هر اندازه که درک ما از هوش مصنوعی و انسان افزایش می یابد، موقعیت هایی مانند این ممکن است به زودی خود را در شرایطی ناپایدار بیابند. در حالی که هوش مصنوعی هنوز به شناختی شبیه انسان دست پیدا نکرده است، شبکه‌های عصبی مصنوعی که پردازش زبان را تکرار می‌کنند به طرز شگفت‌آوری شبیه به آنچه در ساختار مغز انسان می‌بینیم به نظر می‌رسند. در ماه نوامبر، گروهی از محققان در MIT مطالعه‌ای را در مجموعه مقالات آکادمی ملی علوم منتشر کردند که نشان می‌دهد تحلیل روند یادگیری ماشینی می‌تواند پنجره‌ای به این مکانیسم‌های عملکرد شناختی بالاتر مغز ارائه دهد. شاید حتی نکته شگفت‌انگیزتر این مطالعه این موضوع باشد که هوش مصنوعی در حال تحول همگرا با طبیعت است بدون اینکه کسی برای انجام این کار برنامه‌ریزی کند.

هوش مصنوعی و مغز

هوش مصنوعی با استفاده از یادگیری ماشینی در سال های اخیر پیشرفت های چشمگیری به ویژه در زمینه تشخیص بصری داشته است. برای مثال اینستاگرام از هوش مصنوعی تشخیص تصویر برای توصیف عکس‌ها برای افراد کم بینا استفاده می‌کند، گوگل از آن برای عملکرد جستجوی عکس معکوس استفاده می‌کند، و الگوریتم‌های تشخیص چهره شرکت‌هایی مانند Clearview AI به سازمان‌های مجری قانون کمک می‌کند تصاویر موجود در رسانه‌های اجتماعی را با تصاویر موجود در پایگاه‌های اطلاعاتی دولتی برای شناسایی افراد تحت تعقیب تطبیق دهند. جدای از بحث های مهم اخلاقی، این مکانیک نحوه عملکرد این الگوریتم ها است که می تواند عملکرد شناختی را واضح کند. با مقایسه فعالیت عصبی انسان داده‌های با مدل‌های یادگیری ماشینی شبکه عصبی مصنوعی با عملکردی مشابه محققان می‌توانند بینشی در مورد این که کدام برنامه‌ها بهتر کار می‌کنند و کدامیک عملکرد ضعیف تری دارند، به دست آورند. این مطالعات و بررسی ها نشان می دهند که عملکرد سیستم مذکور شباهت زیادی به نحوه انجام همان کار توسط مغز دارد.

مارتین شریمپ، اولین نویسنده مطالعه جدید MIT، در مصاحبه ای با Interesting Engineering توضیح داد: «ما در مدل سازی نواحی حسی مغز به ویژه در زمینه بینایی موفقیت هایی داشته ایم.» شریمپ دانشجوی دکتری دپارتمان مغز و علوم شناختی MIT، این مقاله را با Joshua Tenenbaum، مدرس علوم شناختی محاسباتی در MIT و یکی از اعضای آزمایشگاه هوش مصنوعی موسسه، و Evelina Fedorenko، دانشیار علوم اعصاب در دانشگاه، نوشتند. در پی این موفقیت‌ها، مارتین درباره این موضوع کنجکاو شد که آیا می‌توان همان اصل را برای عملکردهای شناختی سطح بالاتر مانند پردازش زبان به کار برد یا خیر. شریمپ گفت: «من پیشنهاد کردم که فقط به شبکه های عصبی موفق نگاه کنیم و ببینیم که آیا چیزی شبیه به مغز هستند یا خیر. شرط من این بود که حداقل تا حدودی جواب بدهد.»

یادگیری ماشینی که مغز را منعکس می کند

یافته‌ای که بلافاصله توجه مارتین را جلب می کند این است که برخی از مدل‌ها داده‌های عصبی را به خوبی پیش‌بینی می‌کنند. به عبارت دیگر، صرف نظر از اینکه یک مدل چقدر در انجام یک کار خوب بوده است، برخی از آنها به نظر شبیه مکانیک شناختی مغز برای پردازش زبان هستند. به طرز جالبی، تیم MIT مدل های GPT را به عنوان شبیه ترین مغز در گروهی که آن را بررسی کردند، شناسایی کردند

GPT یک مدل یادگیری است که برای تولید انواع متن به زبان انسان آموزش دیده است. این توسط Open AI، آزمایشگاه تحقیقاتی هوش مصنوعی تاسیس شده توسط ایلان ماسک توسعه داده شد که در ژوئن امسال یک ابزار هوش مصنوعی جدید با قابلیت نوشتن کدهای کامپیوتری را معرفی کرد. تا همین اواخر، GPT-3، آخرین تکرار برنامه، تنها بزرگترین شبکه عصبی ایجاد شده با بیش از 175 میلیارد پارامتر یادگیری ماشینی بود. این یافته می تواند دریچه بزرگی را به نحوه انجام مغز حداقل بخشی از عملکرد شناختی سطح بالاتر مانند پردازش زبان باز کند. GPT بر اساس اصل پیش بینی کلمه بعدی در یک دنباله عمل می کند. مطابقت بسیار خوبی با داده‌های به‌دست‌آمده از اسکن‌های مغزی نشان می‌دهد که هر کاری که مغز با پردازش زبان انجام می‌دهد، پیش‌بینی جزء کلیدی آن است.

شریمپ همچنین خاطرنشان می‌کند که در موقعیت‌هایی که متون و داستان‌های طولانی‌تر به آزمودنی‌ها نشان داده می‌شد، همه مدل‌های شبکه عصبی در مقایسه با نحوه امتیازدهی آنها به متون کوتاه برد نسبتاً ضعیف عمل کردند. مارتین می گوید: «تفسیرهای مختلفی برای این موضوع وجود دارد. اما تفسیر هیجان‌انگیزتر، که با آنچه در حال حاضر یادگیری ماشینی به صورت شهودی انجام می‌دهد همخوانی دارد، این است که شاید این مدل‌ها واقعاً در شکل‌دهی نمایش‌های کوتاه برد مناسب خوب باشند اما هنگامی که شما زمینه های معنایی دارید که باید آن را جمع آوری کنید، شاید آنها کوتاهی کنند.

دومین یافته مهم این تیم چیزی را در مورد نحوه عملکرد شناخت ما در مورد زبان نشان می دهد، زیرا آنها وظایف زبانی مختلف را از طریق ترکیبی از هشت معیار مختلف که شامل جنبه هایی مانند دستور زبان، قضاوت و درهم تنیدگی بودند، آزمایش کردند. مارتین می‌گوید: «هیچ‌کدام از آنها با هم مرتبط نبودند. بنابراین، حتی اگر این مدل‌ها این وظایف را به خوبی انجام دهند، این به هیچ وجه پیش‌بینی نمی‌کند که چقدر با مغز مطابقت دارند. این چیزی است که به نظر می رسد سیستم زبان ما برای انجام آن بهینه شده است.»

برای درک دقیق اینکه چرا برخی از مدل ها بیشتر از بقیه شبیه مغز هستند، به مطالعه بیشتری نیاز است. این تا حدودی به این واقعیت مربوط می شود که در یادگیری ماشینی، مدل های هوش مصنوعی می توانند چیزی شبیه جعبه سیاه باشند، که در آن عملکردهای آنها به قدری پیچیده است که حتی افرادی که آنها را طراحی کرده اند ممکن است نتوانند درک کنند که چگونه متغیرهایی که وارد می شوند در آن مدل ها به یکدیگر مرتبط هستند. مارتین تصدیق می کند که تجزیه این متغیرها می تواند یک کار بزرگ باشد. او می‌گوید: «برای مدل‌های جداگانه، ما هنوز نمی‌دانیم اگر یک لایه کمتر در شبکه عصبی یا واحدهای کمتر یا واحدهای بیشتری داشته باشیم، چه اتفاقی می‌افتد».

سومین یافته اصلی این مطالعه و یکی از آنها که منحصر به فردترین یافته آن را به نظریه‌های شناخت مرتبط می‌کند، این است که هر چه یک مدل هوش مصنوعی شبیه مغز باشد، بیشتر می‌تواند با رفتار انسان و زمان‌های مطالعه فردی آزمودنی‌ها مطابقت داشته باشد. کنار هم قرار دادن تصویر، ترکیب غیرمنتظره ای از دانش علمی را نشان می دهد که مارتین از آن به عنوان "مثلث" یاد می کند. مدل‌هایی که از پیش‌بینی کلمه بعدی استفاده می‌کنند، نمرات مغز سوژه‌ها را منعکس می‌کنند، که به نوبه خود می‌تواند برای پیش‌بینی رفتار انسان استفاده شود.

مارتین همچنین می‌گوید: «من فکر می‌کنم این مثلث بینش‌ها فوق‌العاده جالب است. اکنون که از بینش و سایر زمینه ها درس هایی آموختیم، توانستیم همه اینها را در یک مطالعه جمع آوری کنیم. مدل‌هایی که در پیش‌بینی کلمه بعدی بهتر هستند، بهتر می‌توانند پاسخ‌های عصبی را در مغز انسان پیش‌بینی کنند، و مدل‌هایی که پاسخ‌های عصبی را بهتر پیش‌بینی می‌کنند، بهتر می‌توانند رفتار را در قالب زمان‌های خودخوانی پیش‌بینی کنند. »

یکی از دلایلی که این مطالعه بسیار جذاب است این است که این بینش ها در مورد شناخت به طور همزمان به نوعی "تکامل هوش مصنوعی" در حال وقوع اشاره می کند، تحولی که تا همین اواخر مورد توجه قرار نگرفته بود. مهم است که به خاطر داشته باشید که هیچ‌کس عمداً هیچ یک از این مدل‌ها را طوری برنامه‌ریزی نکرده است که مانند مغز عمل کنند، اما در طول ساخت و ارتقای آنها، به نظر می‌رسد که ما به فرآیندی شبیه فرآیندی که خود مغز را تولید می‌کند، برخورد کرده‌ایم و شاید از این راه بتوانیم به افرادی که مشکلات درک زبان دارند کمک کنیم.

مارتین توضیح می‌دهد که وظایف پیش‌بینی زبان در نهایت شبیه مغز به نظر می‌رسند. ما در مقاله حدس می زنیم که شاید آنچه جامعه پردازش زبان طبیعی انجام می دهد چیزی شبیه تکامل جامعه باشد. اگر یک معماری AI را انتخاب کنید و به خوبی کار کند، سپس بخش‌هایی از آن را که کار می‌کنند، «جهش» می‌دهید، آن را با معماری‌های دیگری که به خوبی کار می‌کنند ترکیب می‌کنید و معماری‌های جدید می‌سازید. این معماری هر دو مدل مغز و هوش مصنوعی است که مارتین احساس می‌کند بینش بالقوه نهایی این مطالعه باشد، اگرچه این مدلی است که آثار آن هنوز در حال مشاهده است. در حالی که شبکه‌های عصبی را می‌توان بر روی داده‌ها آموزش داد تا عملکرد بهتر یا مشابه‌تری با مغز داشته باشند، به نظر می‌رسد ساختار زیربنایی آنها اهمیت زیادی دارد.

بیشتر بخوانید

ردیابی بیماران کرونایی با هوش مصنوعی

مارتین توضیح می دهد: «به نظر می رسد که این ساختارهای ذاتی در مدل ها چیزهای زیادی به شما می دهد. اگر به این مدل‌ها نگاه کنید، هنوز چیزی حدود 50 درصد از آموزش آنها بر روی داده‌ها را به دست می‌آورید، اما فکر می‌کنم هیچ‌کدام از ما انتظار نداشتیم که این ساختار شما را در فضای بازنمایی مناسب قرار دهد.

آینده تحقیقات هوش مصنوعی شریمپ و همکارانش بر گسترش یک پلتفرم اطلاعاتی متمرکز شده‌اند که مقادیر زیادی از این نوع داده‌ها و مدل‌های زبان را جمع‌آوری می‌کند و آنها را برای جامعه علمی در سطح وسیع برای کمک به تسریع پیشرفت بیشتر در دسترس قرار می‌دهد.

در حالی که هیچ هدف نهایی واحدی برای این نوع تحقیق وجود ندارد، مارتین تشخیص می‌دهد که ایجاد درک جامع‌تری از شناخت و در عین حال استفاده از این درک برای ایجاد برنامه‌های کاربردی عملی که قادر به کمک به افراد هستند، دو روی یک سکه هستند. او می‌گوید: «این چیزها از نظر علمی مفید هستند، زیرا آنها بخشی از یک فرضیه علمی یکپارچه از همه چیزهایی هستند که ما درباره یک فضای مغزی خاص می‌دانیم. من در حال حاضر روی تحریک مدل‌سازی کار می‌کنم. در حالت ایده‌آل، سوژه‌ای را روی صندلی داشته باشیم که به صفحه‌ای خاکستری نگاه می‌کند، سپس از مدل می‌پرسیم: «اگر بخواهم باور کند که سگی را روی صفحه خاکستری می‌بیند، چه نوع واکنشی خواهد داد و درخواست کنیم که این واکنش را توضیح دهد. سپس مغز را بر اساس آن تحریک می کنیم، و آنها یک سگ را می بینند. من فکر می کنم این یک جهت خوب برای بینایی است. چیزی شبیه به این را می توان با زبان انجام داد.

همچنین این محقق درباره چگونگی کمک کردن به کسانی که مشکل زبان دارند گفت: من فکر می کنم یک جهت وجود دارد من محتاطانه امیدوار هستم. چنین تحقیقات و پروژه هایی بدون شک الهام بخش مکالمات جدیدی در زمینه های یادگیری ماشینی، علوم اعصاب و شناخت خواهند بود. همچنین بر یکی از بحث‌های شدیدتر در جامعه علمی تأثیر می‌گذارد، بحثی که می‌پرسد آیا مغز اصلاً مدل خوبی برای یادگیری ماشینی است یا خیر، و آیا این موضوع حتی اهمیت دارد یا خیر.

انتهای پیام/

منبع خبر: باشگاه خبرنگاران

اخبار مرتبط: تقلید هوش مصنوعی از مغز انسان برای استفاده از مدل های زبانی

موضوعات مرتبط: پردازش زبان طبیعی رسانه های اجتماعی زبان شناسی شناختی شبکه عصبی مصنوعی آکادمی ملی علوم فیزیولوژی عصبی یادگیری ماشینی شبکه های عصبی استیون پینکر علوم شناختی نوام چامسکی اینستاگرام تشخیص چهره علوم اعصاب هوش مصنوعی دستور زبان ایلان ماسک علم شناختی جامعه علمی پیچیده است