رقابت نفس‌گیر هوش‌مصنوعی با باهوش‌ترین دانش‌آموزان جهان

خبر آنلاین

غزال زیاری: سیستم توسعه یافته توسط DeepMind گوگل، رکورد جدیدی را از عملکرد هوش مصنوعی در حل مسائل هندسه را به نمایش گذاشت. این سیستم که AlphaGeometry نام دارد، توانست تا به ۲۵ سوال از ۳۰ سوال هندسه‌ای که از المپیادهای جهانی بین‌المللی ریاضی در بین سال‌های ۲۰۰۰ تا ۲۰۲۲ استخراج شده بود، پاسخ دهد.

بدین‌ترتیب این نرم‌افزار، از اکثریت ریاضی‌دانان جوان و برندگان مدال طلای IMO پیشی گرفته است. خود DeepMind پیش‌بینی کرده که یک دارنده مدال طلای المپیاد می‌تواند ۲۶ سوال از ۳۰ سوال را حل کند.

بسیاری از افراد IMO را معتبرترین مسابقه ریاضی جهان برای دانش‌آموزان دبیرستانی می‌دانند. DeepMind در این رابطه نوشت:« از آنجا که مدل‌های زبانی در شناسایی الگوها و روابط‌عمومی در داده‌ها برتری دارند، این قابلیت را دارند که به سرعت به پیش‌بینی سازه‌های بالقوه مفید بپردازند. اما در اغلب مواقع توانایی استدلال دقیق یا توضیح تصمیمات خود را ندارند. از همین رو و برای غلبه بر این مشکل، DeepMind یک مدل زبان را با یک موتور کسر نمادین سنتی‌تر که استدلال جبری و هندسی را انجام می‌دهد، با هم همراه کرد.»

این تحقیق توسط Trieu Trinh، دانشمند کامپیوتر که اخیرا دکترای خود را از دانشگاه نیویورک گرفته، هدایت شد. ایوان چن، دارنده مدال طلای المپیاد سابق، بعد از ارزیابی برخی از خروجی‌های AlphaGeometry، به تمجید از آن پرداخت و گفت:« این حیرت‌انگیز است؛ چرا که هم قابل تائید و هم تر و تمیز است.» این در حالی است که برخی از نرم‌افزارهای قبلی، اثبات‌های پیچیده‌ای را برای هندسه ارائه می‌دادند که درک آن برای بازدیدکنندگان دشوار بود. اما خروجی AlphaGeometry مشابه آنچه که یک ریاضیدان می‌نویسد، خواهد بود.

AlphaGeometry بخشی از یک پروژه بزرگتر DeepmMind است که برای بهبود قابلیت‌های استدلال مدل‌های زبان بزرگ با ترکیب آنها با الگوریتم‌های جستجوی سنتی به کار می‌رود. DeepMind مقالات متعددی در این باره منتشر کرده است.

راه حل DeepMind برای غلبه بر نقطه ضعف‌ها

نقطه ضعف یک مدل زبان این است که در استدلال قیاسی عالی نیست؛ از همین رو تیم DeepMind یک معماری ترکیبی را توسعه داده‌اند که یک موتور کسر نمادین به شکل مکانیکی نتایجی را به دست می‌آورد که به صورت منطقی از فرضیه‌های دریافتی ناشی می‌شوند و به شکل دوره‌ای، کنترل به یک مدل زبان منتقل می‌شود که خلاقانه‌تر خواهد بود.

آنچه کار را دشوار می‌کند این است که برای آموزش یک مدل زبان جدید، به داده‌های زیادی نیاز خواهد بود و این در حالی است که داده‌های کافی درباره مسائل هندسی سخت و دشوار وجود ندارد؛ از همین رو ترین و همکارانش به جای تکیه بر مسائل هندسه طراحی شده توسط انسان، یک پایگاه داده عظیم از مسئله‌های چالش برانگیز هندسه ایجاد کردند.

معرفی FunSearch

ماه گذشته بود که DeepMind، Funsearch را که یک مدل زبان برای تولید برنامه‌های کامپیوتری را معرفی کرد که از آن برای حل مسائل سخت ریاضی استفاده می‌شود. Funsearch به جای جستجوی درختی از الگوریتم ژنتیک برای کشف فضای برنامه‌های ممکن استفاده می‌کند. اما در سطح انتزاعی‌تر، از همان رویکرد اساسی AlphaGeometry بهره می برد.

شین لگ، یکی از بنیانگذاران و دانشمند ارشد DeepMind در این باره گفته:«این مدل‌های پایه، یک نوع مدل جهانی هستند و برای حل خلاقانه مسئله، باید جستجو را آغاز کرد. برای خلاقیت بیشتر، باید در فضاهای احتمالی به جستجو پرداخته و این جواهرات پنهان شده را بیابید.»

منبع خبر: خبر آنلاین

اخبار مرتبط: رقابت نفس‌گیر هوش‌مصنوعی با باهوش‌ترین دانش‌آموزان جهان

موضوعات مرتبط: المپیادهای جهانی دانشگاه نیویورک الگوریتم ژنتیک بازدیدکنندگان استدلال قیاسی جستجوی درختی دانش آموزان ریاضی دانان پایگاه داده هوش مصنوعی نرم افزار کامپیوتر ریاضیدان حل مسائل نقطه ضعف انتزاعی استخراج توانایی جواهرات مکانیکی