مرجعیت زبان فارسی با واگذاری به هوش مصنوعی از دست ایران می رود
به گزارش خبرگزاری مهر، سید محمد محمدزاده ضیابری، دبیر کمیسیون هوش مصنوعی و علم داده سازمان نظام صنفی رایانهای، در بیست و ششمین نشست از سلسله نشستهای زبانشناخت که با موضوع «تقابل و تعامل هوش مصنوعی با خط و زبان فارسی» برگزار شد، به طرح موضوعاتی چون: لزوم مهار کردن هوش مصنوعی با هدف پیشگیری از آسیبها و تهدیدهای آن در ابعاد فرهنگی و تربیتی، صیانت از واگذاری مرجعیت زبانفارسی به هوش مصنوعی، لزوم داشتن مدل ایرانی توسعه در زمینه هوش مصنوعی نظیر «چتجیپیتی» و «LLM» فارسی متناسب با فرهنگ بومی، مسخر کردن هوش مصنوعی با هدف صیانت از فرهنگ و خط و زبان مان، هشدار در خصوص اختراع زبانی جدید توسط نسل z، لزوم توأم گرفتن جنبههای تهدید و فرصت هوش مصنوعی، ایجاد زیرساختهای ملی در حوزههای پردازشی و حکمرانی دادهها و اعتمادسازی در صنایع پرداخت.
در ابتدا مهدی صالحی، مجری کارشناس این نشست، با اشاره به اوضاع آشفته زبان فارسی در تلاطمات عصر امروز گفت: امروز با یک موقعیت آنومی یا آشوب در حوزه خط و زبان فارسی مواجهیم. گروهی خوشبینانه معتقدند که اتفاقی نیفتاده و اوضاع به سامان است و گروهی دیگر که در کف میدان عمل زبان فارسی هستند، روز به روز بر میزان نگرانیهایشان افزوده میشود، همین دو دستگی نشان از اتفاقی دستکم مجهول دارد و فارغ از بدی و خوبی آن، شناخت آن مهم است.
صالحی با اشاره به تغییر مدام دنیای جدید افزود: هوش مصنوعی مهمترین بحث دنیا است که در کنار آن زبانها نیز دستخوش تغییر و اضمحلال میشوند؛ زبان فارسی نیز یکی از این زبانها است. البته دیگر زبانهای ایرانی و زبانهای حوزه تمدنی جهان اسلام نیز برای ما مهماند چون همان خطری که زبان ما را تهدید میکند، بقیه زبانها را نیز تهدید میکند ولی زبانهای دیگر فکر کردند و سند آینده پژوهی نوشتند و برنامهریزی کردهاند اما در زبان فارسی هیچ رهنگاشتی برای آینده احتمالی پیشرو نداریم.
صالحی گفت: بعضی از آیندههای مطلوب را در کلام رهبری انقلاب پیدا میکنیم اما ذیل آن هیچ آینده محتمل ممکنی برنامهریزی نشده است. در همین به تعبیری، ناسیاستگذاریها و بیبرنامگیهاست که با یک وضعیت پیچیده مواجهیم. در این وضعیت پیچیده زبان فارسی و مشخص نبودن تکلیف آن در این وضعیت ناشناخته، زبانهای قدرتمندی مثل فرانسه و آلمانی و چینی افقی پیش رو دارند و حتی زبانهایی مثل عربی و ترکی استانبولی از ما در این زمینه جلوترند اما زبان فارسی بهواسطه برخی بیتدبیریها و ضد برنامهریزیهایی، که میتوان آنها را ذیل برنامهریزی استعماری و حول و حوش امپریالیسم زبانی تعریف کرد، هیچ سمت و سویی ندارند.
"در همین به تعبیری، ناسیاستگذاریها و بیبرنامگیهاست که با یک وضعیت پیچیده مواجهیم"وی ابراز امیدواری کرد که سخنانی که در این نشست مطرح میشود را متولیان امر کمی بشنوند و بپذیرند که اتفاقات پیش روی ما ناشناختهاند و در این خصوص برنامهریزی کنند.
در ادامه ضیابری، با اشاره به عدم پرداخت به موضوع «تقابل و تعامل هوش مصنوعی با خط و زبان فارسی» گفت: در گذشته با توجه به عدم سیاستگذاریهای درست و بهجا و بنا به فرمایش مقام معظم رهبری ولنگاری فضای مجازی، آسیبهایی به زبان فارسی وارد شد.
وی با اشاره به سهو املایی غلامعلی حداد عادل، رئیس فرهنگستان زبان و ادب فارسی، در یک توئیت، گفت: وقتی ایشان دچار این سهو میشوند، بقیه هم عنوان میکنند که وقتی ایشان خطا میکنند، دیگر چه اهمیتی دارد که ما هم خطا کنیم. این عبارت «چه اهمیتی دارد؟!» یکی از مشکلات زبان فارسی شده است.
وی سپس به غلطهای فاحش در برنامههای زنده و حتی از پیش ضبط شده صدا و سیما اشاره داشت و افزود: اخیراً با وجودی که در برنامه خبری ۲۰:۳۰ به صورت افراطی بر روی استفاده از فارسی به جای واژههای بیگانه در صحبتهای مسؤولین تأکید میشود؛ متأسفانه در همان بخش خبری و در برنامههای متعدد دیگر اعم از زنده و یا ضبطشده به کرات با غلطنویسی و بیان اشتباه کلمات و واژهها مواجه هستیم. به عنوان نمونه استفاده از واژگان کاملاً غلط «گاهن» یا «چهارماً» تبدیل به غلطهای مصطلح شده و به ادبیات عامه راه پیدا کرده است. این در حالی است که به فرموده امام (ره) قرار بود صدا و سیما یک دانشگاه عمومی باشد.
وی با اشاره به رواج شدید غلط نویسی گفت: ما که در عرصه هوش مصنوعی کار میکنیم، یکی از کارهای ابتدایی مان گردآوری و پالایش دادگان و آموزش آنها به سیستمها است. اما درد اصلی ما همین غلطنویسیها شده است.
پیشتر درد ما عدم رعایت آئین نگارش و درستنویسی و فاصلهگذاریهای ناصحیح و یکسری اختلافات بین آموزش و پرورش و فرهنگستان ادب فارسی در آئین نگارش بود؛ اکنون معضل اساسی ما این است که نه تنها در متنهای محاورهای، که غلط نویسی به هر دو شکل سهوی و عامدانه چنان زیاد شده که به متون رسمی، کتابها، مطبوعات و غیره نیز تسری پیدا کرده است. در عمل هیچ متنی را نمیتوانیم به عنوان متن مرجع صحت بیابیم.
وی در ادامه با اشاره به اینکه نسل Z (نسل نوجوانان) در حال اختراع زبانی جدید برای خود است، افزود: این به نوعی طبیعی است چون زبان همیشه پویا و متغیراست و باید این پویایی را داشته باشد ولی نسل Z با سرعت سرسامآوری در حال ابداع کلمات جدید و ورود آنها به زبان و منسوخ کردن کلمات قبلی است.
وی گفت: سایتهای متعددی با هدف جذب مخاطب در حال ترویج و حتی ایجاد واژهنامه برای این نوع کلمات هستند و این موضوع خود موجب ترویج هرچه بیشتر این نوع زبان میشود. همچنین چهار سال پیش، کتابی را دیدم که در حوزه تخصصی عمران چاپ شده بود و به صورت رسمی عنوان کرده بود که از گوگل برای ترجمه استفاده کرده است. چون این کتاب تخصصی و طبیعتاً مخاطب محدودی داشت زیاد محل ایراد نبود اما استفاده از ترجمههای ماشینی بدون بازبینی و ویراستاری به آفتی برای بازار نشر مبدل شده و حتی به حوزههای غیر تخصصی نظیر کتب اجتماعی و رمان هم سرایت کرده است.
وی در ادامه افزود: استفاده از فناوری برای ترجمه و تولید نه تنها نکوهیده نیست که به شدت توصیه میشود. خود ما در مجموعه ترگمان در طول ۵ سال گذشته بیش از ۳۰۰ عنوان کتاب را با استفاده از سامانه ترجمه نسل جدید و با کمک ماشین، ترجمه، ویراستاری و منتشر کردهایم و همزمان بیش از ۲۰ هزار عنوان مقاله نیز توسط همین سیستم ترجمه شده است.
"به عنوان نمونه استفاده از واژگان کاملاً غلط «گاهن» یا «چهارماً» تبدیل به غلطهای مصطلح شده و به ادبیات عامه راه پیدا کرده است"اما اینکه بخواهیم تولیدات فرهنگی را صرفاً با اتکا به ماشین و بدون بازبینی و ویراستاری منتشر کنیم موجب خسارت دو صد چندان خواهد بود.
دبیر کمیسیون هوش مصنوعی و علم داده سازمان نظام صنفی رایانهای، درباره بازار نشر گفت: خطاهای بسیاری، حتی روی جلد کتابهایی که منتشر میشوند، وجود دارد ولی وزارت فرهنگ و ارشاد اسلامی که برای مجوز کتاب بسیار سختگیرانه عمل میکند ممیزیهایش صرفاً در حوزه محتوایی از منظر فرهنگی، سیاسی و مذهبی است و برایش مهم نیست که چه بلایی بر سر زبان فارسی میآید.
سید محمد محمدزاده ضیابری، که ریاست کارگروه حکمرانی داده و زیرساختهای هوش مصنوعی سازمان نصر را نیز بر عهده دارد، با اشاره به رواج «چتجیپیتی» افزود: پیش از این با محتوای وب مشکل داشتیم چرا که با حجم عظیمی از محتوای زرد مواجه بودیم. اما اکنون تولیدکنندگان محتوا با اتکا به «چتجیپیتی» و نظایر در حال تولید و انتشار انبوه محتوایی هستند که در بسیاری از موارد حتی از نظر صحت محتوا نیز مشکل دارد و از منظر ویراستاری نیز با غلطهای فاحش مواجه هستیم.
وی به توییت یکی از فعالان حوزه بهسازی صفحات وب برای موتورهای جستجو اشاره داشت که عنوان کرده بود در چند ماه اخیر نود درصد تولید محتوای فارسی متکی به سیستمهای هوشمصنوعی است و نه انسان.
ضیابری گفت: حجم عظیمی از محتوای منتشر شده روی وب، زرد و زائد است و از آنجایی که با هوش مصنوعی میتوان با هزینه پایین و نزدیک به صفر محتوا تولید کرد این محتوا به شدت رو به فزونی است. نسل جدید دیگر کمتر به کتاب، مطبوعات، تلویزیون و حتی وب مراجعه میکند و بیشتر در حال استفاده از فضای پیامرسانها و شبکههای اجتماعی است. مدل تولید محتوا در پیامرسانها و شبکههای اجتماعی به دلیل ماهیت پر سرعت بودن با غلطنویسیهای فراوان مواجه است و این موضوع بر کاهش هرچه بیشتر سواد نوشتاری و ترویج غلطنویسی تأثیر مستقیم دارد.
محمدزاده ضیابری، در ادامه با اشاره به اینکه هوش مصنوعی و فناوری فقط زبان را تحتالشعاع قرار نداده افزود: معضل بزرگ بعدی در بعد فرهنگی و تربیتی موضوع است. نسل جدید دیگر به جای رجوع به تلویزیون و کتاب و معلم و مربی، و یا حتی دوستان خود به هوش مصنوعی رجوع میکند.
سوالات خود را بیمحابا از هوش مصنوعی میپرسد. سوالاتی در حوزههای مختلف فرهنگی، سیاسی، اجتماعی، عقیدتی و حتی مرتبط با مسائل جنسی و پاسخهایی که میگیرد لزوماً صحیح، مناسب سن، و یا مناسب بافت فرهنگی اجتماعی وی نیستند. این نسل با تکیه بر هوش و کنجکاوی ذاتی خود میتواند به مرزها و محدودیتهای سامانههای هوش مصنوعی را دور زده و پاسخ سوالات خود را بیابد اما ارزیابیهای به عمل آمده حتی در جوامع اروپایی نشان از آن دارد که پاسخهای سیستمهای هوش مصنوعی به دلیل عدم صحت و عدم کنترل توسط والدین، نمیبایست به صورت مستقیم خوراک فکری این نسل را تأمین کنند.
وی با مرور پاسخ چتجیپیتی به پرسشی ظریف در خصوص مقایسه بهائیت با تشیع گفت: وقتی که نوجوان شما مشابه این سوال را به دلیل کنجکاوی از هوش مصنوعی بپرسد لزوماً پاسخی که مطلوب نظر شماست را نمیگیرد و عملاً کنترل افکار و دانش نوجوان را به دست هوش مصنوعی و سازندگان ابزارها سپردهاید.
مدیرعامل شرکت پردازش هوشمند ترگمان، سپس با اشاره به تلاش کشورهای دیگر ازجمله کشورهای عربی برای حفظ زبان و فرهنگ با اتکا به دانش هوش مصنوعی افزود: عربها پس از ایجاد مدل زبانی سفارشی «فالکون» با کمک شرکت openAI، یک مدل زبانی دیگر با عنوان «جیس» را به طور اختصاصی برای زبان عربی ایجاد کردهاند. کشورهای شرق آسیا چون چین و کره جنوبی و ژاپن هم کارهای مشابهی را با جدیت انجام میدهند ولی ما در این عرصه غافل مانده و در حال واگذاری این عرصه هستیم. حتی نزد برخی مسؤولین این تصور هست که این نوع کارها کارهایی لوکس و بی اهمیت هستند و به مخاطرات واگذاری این عرصه توجه ندارند.
وی در این باره گفت: با توجه به تغییرات حجم محتوای وب، حمایتی از خط و زبان فارسی نشده است.
"همچنین چهار سال پیش، کتابی را دیدم که در حوزه تخصصی عمران چاپ شده بود و به صورت رسمی عنوان کرده بود که از گوگل برای ترجمه استفاده کرده است"تولید محتوای زبان کرهای با توجه به سیاستهای حمایتی دولت کره از جمله تولید سریال و ترویج گروههای موسیقی کرهای به نحوی بوده که حجم محتوای کرهای در وب در طول دو سال بیش از دو برابر شده و همین اتفاق برای زبان ژاپنی هم رقم خورده این در حالی است که در همین مدت سهم زبان فارسی از وب که زمانی نزدیک به ۳ درصد بود و مطابق سند معماری شبکه ملی اطلاعات میبایست به ۴ درصد میرسید، به حدود ۱.۵ درصد کاهش داشته است.
محمدزاده ضیابری، در پاسخ به سوالی در خصوص سیاستهای کشورهای دیگر در ترویج و پاسداشت خط و زبان و بومی افزود: در خصوص کره، سند جامعی سراغ ندارم ولی اتفاقات رخ داده و مجموعه اسنادی که در حوزه هوش مصنوعی دارند، نشان دهنده آن است که یک نگاه بالادستی سیاستی وجود دارد. ولی ما هنوز پس از دو سال از فرمایشات مقام معظم رهبری در خصوص ارتقای جایگاه ایران به ۱۰ کشور برتر هوش مصنوعی هنوز نتوانستهایم بر سر یک سند میان دستگاههای مختلف به توافق برسیم. عرصه هوش مصنوعی عرصهای نیست که بتوان تا این حد برای آن زمان از دست داد و سرعت تغییرات چنان بالا است که اگر همین امروز هم سند را منتشر و برنامه اقدام را شروع کنیم باز هم به شدت از دنیا عقب هستیم.
دبیر کمیسیون هوش مصنوعی و علم داده سازمان نظام صنفی رایانهای، در ادامه گفت: مطابق آمارهای معتبر بینالمللی ۴ درصد دانش هوش مصنوعی جهان و ۵ درصد تولیدات هوش مصنوعی در کشور آمریکا مربوط به ایرانیانی است که حداقل تا پایان دوره کارشناسی را در ایران تحصیل کردهاند. این افراد اغلب در دانشگاههای دولتی درس خواندهاند و عملاً بیش از ۱۶ سال برای آنها از محل بودجه عمومی هزینه شده اما بهرهبرداری نهایی توسط بیگانگان صورت میگیرد. لازم به توجه است که در این آمار بحث دانش هوش مصنوعی صرفاً تولید مقاله نیست بلکه بر اساس شرکتها و تولیدات ملموس ارزیابی شده است.
وی ضمن انتقاد از رویکردها و سیاستهای کشور در فراری دادن دانشمندان جوان افزود: در بحث مهاجرت چینیها میروند و فنآوری را رسماً میدزدند و به کشور خود میآورند و کارشان را با هدف بلوغ چین انجام داده و افق دیدشان، کار کردن به نفع کشورشان است.
هندیها به بالاترین مدارج در شرکتهای فناور دنیا دست پیدا میکنند ولی ما به کارخانه تولید نیروی کار و دانشمند برای کشورهای خارجی بدل شدهایم و سیاستهای اتخاذی فراری دهنده معدود افرادی است که هنوز دلسوزانه در حال فعالیت در کشور هستند.
وی در ادامه با اشاره به راهاندازی وزارت هوش مصنوعی در امارات متحده عربی و برنامههای بلندپروازانه بنسلمان برای هوش مصنوعی در عربستان سعودی گفت: کشورهای عربی برنامهریزی بسیار دقیقی در زمینه ارتقای دانش هوش مصنوعی دارند. عربستان در یکسال اخیر به شدت فعال شده و درحوزههای مختلف سرمایهگذاری میکند. تمرکز عربستان و امارات در حوزه هوش مصنوعی چنان بوده که ایالات متحده به موضوع حساس شده و در این زمینه تحریم شأن میکند. این در صورتی است که عربستان از کشورهای متحد آمریکا در خاورمیانه است اما سیاستمداران آمریکایی معتقدند که اساساً منطقه خاورمیانه نباید تا این حد در عرصه هوش مصنوعی رشد کند و رشد باید کند و متوقف شود. عربستان و امارات خیلی دقیق کار میکنند ولی متأسفانه ما در حال درجا زدن و به نوعی عقبگرد بوده، درست سیاستگذاری نمیکنیم و حتی نمیدانیم چگونه بودجهای که تعیین شده را هم مصرف کنیم.
وی در ادامه به موضوع مدلهای زبانی بزرگ (LLMها) پرداخت و افزود: پیشتر مدلهای زبانی داشتیم که فقط در برخی پردازشهای مرتبط با زبان طبیعی کاربرد داشتند.
"نسل جدید دیگر کمتر به کتاب، مطبوعات، تلویزیون و حتی وب مراجعه میکند و بیشتر در حال استفاده از فضای پیامرسانها و شبکههای اجتماعی است"ولی اکنون LLMها همه کاری میکنند و میتوانند متنهای خیلی بزرگ بخوانند و با اتکا به یادگیری به ارائه مفهوم بپردازند.
وی در این باره گفت: غشای خاکستری مغز پستانداران و از جمله انسان، به عنوان مهمترین بخش سیستم عصبی، یک عنصر حافظه است و توانایی اصلی و اعجابانگیز آن، استخراج، ذخیره و بازیابی الگوهایی است که دارای ویژگی تنکبودن و مقاومت نسبت به تغییرات است. در اصل تمام مغز انسان از یک الگوریتم واحد استفاده میکند که مبتنی بر بازآوری این الگوها عمل میکند. سیستمهای جدید هوش مصنوعی کمابیش در حال بهرهگیری از همین الگو و ویژگی مغز هستند. تا پیش از سال ۲۰۱۰ قریب به اتفاق مطالعات هوش مصنوعی متکی به روشهای تحلیلی بود اما به مرور و با پیشرفت سامانههای پردازشی و تعاریفی که دانشمندان ساختارشکن ارائه کردند وارد عصری شدیم که ماشینها خودشان یاد میگیرند و اساساً نمیدانیم الگوهایی که ماشین استخراج کرده چرا به آن صورت بوده و کنترل دقیقی بر فرایند یادگیری نداریم. این تغییر نگاه به موضوع یادگیری ماشینها و همزمان پیشرفت خیرهکننده زیرساختهای پردازشی نقطه عطفی بود که منجر به تولد LLMها شد.
وی در خصوص روشهای نگاشت کلمات، عبارات، جملات و متنها به فضاهای برداری افزود: قوت اصلی LLMها در این است که میتوانند روابط بین ورودیها را در فضاهایی با ابعاد بسیار بالا برقرار کنند موضوعی که لزوماً از ذهن انسان ساخته نیست.
وی ادامه داد: LLMها کار خیلی عجیبی نمیکنند. ما ورودیهای در حجم وسیع به ماشین میدهیم و ماشین از روی آنها بردارها یا ماتریسهایی ایجاد میکند که وضعیت آن ورودی در یک فضای چندین بعدی را نشان میدهد. این نگاشت و محاسبه روابط بین ورودیها در یک فضای چندین بعدی موجب میشود ماشین بتواند بدون آنکه واقعاً درکی از مفهوم داشته باشد کلاژ ماهرانهای از آنچه پیشتر به خاطر سپرده ایجاد کند و ما حس کنیم که واقعاً مفهوم را استخراج کرده و خلاقیت به خرج داده است.
وی با اشاره به سرمایه گذاری کشورهای مختلف روی LLMها با اهداف مختلف گفت: LLM در حال ایجاد انقلابی اساسی در دنیا است و موضوع آن محدود به حوزه متن نیست. در حوزههای مختلف اعم از دارویی، ژنتیک، و غیره نیز LLMهایی توسعه داده شده که کار محققین و دانشمندان را تسهیل کرده است. چون یک دانشمند نمیتواند بیش از چند نمونه آزمایش کند ولی با کمک LLM میتواند بینهایت ترکیب آزمایش شوند.
محمدزاده ضیابری، در ادامه به تقابل و تعامل هوش مصنوعی با خط و زبان فارسی به عنوان موضوع اصلی نشست پرداخت و افزود: ما به عنوان کشور اصلی زبان فارسی، باید مرجعیت زبانفارسی را داشته باشیم ولی اکنون در حال از دست دادن این مرجعیت و واگذاری آن به هوش مصنوعی هستیم.
"نسل جدید دیگر به جای رجوع به تلویزیون و کتاب و معلم و مربی، و یا حتی دوستان خود به هوش مصنوعی رجوع میکند"در نتیجه اگر مرجعیت هوشمصنوعی در این حوزه را نداشته باشیم، زبان فارسی را از دست خواهیم داد. این در صورتی است که مقام معظم رهبری بارها در زمانها و با دلایل مختلف در زمینه پاسداشت زبان فارسی تذکراتی داشتهاند.
محمدزاده ضیابری، در ادامه با اشاره به وجود نگاه تهدیدآمیزی که در عرصه هوش مصنوعی در زمینه مواجهه با جنبههای ناشناخته آن وجود دارد، بر لزوم توأم گرفتن جنبه تهدید و فرصت تأکید کرد و گفت: هوش ماشین در حوزههایی بر هوش انسان برتری پیدا میکند اما هنوز فاقد عنصر خلاقیت و احساس است. شاید تا دهها سال دیگر نتوانیم از ماشین انتظار خلاقیت به معنای واقعی کلمه داشته باشیم و این «احمد شاملو» است که عمل خلاقیت را در ترجمه «شازده کوچولو» انجام میدهد؛ کاری که حالا حالاها ماشین قادر به انجام آن نیست چون ترجمه شاملو از شازده کوچولو بازنویسی است و بازآفرینی است و نه یک ترجمه ساده که هر مترجم دیگری انجام میدهد.
وی در ادامه افزود: هوش مصنوعی فعلی خاصمنظوره است و در یک حوزه خاص میتواند خروجیهایی را ارائه کند که حتی از عهده انسان ساخته نیست اما این محدودیت به زودی برداشته میشود و با توسعه AGI یا هوش مصنوعی عمومی و پس از آن ورود به عصر تکینگی و ممزوج شدن هوش مصنوعی و انسان اتفاقات بسیار پیچیدهای رقم خواهد خورد که میبایست به دقت مورد توجه قرار بگیرند. همین حالا شرکت نورالینک ایلان ماسک مجوز کاشت پردازنده در مغز را گرفته و به مرور در حال ورود به دنیایی جدید هستیم که به هیچ عنوان با دنیای ماقبل خود شباهت ندارد. با این حال باید توجه داشت که در اعصار مختلف و در انقلابهای صنعتی قبلی هم همواره انسان توانسته است کنترل اوضاع را در دست بگیرد و فناوری را مسخر خود کند.
در نتیجه در انقلاب صنعتی چهارم فعلی و پنجم و ششم آتی هم اگر درست و بهموقع عمل کنیم میتوانیم از مواهب رشد فناوری بهرهمند شویم.
رئیس کارگروه حکمرانی داده و زیرساختهای هوش مصنوعی سازمان نظامصنفی در ادامه در خصوص حکمرانی در حوزه هوش مصنوعی افزود: در حوزه حکمرانی هوش مصنوعی با سه مقوله مواجه هستیم حکمرانی برای هوش مصنوعی، حکمرانی با هوش مصنوعی و حکمرانی بر هوش مصنوعی. آنچه تاکنون در کشور بیشتر به آن توجه شده حکمرانی بر هوش مصنوعی بوده چرا که اغلب سیاستگذاران نگران تهدیدات آن هستند. کسی منکر لزوم این نوع از حکمرانی نیست؛ مسلم است که باید مانند همه کشورهای دیگر بر هوش مصنوعی حکمرانی کنیم چون نمیدانیم چه اتفاقاتی در حال رخ دادن است و بنابراین، باید سرعتگیر، قلاب و نقاط نظاره برایش در نظر بگیریم تا این اسب چموش را رام کنیم. اما باید توجه داشته باشیم که این نوع از حکمرانی سد راه توسعه نباشد. هوش مصنوعی در خیلی از حوزهها میتواند فایدههای زیادی داشته باشد و باید از فرصتهای طلایی هوش مصنوعی در حوزههای مختلف علوم پایه، مهندسی، کشاورزی و نفت و … برای پیشرفت و حل معضلات کمک بگیریم.
"سوالاتی در حوزههای مختلف فرهنگی، سیاسی، اجتماعی، عقیدتی و حتی مرتبط با مسائل جنسی و پاسخهایی که میگیرد لزوماً صحیح، مناسب سن، و یا مناسب بافت فرهنگی اجتماعی وی نیستند"این فرصتها صرفاً از طریق حکمرانی با هوش مصنوعی میسر میشود. درواقع باید میان حکمرانی بر و حکمرانی با هوش مصنوعی تعادل و مصالحه برقرار کرد تا تهدیدات به فرصت بدل شده و از مواهب آن برخوردار شویم.
ضیابری در ادامه به حکمرانی برای هوش مصنوعی پرداخت و گفت: دو نوع حکمرانی بر و با هوش مصنوعی بدون حکمرانی برای هوش مصنوعی ممکن نیست. نمیتوانیم بدون تأمین زیرساختها انتظار پیشرفتی در هیچ زمینهای داشته باشیم. متأسفانه تا صحبت از زیرساخت میشود مسؤولین تصور میکنند که مقصود هزینه و پول است. این در حالی است که با وجود اهمیت بسیار زیاد وجود زیرساختهای پردازشی و حمایتهای مادی از شرکتهای فعال در این حوزه ما بیشتر نیازمند حکمرانی برای دسترسی به دادگان و ایجاد امکان ورود به صنایع هستیم.
بدون دسترسی به دادهها در حوزههای مختلف عملاً هیچ کار خاصی نمیتوان انجام داد. به عنوان یک نمونه ساده امارات از کتابخانه ملی خودش برای آموزش مدل زبانی جیس استفاده کرده است اما هیچ کدام از ارگانها و نهادهای ملی ما با وجود ارتزاق از بودجه عمومی کشور حاضر به ارائه هیچ نوع دادهای نیستند. از طرف دیگر صنایع بزرگ ما که ورود هوش مصنوعی به آنها میتواند به شدت تحولآفرین بوده و موجب صرفهجوییها و درآمدهای عظیم برای کشور شود حاضر به همکاری با شرکتهای کوچک و متوسط اما توانمند در حوزه هوش مصنوعی نیستند و سعی دارند با همان مدلهای سنتی هوش مصنوعی را وارد عرصه صنعتی کنند.
سید محمد محمدزاده ضیابری، در ادامه بر لزوم داشتن مدل ایرانی توسعه در زمینه هوش مصنوعی تأکید کرد و گفت: ما باید نظیر «چتجیپیتی» و «LLM» فارسی متناسب با فرهنگ بومیمان داشته باشیم که البته این کار آغاز شده اما چنان ضعیف و کوتهنظرانه است که بیشتر در حد سرگرمی است و به هیچ عنوان با فعالیتهای در حال انجام در سایر کشورهای فعال در این حوزه نیست. در سایر کشورها این فعالیتها با هزاران پردازنده گرافیکی صورت میگیرد در حالی که تعداد کل پردازندههای موجود در کشور چند صد عدد بوده و برای توسعه LLM فارسی یک گروه متشکل از ۴ شرکت هوش مصنوعی در حال کار با تنها ۸ پردازنده گرافیکی A100 هستند. بدیهی است راهاندازی زیرساختهای پردازشی لازم برای هوش مصنوعی نیازمند سرمایهگذاری اساسی و چند هزار میلیاردی است که از عهده بخش خصوصی خارج است.
وی ساخت زیرساختهای هوش مصنوعی را وظیفه دولت دانست و گفت: حاکمیت باید از فرهنگ و زبان و سایر مواردی که به عنوان حقوق اولیه ایرانیان در قانون اساسی عنوان شده صیانت کند و این مستلزم ساختن زیرساختها است.
"کشورهای شرق آسیا چون چین و کره جنوبی و ژاپن هم کارهای مشابهی را با جدیت انجام میدهند ولی ما در این عرصه غافل مانده و در حال واگذاری این عرصه هستیم"امروز و در آینده این زیرساختها مبتنی بر نیاز هوش مصنوعی تعریف میشود.
وی با اشاره به بیانات اخیر رهبری در مراسم ارتحال امام خمینی (ره) افزود: دنیای امروز اقتضائات خودش را دارد و نباید با همان مدل ۴۰ سال پیش مشکلاتمان را حل کنیم. بنابراین، باید در زمینه زیرساختها اقدام جدی و اساسی صورت بگیرد. البته این بدان معنی نیست که پول نفت را به شرکتهای خصولتی تزریق و بیت المال را هدر دهیم بلکه باید با ایجاد زیرساختهای ملی در هر سه حوزه پردازشی، حکمرانی دادهها و اعتمادسازی در صنایع کاری کنیم که هوش مصنوعی خود به عنوان موتور مولد و پولساز عمل کند. وی افزود در این زمینه با سندنویسی ره به جایی نمیبریم باید تا دیر نشده بجنبیم و اکنون که هنوز سوار قطار پیشرفت هوش مصنوعی هستیم جای خودمان را تثبیت کنیم و الا به مرور به آخرین واگنهای این قطار منتقل میشویم و اگر پیادهمان کنند و جا بمانیم، چندین نسل را از دست داده و صرفاً مصرفکننده فناوری و برده تولیدکنندگان آن خواهیم بود.
محمدزاده ضیابری، درپایان به جمعبندی مبحث پرداخت و گفت: هوش مصنوعی را اگر به اختیار خودش بگذاریم، اژدهایی هفت سر است که معلوم نیست چه بلایی بر سر فرهنگ و خط و زبان ما میآورد. اما اگر آن را مسخر خود کنیم، چنان پیشرفت و انقلابی ایجاد خواهد کرد که بیشتر از جمع فعالیتهای تمامی علما و اندیشمندان ما در طول صدها سال خواهد بود.
صالحی هم در یاپان این نشست با اشاره به بحث در دسترس نبودن دادهها گفت: داده از جنس نظامهای واژگانی است و بنابراین ناگزیریم که نشانههای زبانی را در هر مقولهای تقویت کنیم و چون کاری نکردهایم.
اگر اکنون شروع کنیم میتواینم خیلی قدرتمندانه پیش برویم. دادههای واژگانی ما با اینکه در دسترس نیستند ولی خیلی گستردهاند. به عنوان مثال، گنجینه علی رواقی حدود ۶۰ هزار صفحه و شامل ۳۵ میلیون نسخه فیش است اما در دانشگاه شهید بهشتی بایگانی شده است.
اخبار مرتبط
دیگر اخبار این روز
حق کپی © ۲۰۰۱-۲۰۲۴ - Sarkhat.com - درباره سرخط - آرشیو اخبار - جدول لیگ برتر ایران