یونیکد؛ فرهنگستان جهانی زبان‌ها؟

یونیکد؛ فرهنگستان جهانی زبان‌ها؟
بی بی سی فارسی
بی بی سی فارسی - ۲۲ بهمن ۱۳۹۹

یونیکد؛ فرهنگستان جهانی زبان‌ها؟۲۱ بهمن ۱۳۹۹ - ۹ فوریه ۲۰۲۱

منبع تصویر،

Getty Images

در آستانه سده نویِ خورشیدی در مجموعه نوشتارهایی به موضوع خط فارسی و دگرگونی‌های آن در دوران معاصر- در اینجا به معنای بعد از ورود چاپ- و همچنین به چالش‌های پیش روی خط فارسی در روزگار دیجیتال، فضای مجازی و شبکه اجتماعی، پرداخته می‌شود. صاحب‌نظران، کارشناسان و پژوهشگران در این نوشتارها با رویکردهای متفاوت و از زاویه‌های مختلف به موضوع خط در حوزه فرهنگی زبان فارسی پرداخته‌اند که بمرور در وبسایت بی‌بی‌سی فارسی منتشر می‌شوند. در این مجموعه، رسم‌الخط، نقطه‌گذاری و نگارش نویسندگان حفظ شده‌اند.

امید منتظری از بی بی سی فارسی با روزبه پورنادر مدیر فنی کنسرسیوم یونیکد درباره آینده خط فارسی در عصر دیجیتال گفتگو کرده است.

منبع تصویر،

Getty Images

  • این روزها سرنوشت خط فارسی به نظر می‌رسد بیش از هر جایی در اینترنت و در فضای کامپیوتر رقم می‌خورد تا در بحث‌های کلاسیک زبان‌شناسان و روشنفکران و ادیبان. در این میان معیاری بوجود آمده که شبیه یک فرهنگستان بینالمللی زبان عمل میکند.یونیکد چیست؟ چرا مهم است؟ چه نقشی در سرنوشت نگارش خط و زبان دارد؟

یونیکُد استانداردی است که چند شرکت بزرگ در دهه هشتاد میلادی شروع کردند برای اینکه بتوانند همه استانداردهای متفاوت برای نمایش متن را یک‌دست کنند.

کلا کامپیوتربه این روش اطلاعات متنی را مبادله می‌کند. مثلا می‌آیند به هر حرف یا به هر نماد یا به هر علامت نوشتاری که می‌خواهند پردازش کنند، مثل فاصله، یک عدد نسبت می‌دهند (کامپیوتر همه چیز را با عدد می‌شناسد).

"مثلا می‌آیند به هر حرف یا به هر نماد یا به هر علامت نوشتاری که می‌خواهند پردازش کنند، مثل فاصله، یک عدد نسبت می‌دهند (کامپیوتر همه چیز را با عدد می‌شناسد)"به این شیوه که متن را با رشته‌ای اعداد مبادله یا پردازش می‌کند می‌گوییم "کدگذاری" که واحدش "نویسه" است.

نویسه می‌تواند یک حرف یا یک رقم یا یک نماد باشد و این واحد تبادل اطلاعات متنی است در کامپیوتر.

پیش از یونیکد برای هر زبانی و هر کشور یا هر چند کشور یک مجموعه نویسه وجود داشته است یونیکد تلاشی است برای جایگزین کردن مجموع همه این نویسه‌ها، به این معنی که استاندارد واحدی داشته باشیم که از همه خط‌های همه زبان‌های دنیا را پشتیبانی کند.

از همان زمانی که این پروژه رقم خورد و آرام آرام شکل گرفت -اولین نسخه یونیکد در سال ۱۹۹۱میلادی منتشر شد- بتدریج جایگزین تمام دیگر نویسه‌ها شد چون شرکت‌های بزرگ کامپیوتری شروع کردند به استفاده از یونیکد و یکی کردن کدگذاری‌های نرم‌افزارها و سیستم‌‌های عامل‌شان، یک کد برای همه.

امروز به اینجا رسیده‌ایم که تقریباً همهٔ نرم‌افزارها از یونیکد پشتیبانی می‌کنند و هر سال نسخهٔ جدید استاندارد یونیکد با نویسه‌های بیشتر منتشر می‌شود. البته پشتیبانی از یونیکد به این معنی نیست که مثلاً حتماً آن نرم‌افزار از خط فارسی یا خط‌های دیگر پشتیبانی کند، بلکه معماری آن نرم‌افزار یا سیستم عامل یونیکد را پشتیبانی می‌کند ولی ممکن است همهٔ نویسه‌های یونیکد را پشتیبانی نکند. این روزها اگر بخواهید هر متنی را با خیال راحت مبادله کنید، در عمل باید به یونی‌کد باشد.

منظور از مبادله این است که دو سیستم مختلف که لزوما معماری و پیاده‌سازی مشابهی هم ندارند بتوانند اطلاعات متنی را بفرستند و دریافت کنند و نمایش دهند. مثال ساده‌اش این است که با گوشی اندروید متنی فارسی به گوشی آیفون می‌فرستید و مخاطبتان دریافت می‌کند.اتفاقی که می‌افتد این است که متن فارسی شما حرف‌به‌حرف و نویسه‌به‌نویسه به صورت کدهای یونیکد ذخیره و منتقل می‌شود به تلفن دیگر و گوشی دوم این کدهای یونیکد را تبدیل به متن می‌کند و نمایش می‌دهد.

  • در این مبادله به نظر می‌رسد که زبان فارسی مثل زبان‌های دیگر رشد نکرده‌ است یا آنکه الگوریتم‌هایش آن طور که انتظار می‌رفته پیش نرفته است؟ چه اتفاقی برای زبان فارسی دارد می‌افتد؟ آیا در عصر دیجیتال برای زبان فارسی که گفته میشود چندان زبان مولدی نبوده و خطش دشواری‌هایی دارد همان اتفاقیمی‌افتد که برای زبان‌های دیگر می‌افتد؟

نیازهای زبان فارسی را سنت اهل زبان٬ سنت انتشارات ایران و افغانستان تعیین کرده‌اند که مثلا شیوه‌نامه نوشته‌اند که چطور باید فلان کلمه را نوشت٬ چطور باید اعداد و ارقام را نوشت٬ مثلا قبل از نقطه فاصله نمی‌گذاریم٬ بعد از ویرگول فاصله می‌گذاریم و قواعدی از این دست.

تقریبا همه این ویژگی‌ها در یونیکد قابل نمایش یا ذخیره هستند یعنی همه نویسه‌های فارسی موجود را می‌شود با یونیکد نشان داد.

اما این بحث الگوریتم‌ها مفصل است. یونیکد پایین‌ترین لایهٔ تبادل اطلاعات متنی است. برای اینکه شما راحت بتوانید با متن‌ها در هر محیطی کار کنید ابزارهای پیشرفته‌تری لازم است. مثلاً اگر می‌خواهید نامهٔ رسمی تایپ کنید قاعدتاً می‌خواهید غلط املایی نداشته باشد.

"تقریبا همه این ویژگی‌ها در یونیکد قابل نمایش یا ذخیره هستند یعنی همه نویسه‌های فارسی موجود را می‌شود با یونیکد نشان داد"نرم‌افزارهای غلط‌‌یاب این مشکل را حل می‌کنند. یا مثلاً به جای تایپ، می‌خواهید صحبت کنید و گوشی‌تان صحبت شما را تبدیل به متن ‌کند که اصطلاحاً به این می‌گویند تشخیص گفتار. برای تولید این نرم‌افزارها برای زبان فارسی به نسبت خیلی زبان‌های دیگر سرمایه‌گذاری زیادی نشده است. این عمدتاً به خاطر شرایط اقتصادی ایران است و تحریم‌هایش و در افغانستان هم به خاطر بازار اقتصادی کوچکتر. به این خاطر زبان فارسی از طرف شرکت‌های چندملیتی و جامعهٔ جهانی اولویت کمتری یافته و کمتر روی آن کار شده است.

ولی برای زبان فارسی واقعاً مشکل بنیادین در یونیکد وجود ندارد.

این الگوریتم‌ها و این برنامه‌های اضافی هستند که برای زبان‌های دیگر بیشتر روی آنها کار شده و برای زبان فارسی کمتر. راه‌حل‌های خیلی خاص و ویژه‌ای هم لازم نیست. این همه زبانی که الان در دنیا هست هر کدام پیچیدگی‌های خاص خود را دارند، پیشینه و نیازهای عجیب خود را دارند، زبان‌های جنوب شرق آسیا یک نوع، شرق آسیا یک نوع، زبان‌های آفریقایی یک نوع، مثلاً زبان مجاری در اروپا هم یک نوع. هر کدام پیچیدگی‌های خودشان را دارند ولی کار اهل فن این است که همهٔ این‌ها را دقیق در کامپیوتر پیاده کنیم.

  • نگاهی به سرگذشتِ زبان و خط فارسی در روزگار ما
  • سرگذشت قانون زبان در تاجیکستان
  • بیش از یک قرن جدال زبانی-سیاسی؛ خط فارسی یا عربی؟


منبع تصویر،

Getty Images

  • چقدر دولت ایران یا افغانستانبرای بهبود زبان فارسی در عرصه کامپیوتر و اینترنت و برنامهنویسی تلاش کرده‌اند. نقش دولتها در این میان چیست؟

دولت معمولاً اهرم‌های خیلی قدرتمندی دارد.

"برای اینکه شما راحت بتوانید با متن‌ها در هر محیطی کار کنید ابزارهای پیشرفته‌تری لازم است"یعنی هم پول دارد هم توان دستور و شکل دادن به استفاده از زبان. من عملکرد دولت افغانستان را در سال‌های اخیر چندان دنبال نکرده‌ام. فقط مدت کوتاهی تحقیق کردم: در سال ۲۰۰۳ به سفارش پروگرام انکشافی ملل متحد یک مقداری بر زبان‌های افغانستان کار کردم. آن زمان مسئولیت رسمی به عهدهٔ آکادمی علوم افغانستان بود که هم به زبان فارسی دری می‌پرداخت هم به پشتو. ولی به خاطر شرایط جنگی کار کمتری می‌شد.

در ایران قاعدتاً فرهنگستان زبان و ادب فارسی پیگیر این قضیه بود و بعد هم سازمان‌هایی که به نحوی به فناوری اطلاعات ربط داشتند.

دولت در این قضایا پول خوب خرج می‌کند ولی اینکه چقدر مؤثر باشد حرف دیگری است. البته چند کار خوب مؤثر هم انجام شده است. مثلاً یک کار کلیدی این که فرهنگستان زبان یک دستور خط فارسی منتشر کرد که با وجود محدودیت‌ها و ابهام‌هایش نقطهٔ شروع خیلی خوبی بود. بعد با انتشار یک فرهنگ املایی زبان فارسی، دقیق‌ترش کردند و لااقل بخشنامه شده در سراسر کشور که همه باید از آن رسم‌الخط استفاده کنند، همهٔ سازمان‌های دولتی و آموزش و پرورش و غیره.

البته کمتر از آنچه که باید از آن استفاده می‌شود چون مردم اجرا نمی‌کنند و بعضی جاها هم دستور خط به قدر کافی واضح نیست. ولی بالاخره کارهایی شده و همین که فرهنگستان زبان آمده یک چنین قواعدی را تدوین کرده بسیار کمک می‌کند به کاهش تشتت.

اگر خودم را در رسم‌الخط فارسی صاحب‌نظر می‌دانستم ممکن بود بگویم من فکر می‌کنم فلان کلمه را بهتر است فلان طور نوشت ولی برای کاهش تشتت آن طور که فرهنگستان گفته می‌نویسم.

"مثلاً اگر می‌خواهید نامهٔ رسمی تایپ کنید قاعدتاً می‌خواهید غلط املایی نداشته باشد"این اتفاق‌ در خیلی از کشورهای جهان دارد می‌افتد: مثلاً وقتی سازمان مشابه فرهنگستان در آلمان لغت‌نامه منتشر می‌کند تقریباً همهٔ جامعهٔ فرهیخته سعی می‌کنند قواعد و رسم‌الخطش را رعایت کنند و این کمک می‌کند به کاهش تشتت در خط..

منبع تصویر،

Getty Images

  • در زبان فارسی سال‌ها بحث غلط ننویسیم یا چگونه درست بنویسیم را زبان‌شناسان و اهل فن پیگیری می‌کردند. آیا می‌شود امیدوار بود که این بحران آرام آرام از طریق پیشرفت زبان فارسی در الگوریتم‌هایی که برایش نوشته می‌شود رفع شود؟

سؤال خیلی خوبی است. به مرور اتفاق می‌افتد. یکی این که همین نرم افزارهای بین‌المللی آرام‌آرام دارند زبان فارسی را بهتر پشتیبانی می‌کنند ولی مثلاً مسئلهٔ غلط‌یاب را باید جدی‌تر پیگیری کرد. هنوز بین آن چه در دستور خط فرهنگستان هست و آن چیزی که در نرم‌افزارها پیاده شده فاصله هست.

جدا از نرم‌افزارها، بعضی فارسی‌نویسان دارند سعی می‌کنند اقلاً رسم‌الخط فرهنگستان را رعایت کنند، ولی البته اکثر مردم یا از آن بی‌خبر هستند یا اصلاً علاقه‌ای به آن ندارند.

یک اتفاق موازی هم افتاده که هرچه می‌گذرد، در محیط دیجیتال رسم‌الخط زبان عامیانه فراوان‌تر می‌شود که مسائل خودش را دارد. مثلاً "نداره" را که می‌نویسیم "ه" بگذاریم در آخر کلمه یا زیر "ر" کسره بگذاریم؟ یا خیلی عبارت‌های دیگر. این یک مقداری مانع است چون ممکن است نرم‌افزار غلط‌‌یاب املاهای عامیانه را غلط بشناسد چون بلد نیست با زبان عامیانه کار کند و کسی رسم‌الخط این زبان عامیانه را مدون نکرده است. البته ممکن است برای مردم مهم هم نباشد. به نظرم کلاً یک مقدار هم انگار سواد املا دارد کمتر می‌شود یعنی مردم خیلی از کلمات را با حروف غلط می‌نویسند و بندرت مراجعه می‌کنند به لغت‌نامه که ببینند چطور باید کلماتِ سخت‌تر را نوشت.

  • زبان فارسی در عرصه برنامهنویسی چطور میتواند پیشرفت کند و خودش را با یونیکد و الگوهای کامپیوتری تطبیق دهد مثل زبانهای دیگر؟

از چند راه می‌شود به بهبود زبان فارسی کمک کرد.

"یا مثلاً به جای تایپ، می‌خواهید صحبت کنید و گوشی‌تان صحبت شما را تبدیل به متن ‌کند که اصطلاحاً به این می‌گویند تشخیص گفتار"در جهان امروز که شرکت‌های بزرگ کامپیوتری خیلی از این محیط‌ها و سیستم‌های عامل‌ را کنترل می‌کنند باید راهی پیدا کرد که اینها راه‌حل‌های مختلف برای زبان فارسی را فراگیر کنند، مثالش همین تشخیص گفتار که نمونه‌اش مثلاً برای اندروید هست.

ولی وقتی این شرکت‌های بزرگ می‌خواهند محصولی را منتشر ‌کنند معمولاً نگاه می‌کنند به بازار و اقتصاد کشور. در شرایط فعلی اقتصاد ایران که تحریم است و خیلی از شرکت‌های غربی نمی‌توانند در این بازار محصولشان را بفروشند بنابراین سودی برایشان ندارد. بازار افغانستان هم برایشان به اندازهٔ کافی بزرگ نیست. بنابراین اولویت فارسی برای این شرکت‌ها زیر سؤال است و مثلاً برای اپل و گوگل اهمیت کمتری دارد که برنامهٔ غلط‌‌گیر مؤثری برای زبان فارسی تولید کنند.

بهترین راه حل البته رفع تحریم‌‌هاست اما تا زمانی که تحریم‌ها باشند راه حلی که معمولاً برای عبور از چنین وضعیتی هست تولید نرم افزارهای اپن‌سورس (منبع باز) است. این شرکت‌های بزرگ یاد گرفته‌اند که اگر یک نرم‌افزار اپن‌سورس موجود باشد و معماری و مجوزش با نرم‌افزار خودشان سازگار باشد اینها را بگیرند و روی نرم‌افزارشان بگذارند.

اگر کیفیت نرم‌افزارِ اپن‌سورس خوب باشد استفاده می‌کنند، چون لزوماً علاقه ندارند کار انجام‌شده را تکرار کنند.

این تولیدهای اپن‌سورس می‌توانند کمک کنند کاربر فارسی‌زبان علاقه‌مند، این برنامه‌ها را در کامپیوترش نصب و استفاده کند و هم اگر مجوزش سازگار باشد شرکت‌های بزرگ شروع کنند آنها را در محصولاتشان بگنجانند. این به نظر می‌رسد راه حلی باشد برای این که به نحوی از تحریم‌ها رد شد تا مسائل اقتصادی مانع بهبود شرایط زبان فارسی نباشد.

من فکر می‌کنم این می‌تواند خیلی کمک کند. من وقتی در ایران کار می‌کردم خیلی اوقات وقتی برنامهٔ اپن‌سورس می‌نوشتیم همین اتفاق برایش می‌افتاد. هم کدش را در اینترنت می‌گذاشتیم، هم پی‌گیری می‌کردیم در کتابخانه‌های اپن‌سورس موجود درج شود. مثلاً اطلاعات مرتب‌سازی کلمات فارسی یا تقویم شمسی‌ای را که پیاده‌سازی کردیم، کُدش الان تقریباً در همه سیستم‌عامل‌ها گنجانده شده.

"برای تولید این نرم‌افزارها برای زبان فارسی به نسبت خیلی زبان‌های دیگر سرمایه‌گذاری زیادی نشده است"یعنی اگر برنامه‌نویسی در یک شرکت بین‌المللی بخواهد اسامی دفتر تلفن را با قواعد فارسی مرتب کند یا تقویم شمسی را به برنامه‌‌اش اضافه کند نگرانیش این نیست که چطور تبدیل کنم یا طول ماه‌ها چقدر است. فقط باید به فکر این باشد که در صفحه چطور نمایش داده شود، مقدماتش حل شده است. نرم‌افزارهای اپن‌سورسی که فارسی‌زبانان تولید کنند خیلی می‌توانند کمک کنند.

  • پس احتمالا نقش ادیبان کلاسیک و اهل فن کم‌رنگ‌تر می‌شود و نقش برنامه‌نویسی و شیوه‌های نهادی برای حفظ زبان بیشتر؟

درست است احتمالاً و یک مقدار دردناک هم هست ولی خاصیت طبیعی زبان هم هست. بالاخره مردم دارند دور می شوند از زبان فرهیخته‌تر و دقیق‌تر و شسته‌رفته‌تر.

منابع خبر

اخبار مرتبط