یونیکد؛ فرهنگستان جهانی زبانها؟
منبع تصویر، Getty Images
در آستانه سده نویِ خورشیدی در مجموعه نوشتارهایی به موضوع خط فارسی و دگرگونیهای آن در دوران معاصر- در اینجا به معنای بعد از ورود چاپ- و همچنین به چالشهای پیش روی خط فارسی در روزگار دیجیتال، فضای مجازی و شبکه اجتماعی، پرداخته میشود. صاحبنظران، کارشناسان و پژوهشگران در این نوشتارها با رویکردهای متفاوت و از زاویههای مختلف به موضوع خط در حوزه فرهنگی زبان فارسی پرداختهاند که بمرور در وبسایت بیبیسی فارسی منتشر میشوند. در این مجموعه، رسمالخط، نقطهگذاری و نگارش نویسندگان حفظ شدهاند.
امید منتظری از بی بی سی فارسی با روزبه پورنادر مدیر فنی کنسرسیوم یونیکد درباره آینده خط فارسی در عصر دیجیتال گفتگو کرده است.
منبع تصویر، Getty Images
- این روزها سرنوشت خط فارسی به نظر میرسد بیش از هر جایی در اینترنت و در فضای کامپیوتر رقم میخورد تا در بحثهای کلاسیک زبانشناسان و روشنفکران و ادیبان. در این میان معیاری بوجود آمده که شبیه یک فرهنگستان بینالمللی زبان عمل میکند.یونیکد چیست؟ چرا مهم است؟ چه نقشی در سرنوشت نگارش خط و زبان دارد؟
یونیکُد استانداردی است که چند شرکت بزرگ در دهه هشتاد میلادی شروع کردند برای اینکه بتوانند همه استانداردهای متفاوت برای نمایش متن را یکدست کنند.
کلا کامپیوتربه این روش اطلاعات متنی را مبادله میکند. مثلا میآیند به هر حرف یا به هر نماد یا به هر علامت نوشتاری که میخواهند پردازش کنند، مثل فاصله، یک عدد نسبت میدهند (کامپیوتر همه چیز را با عدد میشناسد). به این شیوه که متن را با رشتهای اعداد مبادله یا پردازش میکند میگوییم "کدگذاری" که واحدش "نویسه" است.
نویسه میتواند یک حرف یا یک رقم یا یک نماد باشد و این واحد تبادل اطلاعات متنی است در کامپیوتر.
پیش از یونیکد برای هر زبانی و هر کشور یا هر چند کشور یک مجموعه نویسه وجود داشته است یونیکد تلاشی است برای جایگزین کردن مجموع همه این نویسهها، به این معنی که استاندارد واحدی داشته باشیم که از همه خطهای همه زبانهای دنیا را پشتیبانی کند.
از همان زمانی که این پروژه رقم خورد و آرام آرام شکل گرفت -اولین نسخه یونیکد در سال ۱۹۹۱میلادی منتشر شد- بتدریج جایگزین تمام دیگر نویسهها شد چون شرکتهای بزرگ کامپیوتری شروع کردند به استفاده از یونیکد و یکی کردن کدگذاریهای نرمافزارها و سیستمهای عاملشان، یک کد برای همه.
امروز به اینجا رسیدهایم که تقریباً همهٔ نرمافزارها از یونیکد پشتیبانی میکنند و هر سال نسخهٔ جدید استاندارد یونیکد با نویسههای بیشتر منتشر میشود. البته پشتیبانی از یونیکد به این معنی نیست که مثلاً حتماً آن نرمافزار از خط فارسی یا خطهای دیگر پشتیبانی کند، بلکه معماری آن نرمافزار یا سیستم عامل یونیکد را پشتیبانی میکند ولی ممکن است همهٔ نویسههای یونیکد را پشتیبانی نکند. این روزها اگر بخواهید هر متنی را با خیال راحت مبادله کنید، در عمل باید به یونیکد باشد.
منظور از مبادله این است که دو سیستم مختلف که لزوما معماری و پیادهسازی مشابهی هم ندارند بتوانند اطلاعات متنی را بفرستند و دریافت کنند و نمایش دهند. مثال سادهاش این است که با گوشی اندروید متنی فارسی به گوشی آیفون میفرستید و مخاطبتان دریافت میکند.اتفاقی که میافتد این است که متن فارسی شما حرفبهحرف و نویسهبهنویسه به صورت کدهای یونیکد ذخیره و منتقل میشود به تلفن دیگر و گوشی دوم این کدهای یونیکد را تبدیل به متن میکند و نمایش میدهد.
- در این مبادله به نظر میرسد که زبان فارسی مثل زبانهای دیگر رشد نکرده است یا آنکه الگوریتمهایش آن طور که انتظار میرفته پیش نرفته است؟ چه اتفاقی برای زبان فارسی دارد میافتد؟ آیا در عصر دیجیتال برای زبان فارسی که گفته میشود چندان زبان مولدی نبوده و خطش دشواریهایی دارد همان اتفاقیمیافتد که برای زبانهای دیگر میافتد؟
نیازهای زبان فارسی را سنت اهل زبان٬ سنت انتشارات ایران و افغانستان تعیین کردهاند که مثلا شیوهنامه نوشتهاند که چطور باید فلان کلمه را نوشت٬ چطور باید اعداد و ارقام را نوشت٬ مثلا قبل از نقطه فاصله نمیگذاریم٬ بعد از ویرگول فاصله میگذاریم و قواعدی از این دست. تقریبا همه این ویژگیها در یونیکد قابل نمایش یا ذخیره هستند یعنی همه نویسههای فارسی موجود را میشود با یونیکد نشان داد.
اما این بحث الگوریتمها مفصل است. یونیکد پایینترین لایهٔ تبادل اطلاعات متنی است. برای اینکه شما راحت بتوانید با متنها در هر محیطی کار کنید ابزارهای پیشرفتهتری لازم است. مثلاً اگر میخواهید نامهٔ رسمی تایپ کنید قاعدتاً میخواهید غلط املایی نداشته باشد. نرمافزارهای غلطیاب این مشکل را حل میکنند. یا مثلاً به جای تایپ، میخواهید صحبت کنید و گوشیتان صحبت شما را تبدیل به متن کند که اصطلاحاً به این میگویند تشخیص گفتار. برای تولید این نرمافزارها برای زبان فارسی به نسبت خیلی زبانهای دیگر سرمایهگذاری زیادی نشده است. این عمدتاً به خاطر شرایط اقتصادی ایران است و تحریمهایش و در افغانستان هم به خاطر بازار اقتصادی کوچکتر. به این خاطر زبان فارسی از طرف شرکتهای چندملیتی و جامعهٔ جهانی اولویت کمتری یافته و کمتر روی آن کار شده است. ولی برای زبان فارسی واقعاً مشکل بنیادین در یونیکد وجود ندارد.
این الگوریتمها و این برنامههای اضافی هستند که برای زبانهای دیگر بیشتر روی آنها کار شده و برای زبان فارسی کمتر. راهحلهای خیلی خاص و ویژهای هم لازم نیست. این همه زبانی که الان در دنیا هست هر کدام پیچیدگیهای خاص خود را دارند، پیشینه و نیازهای عجیب خود را دارند، زبانهای جنوب شرق آسیا یک نوع، شرق آسیا یک نوع، زبانهای آفریقایی یک نوع، مثلاً زبان مجاری در اروپا هم یک نوع. هر کدام پیچیدگیهای خودشان را دارند ولی کار اهل فن این است که همهٔ اینها را دقیق در کامپیوتر پیاده کنیم.
- نگاهی به سرگذشتِ زبان و خط فارسی در روزگار ما
- سرگذشت قانون زبان در تاجیکستان
- بیش از یک قرن جدال زبانی-سیاسی؛ خط فارسی یا عربی؟
منبع تصویر، Getty Images
- چقدر دولت ایران یا افغانستانبرای بهبود زبان فارسی در عرصه کامپیوتر و اینترنت و برنامهنویسی تلاش کردهاند. نقش دولتها در این میان چیست؟
دولت معمولاً اهرمهای خیلی قدرتمندی دارد. یعنی هم پول دارد هم توان دستور و شکل دادن به استفاده از زبان. من عملکرد دولت افغانستان را در سالهای اخیر چندان دنبال نکردهام. فقط مدت کوتاهی تحقیق کردم: در سال ۲۰۰۳ به سفارش پروگرام انکشافی ملل متحد یک مقداری بر زبانهای افغانستان کار کردم. آن زمان مسئولیت رسمی به عهدهٔ آکادمی علوم افغانستان بود که هم به زبان فارسی دری میپرداخت هم به پشتو. ولی به خاطر شرایط جنگی کار کمتری میشد.
در ایران قاعدتاً فرهنگستان زبان و ادب فارسی پیگیر این قضیه بود و بعد هم سازمانهایی که به نحوی به فناوری اطلاعات ربط داشتند. دولت در این قضایا پول خوب خرج میکند ولی اینکه چقدر مؤثر باشد حرف دیگری است. البته چند کار خوب مؤثر هم انجام شده است. مثلاً یک کار کلیدی این که فرهنگستان زبان یک دستور خط فارسی منتشر کرد که با وجود محدودیتها و ابهامهایش نقطهٔ شروع خیلی خوبی بود. بعد با انتشار یک فرهنگ املایی زبان فارسی، دقیقترش کردند و لااقل بخشنامه شده در سراسر کشور که همه باید از آن رسمالخط استفاده کنند، همهٔ سازمانهای دولتی و آموزش و پرورش و غیره.
البته کمتر از آنچه که باید از آن استفاده میشود چون مردم اجرا نمیکنند و بعضی جاها هم دستور خط به قدر کافی واضح نیست. ولی بالاخره کارهایی شده و همین که فرهنگستان زبان آمده یک چنین قواعدی را تدوین کرده بسیار کمک میکند به کاهش تشتت.
اگر خودم را در رسمالخط فارسی صاحبنظر میدانستم ممکن بود بگویم من فکر میکنم فلان کلمه را بهتر است فلان طور نوشت ولی برای کاهش تشتت آن طور که فرهنگستان گفته مینویسم. این اتفاق در خیلی از کشورهای جهان دارد میافتد: مثلاً وقتی سازمان مشابه فرهنگستان در آلمان لغتنامه منتشر میکند تقریباً همهٔ جامعهٔ فرهیخته سعی میکنند قواعد و رسمالخطش را رعایت کنند و این کمک میکند به کاهش تشتت در خط..
منبع تصویر، Getty Images
- در زبان فارسی سالها بحث غلط ننویسیم یا چگونه درست بنویسیم را زبانشناسان و اهل فن پیگیری میکردند. آیا میشود امیدوار بود که این بحران آرام آرام از طریق پیشرفت زبان فارسی در الگوریتمهایی که برایش نوشته میشود رفع شود؟
سؤال خیلی خوبی است. به مرور اتفاق میافتد. یکی این که همین نرم افزارهای بینالمللی آرامآرام دارند زبان فارسی را بهتر پشتیبانی میکنند ولی مثلاً مسئلهٔ غلطیاب را باید جدیتر پیگیری کرد. هنوز بین آن چه در دستور خط فرهنگستان هست و آن چیزی که در نرمافزارها پیاده شده فاصله هست. جدا از نرمافزارها، بعضی فارسینویسان دارند سعی میکنند اقلاً رسمالخط فرهنگستان را رعایت کنند، ولی البته اکثر مردم یا از آن بیخبر هستند یا اصلاً علاقهای به آن ندارند.
یک اتفاق موازی هم افتاده که هرچه میگذرد، در محیط دیجیتال رسمالخط زبان عامیانه فراوانتر میشود که مسائل خودش را دارد. مثلاً "نداره" را که مینویسیم "ه" بگذاریم در آخر کلمه یا زیر "ر" کسره بگذاریم؟ یا خیلی عبارتهای دیگر. این یک مقداری مانع است چون ممکن است نرمافزار غلطیاب املاهای عامیانه را غلط بشناسد چون بلد نیست با زبان عامیانه کار کند و کسی رسمالخط این زبان عامیانه را مدون نکرده است. البته ممکن است برای مردم مهم هم نباشد. به نظرم کلاً یک مقدار هم انگار سواد املا دارد کمتر میشود یعنی مردم خیلی از کلمات را با حروف غلط مینویسند و بندرت مراجعه میکنند به لغتنامه که ببینند چطور باید کلماتِ سختتر را نوشت.
- زبان فارسی در عرصه برنامهنویسی چطور میتواند پیشرفت کند و خودش را با یونیکد و الگوهای کامپیوتری تطبیق دهد مثل زبانهای دیگر؟
از چند راه میشود به بهبود زبان فارسی کمک کرد. در جهان امروز که شرکتهای بزرگ کامپیوتری خیلی از این محیطها و سیستمهای عامل را کنترل میکنند باید راهی پیدا کرد که اینها راهحلهای مختلف برای زبان فارسی را فراگیر کنند، مثالش همین تشخیص گفتار که نمونهاش مثلاً برای اندروید هست.
ولی وقتی این شرکتهای بزرگ میخواهند محصولی را منتشر کنند معمولاً نگاه میکنند به بازار و اقتصاد کشور. در شرایط فعلی اقتصاد ایران که تحریم است و خیلی از شرکتهای غربی نمیتوانند در این بازار محصولشان را بفروشند بنابراین سودی برایشان ندارد. بازار افغانستان هم برایشان به اندازهٔ کافی بزرگ نیست. بنابراین اولویت فارسی برای این شرکتها زیر سؤال است و مثلاً برای اپل و گوگل اهمیت کمتری دارد که برنامهٔ غلطگیر مؤثری برای زبان فارسی تولید کنند.
بهترین راه حل البته رفع تحریمهاست اما تا زمانی که تحریمها باشند راه حلی که معمولاً برای عبور از چنین وضعیتی هست تولید نرم افزارهای اپنسورس (منبع باز) است. این شرکتهای بزرگ یاد گرفتهاند که اگر یک نرمافزار اپنسورس موجود باشد و معماری و مجوزش با نرمافزار خودشان سازگار باشد اینها را بگیرند و روی نرمافزارشان بگذارند. اگر کیفیت نرمافزارِ اپنسورس خوب باشد استفاده میکنند، چون لزوماً علاقه ندارند کار انجامشده را تکرار کنند.
این تولیدهای اپنسورس میتوانند کمک کنند کاربر فارسیزبان علاقهمند، این برنامهها را در کامپیوترش نصب و استفاده کند و هم اگر مجوزش سازگار باشد شرکتهای بزرگ شروع کنند آنها را در محصولاتشان بگنجانند. این به نظر میرسد راه حلی باشد برای این که به نحوی از تحریمها رد شد تا مسائل اقتصادی مانع بهبود شرایط زبان فارسی نباشد.
من فکر میکنم این میتواند خیلی کمک کند. من وقتی در ایران کار میکردم خیلی اوقات وقتی برنامهٔ اپنسورس مینوشتیم همین اتفاق برایش میافتاد. هم کدش را در اینترنت میگذاشتیم، هم پیگیری میکردیم در کتابخانههای اپنسورس موجود درج شود. مثلاً اطلاعات مرتبسازی کلمات فارسی یا تقویم شمسیای را که پیادهسازی کردیم، کُدش الان تقریباً در همه سیستمعاملها گنجانده شده. یعنی اگر برنامهنویسی در یک شرکت بینالمللی بخواهد اسامی دفتر تلفن را با قواعد فارسی مرتب کند یا تقویم شمسی را به برنامهاش اضافه کند نگرانیش این نیست که چطور تبدیل کنم یا طول ماهها چقدر است. فقط باید به فکر این باشد که در صفحه چطور نمایش داده شود، مقدماتش حل شده است. نرمافزارهای اپنسورسی که فارسیزبانان تولید کنند خیلی میتوانند کمک کنند.
- پس احتمالا نقش ادیبان کلاسیک و اهل فن کمرنگتر میشود و نقش برنامهنویسی و شیوههای نهادی برای حفظ زبان بیشتر؟
درست است احتمالاً و یک مقدار دردناک هم هست ولی خاصیت طبیعی زبان هم هست. بالاخره مردم دارند دور می شوند از زبان فرهیختهتر و دقیقتر و شستهرفتهتر.
منبع خبر: بی بی سی فارسی
اخبار مرتبط: یونیکد؛ فرهنگستان جهانی زبانها؟
حق کپی © ۲۰۰۱-۲۰۲۴ - Sarkhat.com - درباره سرخط - آرشیو اخبار - جدول لیگ برتر ایران