چت جی پی تی حالا می تواند ببیند، بشنود و حرف بزند

 چت جی پی تی حالا می تواند ببیند، بشنود و حرف بزند
پیک ایران

 چت جی‌پی‌تی حالا می‌تواند ببیند، بشنود و حرف بزند 


این قابلیت‌ها به کاربران امکان می‌دهد مکالمه صوتی با هوش مصنوعی داشته باشند‌ـ LIONEL BONAVENTURE/AFP

بنا بر اعلام شرکت اوپن ای‌آی، چت‌ جی‌پی‌تی یک به‌روز‌رسانی جدید دارد که به این ابزار فراگیر هوش مصنوعی امکان می‌دهد «ببیند، بشنود و صحبت کند».

این شرکت روز دوشنبه در پستی وبلاگی اعلام کرد که به‌روزرسانی ربات چت هوش مصنوعی اوپن ای‌آی به کاربران اجازه خواهد داد تا مکالمه صوتی با این ربات چت هوش مصنوعی داشته باشند و همچنین با استفاده از تصویر، با آن تعامل داشته باشند.

این شرکت همچنین در پستی در اکس/توییتر نوشت: «چت جی‌پی‌تی حالا می‌تواند ببیند، بشنود، و صحبت کند.»

این قابلیت‌ها «در دو هفته آینده» در دسترس خواهد بود و به کاربران امکان می‌دهد «با استفاده از صدا، مکالمه‌ای دوطرفه» با دستیار هوش مصنوعی داشته باشند.

به گفته اوپن‌ ای‌آی، با این قابلیت‌های جدید، چت جی‌پی‌تی می‌تواند برای «درخواست قصه شب برای خانواده‌تان، یا حل‌و‌فصل بحث سر میز شام» کاربرد داشته باشد، که چت جی‌پی‌تی را به خدماتی که دستیار هوش مصنوعی الکسای آمازون یا سیری اپل ارائه می‌دهند نزدیک‌تر می‌کند.

اوپن ای‌آی برای نمایش نمونه‌ای از نحوه کارکرد این قابلیت، ویدیویی را به اشتراک گذاشت که در آن کاربری از چت جی‌پی‌تی می‌خواهد داستانی درباره «خارپشت معرکه آفتاب‌گردانی به نام لری» بگوید.

ربات چت با صدایی شبیه انسان به سوال پاسخ می‌دهد و همچنین به سوال‌هایی مانند «خانه‌اش چه شکلی است؟» و «دوست صمیمی‌اش چه کسی است؟» جواب می‌دهد.

چت جی‌پی‌تی الان می‌تواند ببیند، بشنود، و حرف بزند. در دو هفته آینده در دسترس خواهد بود. کاربران [چت جی‌پی‌تی] پلاس می‌توانند مکالمه‌های صوتی با چت جی‌پی‌تی داشته باشند (آی‌اواس و اندروید) و تصاویر را به گفت‌و‌گوها اضافه کنند (روی تمام بسترها).

ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb

— OpenAI (@OpenAI) September 25, 2023
به گفته اوپن ای‌آی، قابلیت صوتی با استفاده از یک مدل تبدیل متن به گفتار پشتیبانی می‌شود که از متن و نمونه گفتاری چند ثانیه‌ای صدای شبیه انسان تولید می‌کند.

این شرکت گفت: «ما برای خلق هر کدام از این صداها، با صداپیشگان حرفه‌ای همکاری کردیم. ما همچنین از ویسپر، سیستم تشخیص گفتار متن‌باز شرکت خودمان، استفاده کردیم تا صحبت‌های شفاهی شما را به شکل متن رونویسی کنیم.»

این شرکت هوش مصنوعی معتقد است که فناوری صوتی جدید قادر است از فقط چند ثانیه گفتار واقعی، صداهای مصنوعی شبیه واقعی بسازد، و می‌تواند راه را برای اپلیکیشن‌های خلاقانه زیادی باز کند.

با وجود این، شرکت اوپن ای‌آی همچنین هشدار داده است که قابلیت‌های جدید ممکن است خطرهای جدیدی ایجاد کنند «مانند این احتمال که افراد دارای سوءنیت خود را جای چهره‌های سرشناس جا بزنند یا اقدام به کلاهبرداری کنند».

به‌روز‌رسانی مهم دیگر این ربات چت هوش مصنوعی به کاربران امکان می‌دهد که تصویری را بارگذاری گنند و از چت جی‌پی‌تی در موردش سوال کنند.

اوپن ای‌آی توضیح داد: «علت روشن نشدن کباب‌پز را عیب‌یابی کنید، محتویات یخچال را وارسی و برای غذا برنامه‌ریزی کنید، یا یک نمودار پیچیده را برای داده‌های مرتبط با کار تجزیه و تحلیل کنید.»

به گفته این شرکت، قابلیت جدید همچنین به کاربران امکان می‌دهد با استفاده از ابزار ترسیم اپلیکیشن موبایل چت جی‌پی‌تی، روی بخش خاصی از تصویر تمرکز کنند.

این نوع تشخیص چندوجهی ربات چت از مدتی قبل پیش‌بینی می‌شد، و این شناخت تصویری جدید با مدل چندوجهی جی‌پی‌تی‌ـ۳.۵ (GPT-3.5) و جی‌پی‌تی-۴ (GPT-4) پشتیبانی می‌شود.

این مدل‌ها می‌توانند مهارت‌های منطق زبانی‌شان را برای انواع تصاویر، از جمله عکس، نماگرفت (اسکرین‌شات) و مدارک، به کار ببرند.

به گفته اوپن ای‌آی، قابلیت‌های جدید ظرف دو هفته آینده برای مشترکان پولی سرویس‌های چت جی‌پی‌تی پلاس و اینترپرایز در اپلیکیشن در دسترس خواهد بود.

این شرکت هوش مصنوعی گفت: «هیجان‌زده‌ایم که پس از آن، به‌زودی این قابلیت‌ها را در دسترس سایر گروه‌های کاربران، از جمله طراحان و سازندگان، قرار دهیم.»

ویشوام سانکاران - اينديپندنت فارسی


فیلمها و خبرهای بیشتر در کانال تلگرام پیک ایران

منبع خبر: پیک ایران

اخبار مرتبط: چت جی پی تی حالا می تواند ببیند، بشنود و حرف بزند