چت جی پی تی حالا می تواند ببیند، بشنود و حرف بزند
چت جیپیتی حالا میتواند ببیند، بشنود و حرف بزند
این قابلیتها به کاربران امکان میدهد مکالمه صوتی با هوش مصنوعی داشته باشندـ LIONEL BONAVENTURE/AFP
بنا بر اعلام شرکت اوپن ایآی، چت جیپیتی یک بهروزرسانی جدید دارد که به این ابزار فراگیر هوش مصنوعی امکان میدهد «ببیند، بشنود و صحبت کند».
این شرکت روز دوشنبه در پستی وبلاگی اعلام کرد که بهروزرسانی ربات چت هوش مصنوعی اوپن ایآی به کاربران اجازه خواهد داد تا مکالمه صوتی با این ربات چت هوش مصنوعی داشته باشند و همچنین با استفاده از تصویر، با آن تعامل داشته باشند.
این شرکت همچنین در پستی در اکس/توییتر نوشت: «چت جیپیتی حالا میتواند ببیند، بشنود، و صحبت کند.»
این قابلیتها «در دو هفته آینده» در دسترس خواهد بود و به کاربران امکان میدهد «با استفاده از صدا، مکالمهای دوطرفه» با دستیار هوش مصنوعی داشته باشند.
به گفته اوپن ایآی، با این قابلیتهای جدید، چت جیپیتی میتواند برای «درخواست قصه شب برای خانوادهتان، یا حلوفصل بحث سر میز شام» کاربرد داشته باشد، که چت جیپیتی را به خدماتی که دستیار هوش مصنوعی الکسای آمازون یا سیری اپل ارائه میدهند نزدیکتر میکند.
اوپن ایآی برای نمایش نمونهای از نحوه کارکرد این قابلیت، ویدیویی را به اشتراک گذاشت که در آن کاربری از چت جیپیتی میخواهد داستانی درباره «خارپشت معرکه آفتابگردانی به نام لری» بگوید.
ربات چت با صدایی شبیه انسان به سوال پاسخ میدهد و همچنین به سوالهایی مانند «خانهاش چه شکلی است؟» و «دوست صمیمیاش چه کسی است؟» جواب میدهد.
چت جیپیتی الان میتواند ببیند، بشنود، و حرف بزند. در دو هفته آینده در دسترس خواهد بود. کاربران [چت جیپیتی] پلاس میتوانند مکالمههای صوتی با چت جیپیتی داشته باشند (آیاواس و اندروید) و تصاویر را به گفتوگوها اضافه کنند (روی تمام بسترها).
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023به گفته اوپن ایآی، قابلیت صوتی با استفاده از یک مدل تبدیل متن به گفتار پشتیبانی میشود که از متن و نمونه گفتاری چند ثانیهای صدای شبیه انسان تولید میکند.
این شرکت گفت: «ما برای خلق هر کدام از این صداها، با صداپیشگان حرفهای همکاری کردیم. ما همچنین از ویسپر، سیستم تشخیص گفتار متنباز شرکت خودمان، استفاده کردیم تا صحبتهای شفاهی شما را به شکل متن رونویسی کنیم.»
این شرکت هوش مصنوعی معتقد است که فناوری صوتی جدید قادر است از فقط چند ثانیه گفتار واقعی، صداهای مصنوعی شبیه واقعی بسازد، و میتواند راه را برای اپلیکیشنهای خلاقانه زیادی باز کند.
با وجود این، شرکت اوپن ایآی همچنین هشدار داده است که قابلیتهای جدید ممکن است خطرهای جدیدی ایجاد کنند «مانند این احتمال که افراد دارای سوءنیت خود را جای چهرههای سرشناس جا بزنند یا اقدام به کلاهبرداری کنند».
بهروزرسانی مهم دیگر این ربات چت هوش مصنوعی به کاربران امکان میدهد که تصویری را بارگذاری گنند و از چت جیپیتی در موردش سوال کنند.
اوپن ایآی توضیح داد: «علت روشن نشدن کبابپز را عیبیابی کنید، محتویات یخچال را وارسی و برای غذا برنامهریزی کنید، یا یک نمودار پیچیده را برای دادههای مرتبط با کار تجزیه و تحلیل کنید.»
به گفته این شرکت، قابلیت جدید همچنین به کاربران امکان میدهد با استفاده از ابزار ترسیم اپلیکیشن موبایل چت جیپیتی، روی بخش خاصی از تصویر تمرکز کنند.
این نوع تشخیص چندوجهی ربات چت از مدتی قبل پیشبینی میشد، و این شناخت تصویری جدید با مدل چندوجهی جیپیتیـ۳.۵ (GPT-3.5) و جیپیتی-۴ (GPT-4) پشتیبانی میشود.
این مدلها میتوانند مهارتهای منطق زبانیشان را برای انواع تصاویر، از جمله عکس، نماگرفت (اسکرینشات) و مدارک، به کار ببرند.
به گفته اوپن ایآی، قابلیتهای جدید ظرف دو هفته آینده برای مشترکان پولی سرویسهای چت جیپیتی پلاس و اینترپرایز در اپلیکیشن در دسترس خواهد بود.
این شرکت هوش مصنوعی گفت: «هیجانزدهایم که پس از آن، بهزودی این قابلیتها را در دسترس سایر گروههای کاربران، از جمله طراحان و سازندگان، قرار دهیم.»
ویشوام سانکاران - اينديپندنت فارسی
فیلمها و خبرهای بیشتر در کانال تلگرام پیک ایران
منبع خبر: پیک ایران
اخبار مرتبط: چت جی پی تی حالا می تواند ببیند، بشنود و حرف بزند
موضوعات مرتبط: هوش مصنوعی صداپیشگان جی پی تی دستیار میخانه فناوری مکالمه قصه شب آفتاب انسان معرکه ثانیه فارسی صمیمی معتقد صداها واقعی گفتار دوست میما
حق کپی © ۲۰۰۱-۲۰۲۴ - Sarkhat.com - درباره سرخط - آرشیو اخبار - جدول لیگ برتر ایران