26/09/2023
ChatGPT вече може да вижда, чува и говори
Иновациите в света на изкуствения интелект не спират дори за миг. Само преди няколко дни, OpenAI представи новата версия на генератора на изображения DALL·E 3, а от днес ChatGPT вече ще може да “вижда”, “чува” и “говори”.
Тези нововъведения превръщат чатбота в по-интуитивен и мултимодален AI асистент, който е отражение на непрекъснатия стремеж на OpenAI в разработката на инструменти, които не само улесняват ежедневието, но и имат потенциал да надминат човешките възможности в множество области.
Целта на OpenAI е да разработи AGI (изкуствен общ интелект), който да бъде безопасен и в полза на хората. Ние сме на мнение, че инструментите ни трябва да бъдат представени постепенно. Това ни дава възможност да извършваме подобрения и да усъвършенстваме мерките за сигурност, докато същевременно подготвяме обществото за по-мощни системи в бъдеще. Тази стратегия е особено важна при създаването на напреднали модели, които обработват гласова и визуална информация– споделят от компанията в блог поста по темата.
Гласова комуникация ChatGPT
Новата функция за гласови разговори ще предоставя възможност за динамични диалози с ChatGPT, подобно на Siri и Cortana. За активация, потребителите просто трябва да изберат опцията за гласови разговори в приложението на ChatGPT за iOS и Android.
Гласовата функционалност се основава на най-новите модели за гласово разпознаване и синтеза на OpenAI. Това включва Whisper , който е водещият модел на OpenAI за превръщане на реч в текст, както и нов модел за синтез на глас от текст. Потребителите ще имат възможност да изберат от пет реалистични гласа, всеки с различен тон и уникален характер.
От компанията споделят, че са работили в партньорство с професионални актьори, за да създадат уникални гласови варианта, които да отговарят на различни потребителски предпочитания.
Визуална комуникация
Освен гласовата комуникация, ChatGPT ще може да разпознава и интерпретира изображения. Тази функционалност ще бъде достъпна за абонатите на ChatGPT Plus, като ще позволява добавянето на снимки директно към чатовете. Това означава, че потребителите ще могат:
- да качват снимки и да задават въпроси за обектите на тях
- да анализират документи
- да разглеждат и интерпретират различни видове визуални материали
Особено интересно е, че потребителите могат да акцентират върху конкретни елементи на изображението, като по този начин насочват вниманието на ChatGPT към тях.
Oт OpenAI споделят, че новите функции ще бъдат налични за абонатите на ChatGPT Plus и Enterprise, като ще бъдат интегрирани в рамките на следващите две седмици. На по-късен етап, от компанията планират да разгърнат тези възможности и за други потребителски групи, включително разработчици.
Повече за платените планове на OpenAI
ChatGPT Plus се предлага на цена от $20 и включва всички функции от безплатната версия, плюс: GPT-4, анализ на данни, разширения и ранен достъп до бета функции. За момента има ограничение от 50 съобщения на всеки три часа.
От друга страна, ChatGPT Enterprise осигурява сигурност и поверителност на корпоративно ниво, неограничен достъп до GPT-4, по-висока скорост, възможност за обработка на по-обемни данни, опции за персонализиране и много други.
Целта на AI Bulgaria е да предоставя актуална и стойностна информация от света на изкуствения интелект (AI). Последвайте ни в социалните мрежи – Facebook, Instagram, X, LinkedIn и се присъединете към нашия Discord сървър!