OpenAI наскоро обяви своя модел GPT-4o, нов флагмански модел на двигателя, който захранва ChatGPT, неговият известен чатбот, задвижван от AI, пуснат за първи път през 2022 г. Този по-нов модел извежда взаимодействието човек-компютър на изцяло ново ниво, като го прави да изглежда по-бързо и много по-естествено.
В GPT-4o „o“ означава „omni“, тъй като той комбинира текст, изображение и аудио в един модел. Въпреки че няма подобрение в областта на интелигентността и мисленето спрямо модела GPT-4 Turbo, има много нови актуализации. Той е проектиран да предоставя по-бързи, по-човешки звучащи отговори и дори може да симулира емоции. Освен това е значително по-бърз при разбирането на визуални и аудио входове. В това дълбоко гмуркане ще разгледаме функциите, които GPT-4o предлага и как ще революционизира начина, по който взаимодействаме с AI асистентите. Така че, присъединете се към нас и нека да започнем!
GPT-4o е значително по-бърз
Моделът GPT-4o позволява на ChatGPT да приема входове в различни форми, включително аудио, текст, изображения или техни комбинации. Може също така да предоставя отговори в различни формати. Най-впечатляващото в него обаче е скоростта, с която ви дава отговори.
С новия модел ChatGPT отнема само около 320 милисекунди или дори по-малко, за да отговори на аудио входове, което е близо до времето, необходимо на човек, за да отговори в разговор. Освен това производителността на GPT-4o е подобна на GPT-4 Turbo, що се отнася до използването на английски език или писането на код.
Освен това се справя много по-добре, когато отговаря на текстово въвеждане на езици, различни от английски, и е значително по-евтино в API, тъй като е много по-ефективно от предшественика си.
Освен това има нов интерфейс, предназначен да направи взаимодействието по-лесно и по-изчистено.
Той е мултимодален
Съществуващият гласов режим на ChatGPT се състои от три модела. Първият приема текстово въвеждане и осигурява изход в същия формат, докато вторият преобразува аудио вход в текст, който се приема от ChatGPT, за да предостави текстово базиран изход. Последният модел преобразува текст в аудио.
Въпреки това, този дизайн води до загуба на информация, тъй като моделът не може да взаимодейства директно с аудио входа или представя изхода, който има емоционални елементи. С GPT-4o, OpenAI изгради един мултимодален модел, който може да разбира различни типове входове и да обработва директно необходимия изход.
В момента поддържа 50 езика и ще бъде наличен и като API.
Може да симулира човешки емоции
Когато ChatGPT беше обявен за първи път, един от най-големите недостатъци на AI chatbot за много хора беше, че не можеше да осигури емоционални отговори. С GPT-4o, ChatGPT може да симулира човешки емоции и да предостави подходящи отговори, които интегрират такива емоции.
В демонстрациите, споделени от OpenAI, чатботът може да бъде видян да се смее, пее и дори показва сарказъм, когато бъде помолен. Това е много повече от това, което всеки друг чатбот с изкуствен интелект може да направи в момента и ще направи потребителските взаимодействия много по-приятни. Според OpenAI, новият модел ще позволи на ChatGPT да открива и настроенията на потребителя и да предоставя адекватни отговори въз основа на тази информация.
В комбинация с възможността за използване на визуални входове, способността за предоставяне на емоционални отговори е една от най-впечатляващите характеристики, които новият модел предлага.
Новият модел може да съхранява по-голямо количество информация
Благодарение на GPT-4o, ChatGPT вече може да разбира по-добре изображения, като диаграми и снимки, и също така да съхранява повече информация за потребителя. Това също се превръща в отговори, които могат да съдържат по-големи части от текст, което може да бъде удобно в няколко случая на употреба.
Например, можете да помолите чатбота да преведе по-големи части от текст сега и той може да ви помогне с превод на живо. Тъй като може да използва визуални и аудио входове заедно с текстови, можете да го използвате за събиране на информация от екранни снимки, снимки и други изображения.
Тъй като може да съхранява по-голямо количество информация, без потребителите да трябва да повтарят, GPT-4o позволява на потребителите да участват в разговори напред-назад с AI chatbot. С повече информация потребителите могат да очакват разговорите да бъдат по-сложни.
Предпазни мерки в новия модел
Подобно на съществуващите модели GPT, GPT-4o е проектиран с определени предпазни мерки, за да се гарантира безопасността. Данните за обучението са филтрирани и поведението на модела е прецизирано след обучението. OpenAI също така оцени модела на AI по няколко параметъра, като киберсигурност и убеждаване, за да избегне нежелани инциденти.
Освен това, разработчиците се възползваха от помощта на над 70 експерти в различни области като дезинформация и социална психология, за да идентифицират и смекчат рисковете, които могат да възникнат или да се увеличат с новия модел. Те също така ще продължат да наблюдават използването на чатбота за бъдещи рискове и ще предприемат необходимите действия, когато и когато е необходимо.
За начало OpenAI ще предостави само ограничен избор от предварително зададени гласови модели. Той също така ще вземе предвид обратната връзка, предоставена от потребителите, за да подобри модела и да гарантира пълна безопасност.
GPT-4o Наличност
Досега имаше две налични версии на ChatGPT – безплатна версия, работеща на GPT 3.5, и платена версия, която работеше на GPT 4.0 и струваше $20 на месец. Последният има достъп до по-голям езиков модел, което му позволява да обработва по-големи количества данни.
GPT-4o ще бъде достъпен както за безплатни, така и за платени потребители и се очаква да бъде пуснат на устройства през следващите седмици. То ще бъде достъпно на мобилни устройства чрез съществуващото приложение, което ще бъде актуализирано, а ново приложение за настолни компютри за macOS също ще бъде налично в допълнение към уеб версията за настолни потребители (версията за Windows ще се появи по-късно тази година).
За да направи разлика между безплатни и платени потребители, OpenAI ще предложи на платените потребители пет пъти повече капацитет от това, което ще бъде предложено на безплатните потребители. След като изчерпите лимита си, ще бъдете превключени обратно към ChatGPT 3.5.
Съобщението на OpenAI относно GPT-40 идва само един ден преди годишната I/O конференция за разработчици на Google, където се очаква Google да направи свои собствени съобщения, свързани с AI. OpenAI също обеща, че предстоят още съобщения, така че няма съмнение, че конкуренцията между двамата съперници тепърва започва да се разгаря.
Въпреки че не знаем кога OpenAI ще разкрие повече промени в своя AI модел, знаем, че GPT-4o се насочва към устройства, работещи с ChatGPT в световен мащаб. Така че, стискайте палци и изчакайте актуализацията да се покаже на вашето устройство. До следващия път!
Вашият коментар