Какво е Gemini Live и кога ще бъде наличен

Какво е Gemini Live и кога ще бъде наличен

Google наскоро обяви множество актуализации на своя модел Gemini AI, включително няколко надстройки и нови модели. Сред тях един, който привлече много внимание, беше Gemini Live, мултимодален AI модел, който включва видео и гласови възможности.

Тъй като Bard беше преименуван на Gemini през февруари, моделът AI служи като заместител на Google Assistant на устройства с Android. Въпреки това, той е доста ограничен в това, което може да направи в момента. С Gemini Live Google има за цел да промени това, като предложи по-мощен и гъвкав AI модел.

Какво е Gemini Live?

За да предостави на потребителите подобрено изживяване с изкуствен интелект и да се справи с подобрения ChatGPT на OpenAI GPT-4o, Google обяви Gemini Live на своята I/O конференция за разработчици наскоро. Gemini Live ще позволи на потребителите да водят естествени и персонализирани разговори в реално време с него чрез глас, а по-късно и видео.

Новият AI модел е част от проекта Astra на Google, който е опитът на гиганта за търсене да изгради универсален AI асистент, който може да използва различни типове данни от ежедневието, за да осигури помощ. Например Gemini Live може да използва текст, визуални изображения от камерата на вашия смартфон и вашия глас, за да отговаря на въпроси.

Според Google новият модел на естествения език не само ще помогне на потребителите да решават проблеми и да извършват различни действия, но също така ще се чувстват напълно естествени по време на взаимодействие. Потребителите ще могат да стартират Gemini Live, като докоснат гласовата икона на телефона си, което ще покаже AI на цял екран с ефект на аудио вълна.

След това можете да разговаряте с AI точно както бихте направили с истински личен асистент. Отличен пример за това как подобреният AI модел може да ви помогне е, когато го помолите да ви помогне с подготовката за интервю. Gemini Live ще предложи уменията, които можете да подчертаете, ще предостави съвети за публично говорене и много други.

Характеристика

Gemini Live идва с няколко функции, които го правят много по-добър AI асистент от Google Assistant, Siri на Apple или Alexa на Amazon.

Двупосочни гласови разговори

Gemini Live ви позволява да разговаряте с него и предоставя човешки вербални отговори, което води до ангажиращи и интуитивни разговори. Например, можете да го попитате за времето и то ще ви даде точна и кратка актуализация.

Възможности за интелигентен асистент

AI моделът може да служи като интелигентен асистент и да изпълнява задачи като обобщаване на информация от имейли и актуализиране на вашия календар. Например, можете да направите снимка на листовка за концерт и Gemini ще добави събитието към вашия календар.

Визуални възможности

Използвайки камерата на вашия смартфон, Gemini Live може да заснема видеоклипове в реално време. Това му позволява да идентифицира обекти и да отговаря на въпроси относно тях. Като пример, ако насочите камерата на вашия смартфон към високоговорител и помолите Gemini да го идентифицира, той ще ви каже какво е и дори ще идентифицира неговата марка и модел.

Източник: Google

Как работи Gemini Live?

Project Astra може да комбинира реч и визуални входове, което ги прави лесни за разбиране за AI модела. След това може да реагира на информацията и да предостави необходимата помощ. Подобно на GPT-4o-задвижвания ChatGPT на OpenAI, Gemini Live е мултимодален AI и не разчита единствено на текст като вход.

Докато Gemini Live първоначално ще използва гласово въвеждане за събиране и анализ на данни при първоначалното издание, то ще бъде надстроено през следващите месеци, за да обработва и анализира видеоклипове, като ги разделя кадър по кадър за по-добро разбиране и взаимодействие.

AI може да се адаптира към скоростта, с която говорят различните потребители, и дори можете да го прекъснете, за да поискате разяснение или да предоставите повече информация. Способността му да имитира човешки диалог може да осигури по-ангажиращо взаимодействие. По този начин можете да водите разговор напред-назад с него, точно както с човешки асистент. Освен това ще можете да избирате между десет различни гласа за AI.

GPT-4o срещу. Близнаци на живо

Докато и GPT-4o, и Gemini Live са мултимодални AI модели, в момента е трудно да се види кой от тях се представя по-добре в реалния живот, особено след като нито един от тях не е публично достъпен в момента.

Въпреки това, за разлика от ChatGPT, Gemini Live разчита на други AI модели като Google Veo и Imagen 3, за предоставяне на изход под формата на видеоклипове и изображения. Въпреки това, в демонстрациите, показани от OpenAI и Google, ChatGPT изглеждаше по-естествен и новият модел GPT-4o дори можеше да открие и симулира човешки емоции чрез гласови тонове.

Освен това, той може да се адаптира към начина, по който искате да отговори, което Gemini Live не може да направи, поне в сегашното си състояние.

Gemini Live Наличност

Gemini Live ще бъде достъпен за абонатите на Gemini Advanced, което е платената версия на AI chatbot. Той ще бъде разпространен през следващите месеци и се очаква да бъде широко достъпен до края на годината.

Приложения като Google Messages ще могат да се възползват напълно от Gemini Live, позволявайки на потребителите да взаимодействат с AI директно в приложението за съобщения.

Gemini Live може да е следващото голямо надграждане на AI chatbot на Google и точно това, от което се нуждае, за да се справи с конкуренти като ChatGPT на OpenAI. С мултимодална функционалност и мощни възможности за говор, обновеният модел може да помогне на Google да постигне успех в предоставянето на гъвкав и надежден дигитален асистент.

Точно сега Google обяви само, че ще предостави новия AI модел на платени абонати. Въпреки че това изключва безплатните потребители, които съставляват огромна част от потребителската база на Google, ние се надяваме Google да промени позицията си и да реши да разшири достъпността на Gemini Live.

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *