На годишната си I/O конференция в Калифорния Google направи няколко съобщения, свързани с AI, включително нови модели и надстройки на съществуващи. Едно от най-интересните съобщения беше Project Astra – мултимодален асистент, който функционира в реално време и съчетава възможностите на Google Lens и Gemini, за да ви предостави информация от заобикалящата ви среда.
Как работи Project Astra? На конференцията Google показа ранна версия на Project Astra, която функционира като базиран на камера чатбот и може да събира информация от заобикалящата ви среда с помощта на камерата на вашето устройство. Като мултимодален AI асистент, той може да използва аудио, видео и изображения като входове и да предоставя необходимия изход въз основа на тях. Работи с модела Gemini 1.5 Pro, което го прави невероятно мощен.
Чатботът анализира обекти и околности в реално време и може да отговаря на запитвания много бързо, което го прави доста подобен на човешки асистент или любимия JARVIS на Тони Старк. Project Astra работи и с носими устройства като интелигентни очила, което означава, че има много потенциал AI chatbot да бъде интегриран в различни устройства.
Project Astra може да разбере по-добре контекста, в който се използва, да обработва информацията по-бързо и да я запази за по-бързо извикване. Неговите възможности за говор също са много подобрени в сравнение с тези на по-ранните модели Gemini, така че звучи по-естествено и като човек.
Какво може да направи Project Astra? В кратката демонстрация, която Google показа, изглежда, че Project Astra може да помогне за постигането на много неща. Той може да наблюдава и разбира обекти и местоположения през обектива на камерата и микрофона и да ви предоставя информация за тях. Например, можете просто да насочите телефона си към част от код и да го обсъдите с чатбота или да го помолите да идентифицира обект и неговата употреба.
По същия начин, благодарение на възможностите за информираност за местоположението, Project Astra може да предостави информация за вашето местоположение само като хвърли поглед към заобикалящата ви среда. Той може също да запази информация, която му се показва, което може да бъде доста удобно, ако искате да намерите изгубени елементи, както беше показано в демонстрацията, когато помогна на потребителя да намери очилата си.
Можете също така да помолите AI асистента за креативни идеи, точно както с Gemini на вашия телефон. Например, можете да го помолите да измисли текст за песен, име за музикална група или нещо друго. По принцип Project Astra има за цел да бъде универсален AI асистент, който може да ви предостави информация в реално време по много разговорлив начин.
Кога ще бъде наличен Project Astra? Към момента Google не е направил съобщения относно наличността на Project Astra. Версията, показана в демонстрацията, е ранен прототип, но Google намекна, че тези възможности може да бъдат интегрирани в съществуващото приложение Gemini на по-късен етап.
С Project Astra Google се стреми да ръководи еволюцията на AI асистентите, така че те да станат още по-полезни и по-лесни за използване. Google обаче не е единственият, който преследва тази цел. OpenAI също наскоро обяви GPT-4o, правейки своя ChatGPT мултимодален, подобрявайки неговите възможности и ефективност. Новият гласов режим на ChatGPT (който ще бъде пуснат скоро) може също да използва видео вход от камерата на устройството, докато взаимодейства с потребителите.
В момента разликата между двете е, че GPT-4o скоро ще бъде наличен на всички устройства, работещи с ChatGPT, докато Project Astra се очаква да бъде наличен като Gemini Live някъде в бъдеще, въпреки че в момента няма дата на пускане. Тъй като ChatGPT, захранван от GPT-4o, е наличен по-рано, остава да видим дали Project Astra на Google ще бъде достатъчно добър, за да съперничи на по-популярния чатбот на OpenAI.
Вашият коментар