Още един AI модел се присъедини към морето от AI модели и този отново е от OpenAI. OpenAI преди това пусна GPT-4o тази година, който трябваше да бъде по-ефективен от GPT-4. Но все още беше доста скъпо и можеше да натрупа доста сметка, особено за разработчиците, които трябва да извикват AI модела чрез API за своите приложения многократно през целия ден.
В резултат на това разработчиците се обърнаха към по-евтини малки AI модели от конкуренти, като Gemini 1.5 Flash или Claude 3 Haiku.
Сега OpenAI пуска GPT-4o mini, техният най-рентабилен модел досега, с който те също навлизат в пространството на малките AI модели. Въпреки че GPT-4o mini е техният най-евтин модел досега, той не постига тази ниска цена чрез намаляване на интелигентността; той е по-умен от техния съществуващ модел GPT-3.5 Turbo.
Според OpenAI, GPT-4o mini отбеляза 82% в MMLU (Измерване на разбирането на многозадачен език), превъзхождайки много модели; това са съответните резултати на различните модели: GPT-3.5 Turbo (70%), Claude 3 Haiku (75.2%) и Gemini 1.5 Flash (78.9%). GPT-4o отбеляза 88,7% на този показател, като Gemini Ultra може да се похвали с най-висок резултат – 90% (това обаче не са малки AI модели).
GPT-4o mini се разпространява за потребители на ChatGPT Free, Team и Plus, както и за разработчици днес. За потребителите на ChatGPT, той по същество замени GPT-3.5; GPT-4o mini ще бъде моделът, към който разговорът е зададен по подразбиране, след като изчерпите безплатните GPT-4o заявки. Разработчиците все още ще имат опцията да използват GPT-3.5 чрез API, но в крайна сметка тя ще бъде премахната. Потребителите на ChatGPT Enterprise ще получат достъп до GPT-4o mini следващата седмица.
Както бе споменато по-горе, фокусът на GPT-4o mini е да помогне на разработчиците да намерят модел с ниска цена и латентност за тяхното приложение, който също е способен. В сравнение с други малки модели, GPT-4o mini превъзхожда задачите за разсъждение както в текст, така и във визуализация, математически разсъждения и задачи за кодиране, както и мултимодални разсъждения.
Понастоящем поддържа както текст, така и визия в API, с поддръжка за входове и изходи на текст, изображения, видео и аудио в пътната карта за бъдещето.
GPT-4o mini има контекстен прозорец от 128K токена за въвеждане и 16K токена за изход на заявка, като знанията му достигат до октомври 2023 г. Той може също така да обработва текст, който не е на английски, доста рентабилно.
Вашият коментар