Meta пуска Llama 3.1: Най-мощният AI модел с отворен код досега

Meta обяви пускането на Llama 3.1, своя най-нов и най-усъвършенстван модел на изкуствен интелект с отворен код. Тази нова версия представлява значителен скок напред в AI технологията, като Meta твърди, че превъзхожда водещите патентовани модели на компании като OpenAI.

Водещият модел Llama 3.1 405B, включващ 405 милиарда параметри, сега е най-големият публично достъпен модел на основата. Той демонстрира най-съвременни способности в областта на общите познания, математиката, използването на инструменти и многоезичния превод. Моделът е обучен на над 15 трилиона токена, използвайки повече от 16 000 графични процесора H100 на Nvidia.

Едно от ключовите подобрения в Llama 3.1 е разширената дължина на контекста от 128K токена, което е 16 пъти повече от капацитета на предишните модели на Llama. Това позволява на AI да обработва и разбира много по-дълги пасажи от текст, подобрявайки способността му да се справя със сложни задачи и да генерира по-нюансирани отговори.

Новият модел поддържа осем езика: английски, немски, френски, италиански, португалски, хинди, испански и тайландски. Тази многоезична способност прави Llama 3.1 универсален инструмент за разработчици и фирми, работещи върху глобални AI приложения.

Meta пуска Llama 3.1 в три размера: 405B , 70B и 8B параметри. Всеки размер е оптимизиран за различни случаи на употреба:

Моделът 405B е идеален за корпоративни приложения и напреднали изследвания, способен на генериране на текст в дълга форма, многоезичен превод, кодиране и сложни задачи за разсъждение.
Моделът 70B е подходящ за създаване на съдържание, разговорен AI и разбиране на езика.
Моделът 8B е предназначен за приложения с ограничени изчислителни ресурси, като мобилни устройства.

За да улесни приемането, Meta си сътрудничи с големи технологични компании като Amazon, Google и Databricks, за да направи Llama 3.1 наличен на различни платформи. Например, моделите вече са достъпни в Amazon Web Services (AWS) чрез услуги като Amazon SageMaker JumpStart и Amazon Bedrock.

Марк Зукърбърг, главен изпълнителен директор на Meta, подчертава значението на ИИ с отворен код, заявявайки, че това е ключът към демократизирането на предимствата на ИИ. Той вярва, че моделите с отворен код като Llama 3.1 в крайна сметка ще надминат патентованите по възможности и степен на приемане.

Пускането на Llama 3.1 също идва с актуализиран лиценз, който позволява на разработчиците да използват резултатите от модела, за да подобрят други AI системи. Очаква се този ход да ускори иновациите в областта на AI и да предостави на разработчиците повече гъвкавост при изграждането и персонализирането на AI приложения.

Ангажиментът на Meta към AI с отворен код напомня как Linux се превърна в доминиращата операционна система с отворен код за много устройства и сървъри. Компанията се надява, че Llama 3.1 по подобен начин ще се превърне в крайъгълен камък за развитието на AI.

Тъй като AI продължава да се развива бързо, пускането на Llama 3.1 бележи важен крайъгълен камък в превръщането на мощните AI модели в по-достъпни за разработчиците и бизнеса по целия свят. Той поставя началото на нова ера на иновациите на AI, където моделите с отворен код се конкурират директно с и потенциално надминават своите патентовани аналози.