Alibaba Lansează Noul Model AI Qwen și Pretinde că Îl Surclasează pe DeepSeek-V3
Gigantul chinez Alibaba a lansat miercuri cea mai recentă versiune a modelului său emblematic de IA, Qwen. Compania susține că acesta poate funcționa mai bine decât popularul DeepSeek-V3.
Grăbită? Iată faptele rapide!
- Alibaba a lansat cel mai recent model de raționament, Qwen 2.5-Max, miercuri.
- Gigantul chinez susține că acesta depășește modele populare precum DeepSeek-V3, GPT-4o și Llama-3.1-405B.
- Compania a lansat și Qwen2.5-VL în această săptămână, un model AI capabil să proceseze imagini și să acționeze ca un agent AI folosind computere și dispozitive mobile pentru a efectua sarcini.
Conform Reuters, Alibaba a lansat noul Qwen 2.5-Max, așa cum a numit noul model de raționament, chiar în timpul sărbătorilor de Anul Nou Lunar din China, pentru a se alătura imenselor dezvoltări AI din ultimele zile și pentru a adăuga competiție internă.
Luni, DeepSeek a ajuns pe primul loc în App Store-ul Apple în Statele Unite, depășind ChatGPT, provocând îngrijorare în rândul altor companii din industria AI și alarmând investitorii – acțiunile Nvidia au scăzut cu 17% într-o singură zi.
Acum, Alibaba a anunțat cele mai recente versiuni ale modelului său Qwen – a lansat 100 de modele de AI cu sursă deschisă pentru suita Qwen în septembrie anul trecut – promițând rezultate mai bune decât modelele de frontieră populare.
„Qwen 2.5-Max depășește (…) aproape în toate aspectele GPT-4o, DeepSeek-V3 și Llama-3.1-405B,” a scris compania pe contul său oficial WeChat.
Noul model de raționament Qwen 2.5-Max are API-ul disponibil prin cloud-ul Alibaba și utilizatorii pot testa, de asemenea, modelul pe pagina sa de chat.
„Suntem în proces de dezvoltare a Qwen2.5-Max, un model MoE de mare scară care a fost pre-antrenat pe peste 20 de trilioane de token-uri și post-antrenat ulterior cu metodologii atent selectate de Supervizare Fină-Tuning (SFT) și Învățare prin Întărire din Feedbackul Uman (RLHF)”, a scris echipa Qwen pe Github.
Gigantul chinez a lansat de asemenea Qwen2.5-VL luni, o serie de modele AI multimodale care pot procesa și imagini și pot accesa dispozitive mobile și calculatoare pentru a efectua sarcini. OpenAI a anunțat o caracteristică similară, Operator, care permite ChatGPT să efectueze sarcini autonom, preluând controlul computerului utilizatorului.
Conform echipei Alibaba, toate modelele Qwen depășesc în performanță versiunile similare de la OpenAI, Microsoft, Google, Meta și DeepSeek.
Lasă un comentariu
Anulează