Alibaba a prezentat Qwen3‑Max, un model lingvistic cu peste 1 trilion de parametri, cel mai puternic din portofoliul său, anunțat în preajma conferinței Apsara de la Hangzhou.
Compania poziționează inteligența artificială ca prioritate strategică, alături de comerțul electronic, accelerând lansările de produse și extinderea infrastructurii.
Qwen3‑Max folosește o arhitectură Mixture‑of‑Experts și a fost preantrenat pe aproximativ 36 de trilioane de tokeni, cu accent pe codare, multilingvism și raționament. Modelul poate gestiona intrări foarte lungi, de ordinul a circa un milion de tokeni, pentru cazuri ce necesită context extins. Sunt oferite variante pentru utilizare generală și pentru fluxuri „agentice”, sub denumirile Qwen3‑Max‑Instruct și Qwen3‑Max‑Thinking.
Pe benchmarkuri prezentate de companie, Qwen3‑Max depășește în anumite metrici modele consacrate, precum Claude și DeepSeek‑V3.1, inclusiv pe teste precum Tau2‑Bench. Aceste rezultate sunt în principal autoreportate, însă previzualul Qwen3‑Max‑Instruct a urcat pe locul trei în clasamentul LMArena pentru text, semnalând un salt real de performanță.
Accesul public este disponibil prin Qwen Chat și prin API‑ul din Model Studio pe Alibaba Cloud, modelul fiind comercial, dar ne‑open‑source. În paralel, Alibaba a anunțat Qwen3‑Omni, un model multimodal end‑to‑end descris ca deschis sub licența Apache 2.0, capabil de intrări text, imagine, audio și video.
Lansarea este susținută de un plan de investiții de circa 380 de miliarde de yuani în infrastructură AI pe trei ani și de extinderea globală a centrelor de date. Pe termen scurt, compania urmărește accelerarea livrării de capacitate și consolidarea parteneriatelor strategice, cu Qwen ca pilon al ofertei cloud.








Lasa un comentariu!