
Image by TechCrunch, from Flickr
AI care gândește înainte de a vorbi? Claude 3.7 Sonnet lansează raționamentul hibrid
Anthropic a lansat Claude 3.7 Sonnet, o nouă versiune a modelului său de AI care introduce un mod opțional de „gândire extinsă”, oferind utilizatorilor mai mult control asupra modului în care modelul procesează sarcini complexe.
Grăbiți? Iată faptele rapide!
- Modelul îmbunătățește raționamentul și rezolvarea problemelor, permițând auto-reflecția înainte de a răspunde.
- Modul de gândire extinsă este disponibil doar pe planurile plătite.
- Claude Code, un asistent de codare, este în previzualizare limitată pentru dezvoltatori
Anthropic a lansat Claude 3.7 Sonnet, un model AI actualizat care introduce raționamentul hibrid, permițând utilizatorilor să aleagă între răspunsuri rapide și gândire extinsă.
Această nouă abordare își propune să îmbunătățească rezolvarea problemelor prin permiterea modelului să ia timp suplimentar pentru a evalua și a-și rafina răspunsurile atunci când este necesar.
În modul standard, Claude 3.7 Sonnet funcționează ca o îmbunătățire iterativă față de predecesorul său, Claude 3.5 Sonnet. În modul de gândire extinsă, însă, modelul se angajează în auto-reflecție înainte de a produce un răspuns.
Michael Gerstenhaber, liderul de produs pentru AI la Anthropic, a descris funcția ca fiind un mod pentru utilizatori de a echilibra timpul de răspuns și profunzimea raționamentului. „[Utilizatorul] are mult control asupra comportamentului – cât timp se gândește și poate face un schimb între raționament și inteligență cu timpul și bugetul”, a spus el, conform WIRED.
Acest proces este destinat să îmbunătățească acuratețea în domenii care necesită raționament multi-pas, cum ar fi matematica, fizica, programarea și urmarea instrucțiunilor. Utilizatorii care interacționează cu modelul prin API pot specifica o limită a cât de multe token-uri folosește pentru a „gândi”, permițând controlul asupra vitezei de răspuns și a costului.
WIRED notează că actualizarea include și o funcție de „blocnotes”, care face vizibile etapele de raționament ale modelului în timp ce procesează o cerere. Această abordare este similară cu tehnicile utilizate în alte modele AI, cum ar fi DeepSeek.
Anthropic afirmă că Claude 3.7 Sonnet a fost optimizat pentru aplicații din lumea reală, mai degrabă decât pentru benchmark-uri de stil competițional. Testările preliminare sugerează că modul de raționament extins îmbunătățește performanța în sarcini care implică baze de cod complexe, utilizarea avansată a uneltelor și dezvoltarea software full-stack.
Modelul a fost evaluat pe SWE-bench Verified și TAU-bench, unde se raportează că a depășit performanțele versiunilor anterioare, așa cum a relatat Anthropic.
CNN menționează că Anthropic a păstrat prețul pentru Claude 3.7 la fel ca modelele anterioare, poziționându-l sub cele mai recente oferte ale OpenAI. Acesta costă $3 pe milion de token-uri de intrare și $15 pe milion de token-uri de ieșire, comparativ cu prețurile de $15 și $60 ale OpenAI pentru niveluri similare.
Lasă un comentariu
Anulează