
Image by Matheus Bertelli, from Pexels
AI-ul DeepSeek învață să gândească pentru sine
Start-up-ul chinezesc DeepSeek, în parteneriat cu Universitatea Tsinghua, susține că a dezvoltat o metodă mai inteligentă de a ajuta modelele de inteligență artificială să gândească mai bine și mai rapid, fără a avea nevoie de calculatoare imense sau resurse costisitoare.
Te grăbești? Iată faptele rapide:
- DeepSeek a creat un AI auto-îmbunătățitor folosind Tuning-ul Critic bazat pe Principii Proprii (SPCT).
- SPCT îi învață pe AI să-și evalueze propria muncă utilizând reguli auto-generate.
- Metoda îmbunătățește performanța fără a necesita o putere de calcul masivă.
Progresul vine dintr-o nouă tehnică numită Self-Principled Critique Tuning (SPCT). SPCT se diferențiază de simpla mărire a modelelor de IA pentru a îmbunătăți performanța – SPCT nu necesită o cantitate mare de energie și putere de calcul pentru a învăța IA să își evalueze propriul lucru folosind un set de reguli create de sine.
Modul în care funcționează se bazează pe un „judecător” încorporat care verifică dacă răspunsul AI se supune atât regulilor sale interne de raționament, cât și pare potrivit pentru producția umană. Când AI oferă un răspuns solid, primește feedback pozitiv, care îl ajută să își îmbunătățească capacitatea de a răspunde la întrebări similare în situații viitoare.
DeepSeek implementează această metodă ca parte a sistemului său DeepSeek-GRM, care reprezintă Modelarea Recompenselor Generative. GRM funcționează diferit față de metodele tradiționale deoarece efectuează verificări paralele pentru a îmbunătăți atât acuratețea cât și consistența.
„Propunem Ajustarea Critică Auto-Principiată (SPCT) pentru a promova comportamente de generare a recompenselor scalabile”, au scris cercetătorii în lucrarea lor. „SPCT permite [modelului] să propună în mod adaptiv principii și critici bazate pe interogarea și răspunsurile introduse, conducând la recompense mai bune.”
Cu acest sistem, DeepSeek susține că AI-ul său poate acum performa mai bine decât competitorii precum Gemini de la Google, Llama de la Meta și GPT-4o de la OpenAI, mai ales când vine vorba de sarcini complexe precum raționamentul sau luarea deciziilor, așa cum a fost menționat de Euronews.
Este important de menționat că DeepSeek afirmă că intenționează să lanseze aceste noi instrumente ca software open-source, deși nu a fost împărtășită nicio dată de lansare.
Lasă un comentariu
Anulează