AI-ul DeepSeek învață să gândească pentru sine

Image by Matheus Bertelli, from Pexels

AI-ul DeepSeek învață să gândească pentru sine

Timp de citire: 2 min

Start-up-ul chinezesc DeepSeek, în parteneriat cu Universitatea Tsinghua, susține că a dezvoltat o metodă mai inteligentă de a ajuta modelele de inteligență artificială să gândească mai bine și mai rapid, fără a avea nevoie de calculatoare imense sau resurse costisitoare.

Te grăbești? Iată faptele rapide:

  • DeepSeek a creat un AI auto-îmbunătățitor folosind Tuning-ul Critic bazat pe Principii Proprii (SPCT).
  • SPCT îi învață pe AI să-și evalueze propria muncă utilizând reguli auto-generate.
  • Metoda îmbunătățește performanța fără a necesita o putere de calcul masivă.

Progresul vine dintr-o nouă tehnică numită Self-Principled Critique Tuning (SPCT). SPCT se diferențiază de simpla mărire a modelelor de IA pentru a îmbunătăți performanța – SPCT nu necesită o cantitate mare de energie și putere de calcul pentru a învăța IA să își evalueze propriul lucru folosind un set de reguli create de sine.

Modul în care funcționează se bazează pe un „judecător” încorporat care verifică dacă răspunsul AI se supune atât regulilor sale interne de raționament, cât și pare potrivit pentru producția umană. Când AI oferă un răspuns solid, primește feedback pozitiv, care îl ajută să își îmbunătățească capacitatea de a răspunde la întrebări similare în situații viitoare.

DeepSeek implementează această metodă ca parte a sistemului său DeepSeek-GRM, care reprezintă Modelarea Recompenselor Generative. GRM funcționează diferit față de metodele tradiționale deoarece efectuează verificări paralele pentru a îmbunătăți atât acuratețea cât și consistența.

„Propunem Ajustarea Critică Auto-Principiată (SPCT) pentru a promova comportamente de generare a recompenselor scalabile”, au scris cercetătorii în lucrarea lor. „SPCT permite [modelului] să propună în mod adaptiv principii și critici bazate pe interogarea și răspunsurile introduse, conducând la recompense mai bune.”

Cu acest sistem, DeepSeek susține că AI-ul său poate acum performa mai bine decât competitorii precum Gemini de la Google, Llama de la Meta și GPT-4o de la OpenAI, mai ales când vine vorba de sarcini complexe precum raționamentul sau luarea deciziilor, așa cum a fost menționat de Euronews.

Este important de menționat că DeepSeek afirmă că intenționează să lanseze aceste noi instrumente ca software open-source, deși nu a fost împărtășită nicio dată de lansare.

V-a plăcut acest articol?
Acordați-i o notă!
Nu mi-a plăcut deloc Nu prea mi-a plăcut A fost ok Destul de bun! Mi-a plăcut mult!

Ne bucurăm că ți-a plăcut munca noastră!

Pentru că prețuim părerea ta, ne-ai putea lăsa o recenzie pe Trustpilot? Durează doar un moment și face o mare diferență pentru noi. Îți mulțumim pentru sprijin!

Oferă-ne o notă pe Trustpilot
0 Votat de 0 utilizatori
Titlu
Comentariu
Vă mulțumim pentru feedback
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Lasă un comentariu

Loader
Loader Mai mult...