Ce este DeepSeek, start-up-ul chinez care tine in sah Big Tech-ul american?
2 min read
Acest tanar start-up a dat peste cap sectorul IA in doar cateva zile.
Un nou campion al inteligentei artificiale (AI) tocmai a aparut si vine direct din Regatul Mijlociu. Suficient pentru a starni ingrijorarea gigantilor din Silicon Valley si a liderilor americani…
Costuri minime de formare in comparatie cu OpenAI
Este un veritabil val de maree. In doar cateva zile, modelul DeepSeek, R1, a ajuns in fruntea listei de descarcari gratuite de pe iPhone in Statele Unite. De asemenea, este una dintre cele mai descarcate aplicatii de productivitate din Google Play Store.
Start-up-ul, fondat in 2023 de Liang Wenfeng, un manager de fonduri speculative, se concentreaza in principal pe cercetare, in ciuda orientarii sale comerciale. In acest sens, modelul sau a fost implementat in sursa deschisa, permitand cercetatorilor sa exploateze algoritmul sau. Punctul forte al AI-ului sau este ca poate invata si se poate imbunatati automat, fara supraveghere umana. In mod similar, atunci cand isi dezvolta raspunsurile, isi sustine rationamentul cu ajutorul utilizatorului. Este o caracteristica de care utilizatorii sunt incantati.
Detaliile tehnice ale R1 i-au uimit pe cercetatori, si pe buna dreptate. Acesta functioneaza la fel de bine ca modelul o1 al OpenAI, si chiar mai bine in unele cazuri. Toate acestea necesita „doar” 5,6 milioane de dolari pentru formare, o fractiune din costul modelelor comparabile dezvoltate de gigantii americani.
Iar start-up-ul gandeste in mare, avand ambitia de a obtine in curand inteligenta artificiala generala, adica capabila sa efectueze sau sa invete orice sarcina cognitiva specifica oamenilor.
Rezilienta chineza
Se spune ca DeepSeek a utilizat 2 048 de cipuri NVIDIA H800. Acest GPU este mult mai putin eficient decat H100 folosit de companiile de peste Atlantic, dar start-up-ul este plin de ingineri locali ultra talentati de la cele mai bune universitati din tara. Ca urmare, acestia au reusit sa optimizeze acceleratoarele.
Aceasta este o adevarata lovitura pentru gigantii americani, deoarece performanta DeepSeek dovedeste ca nu sunt neaparat necesare cheltuieli colosale pentru a dezvolta modele puternice. Acest lucru pune sub semnul intrebarii strategiile de investitii aplicate in Silicon Valley.
Mai rau, aceasta intreprindere este o dovada a capacitatii Chinei de a ocoli sanctiunile severe cu care se confrunta, guvernul american interzicand companiilor chineze sa ii furnizeze cipuri de ultima generatie. In acest context, fondatorul sau Liang Wenfeng a fost ridicat la rangul de erou national.
Gigantii tehnologici chinezi se concentreaza, de asemenea, pe modele care sa concureze cu ChatGPT si altii, insa concurenta se va intensifica odata cu proiectul Stargate. Acest proiect in valoare de 500 de miliarde de dolari implica construirea unei infrastructuri uriase in Statele Unite pentru a sprijini capacitatile AI ale OpenAI.
Sursa: https://www.presse-citron.net/deepseek-la-startup-chinoise-qui-fait-trembler-les-etats-unis/