Što je DeepSeek? Na dobrom je putu da zasjeni popularni ChatGPT

DeepSeek, AI startup star tek nešto stariji od godinu dana, izazvao je oduševljenje i zabrinutost u Silicijskoj dolini svojim revolucionarnim modelom umjetničke inteligencije koji nudi usporedive rezultate s najboljim chatbotovima na svijetu, a sve to po cijeni koja je, čini se, samo djelić onoga što su drugi modeli zahtijevali. Stvoren u kineskom Hangzhou, DeepSeek ima dalekosežne implikacije za globalnu tehnološku industriju i opskrbne lance te nudi kontrapunkt široko rasprostranjenom uvjerenju da će budućnost AI-ja zahtijevati sve veće količine energije i snage za razvoj.

Što je DeepSeek?

DeepSeek je kineski startup koji je osnovao Liang Wenfeng, čelnik kvantnog hedge fonda temeljenog na AI-u, High-Flyer, 2023. godine. Kompanija razvija open-source AI modele, a njezina istoimena mobilna aplikacija dospjela je na vrh ljestvice preuzimanja na iPhoneu u SAD-u nakon lansiranja početkom siječnja.

Aplikacija DeepSeek razlikuje se od drugih chatbotova poput OpenAI-ovog ChatGPT-a po tome što iznosi svoje razmišljanje prije nego što pruži odgovor na zadani upit. Kompanija tvrdi da njezina verzija R1 nudi performanse na razini OpenAI-ovih najnovijih modela, a također je omogućila licencu za sve one koji žele razvijati chatbotove temeljene na ovoj tehnologiji, piše Yahoo Finance.


Pročitajte više: I Hrvati sve više koriste tehnologije umjetne inteligencije


Kako se DeepSeek R1 uspoređuje s OpenAI-om ili Meta AI?

Čini se da su troškovi treniranja i razvoja DeepSeekovih modela samo djelić onih potrebnih za najbolje proizvode OpenAI-a ili Meta Platforms Inc.-a. Mnogo bolja učinkovitost modela dovodi u pitanje potrebu za velikim kapitalnim izdacima za nabavu najnovijih i najmoćnijih AI akceleratora, poput onih koje proizvodi Nvidia Corp. To također pojačava pažnju na američke izvozno-ograničavajuće mjere za napredne poluvodiče u Kinu – koje su bile namijenjene sprječavanju proboja kakav DeepSeek izgleda predstavlja.

DeepSeek R1 gotovo je izjednačen s konkurentskim modelima ili bolji od njih u nekoliko vodećih benchmarkova, kao što su AIME 2024 za matematičke zadatke, MMLU za opće znanje i AlpacaEval 2.0 za performanse u pitanjima i odgovorima. Također se rangira među najbolje na ljestvici koja je vezana uz UC Berkeley i nosi naziv Chatbot Arena.

Foto:

POVEZANI ČLANCI

PROČITAJTE JOŠ:

Komentiraj

Unesite svoj komentar!
Ovdje unesite svoje ime

Pročitajte više

- Advertisment -