DeepSeek, AI startup star tek nešto stariji od godinu dana, izazvao je oduševljenje i zabrinutost u Silicijskoj dolini svojim revolucionarnim modelom umjetničke inteligencije koji nudi usporedive rezultate s najboljim chatbotovima na svijetu, a sve to po cijeni koja je, čini se, samo djelić onoga što su drugi modeli zahtijevali. Stvoren u kineskom Hangzhou, DeepSeek ima dalekosežne implikacije za globalnu tehnološku industriju i opskrbne lance te nudi kontrapunkt široko rasprostranjenom uvjerenju da će budućnost AI-ja zahtijevati sve veće količine energije i snage za razvoj.
Što je DeepSeek?
DeepSeek je kineski startup koji je osnovao Liang Wenfeng, čelnik kvantnog hedge fonda temeljenog na AI-u, High-Flyer, 2023. godine. Kompanija razvija open-source AI modele, a njezina istoimena mobilna aplikacija dospjela je na vrh ljestvice preuzimanja na iPhoneu u SAD-u nakon lansiranja početkom siječnja.
Aplikacija DeepSeek razlikuje se od drugih chatbotova poput OpenAI-ovog ChatGPT-a po tome što iznosi svoje razmišljanje prije nego što pruži odgovor na zadani upit. Kompanija tvrdi da njezina verzija R1 nudi performanse na razini OpenAI-ovih najnovijih modela, a također je omogućila licencu za sve one koji žele razvijati chatbotove temeljene na ovoj tehnologiji, piše Yahoo Finance.
Pročitajte više: I Hrvati sve više koriste tehnologije umjetne inteligencije
Kako se DeepSeek R1 uspoređuje s OpenAI-om ili Meta AI?
Čini se da su troškovi treniranja i razvoja DeepSeekovih modela samo djelić onih potrebnih za najbolje proizvode OpenAI-a ili Meta Platforms Inc.-a. Mnogo bolja učinkovitost modela dovodi u pitanje potrebu za velikim kapitalnim izdacima za nabavu najnovijih i najmoćnijih AI akceleratora, poput onih koje proizvodi Nvidia Corp. To također pojačava pažnju na američke izvozno-ograničavajuće mjere za napredne poluvodiče u Kinu – koje su bile namijenjene sprječavanju proboja kakav DeepSeek izgleda predstavlja.
DeepSeek R1 gotovo je izjednačen s konkurentskim modelima ili bolji od njih u nekoliko vodećih benchmarkova, kao što su AIME 2024 za matematičke zadatke, MMLU za opće znanje i AlpacaEval 2.0 za performanse u pitanjima i odgovorima. Također se rangira među najbolje na ljestvici koja je vezana uz UC Berkeley i nosi naziv Chatbot Arena.
Foto: