Dan prije Božića, kineski startup s nazivom DeepSeek svijetu je predstavio sustav umjetne inteligencije (AI) koji se pokazao sposobnim za odmjeravanje s ponajboljim Velikim jezičnim modelima (LLM) američkih prvaka poput OpenAI-a ili Googlea.
Tvrtka se u žarištu pažnje i rasprave našla ovog tjedna, nakon što je objavila istraživanje s detaljima o svojim tehnološkim probojima i podvizima koji pokazuju da se vrhunski AI može kreirati i trenirati uz djelić troškova i ulaganja uobičajenih u Sjedinjenim Državama.
Tim iza sustava DeepSeek-V3 navodi da je koristio majušni broj visokospecijaliziranih i moćnih čipova koje bivša i aktualna administracija SAD-a žele uskratiti svima, osim najbližim saveznicima.
New York Times podcrtava da su detalji o razvoju kineskog modela otvorili pitanja o neželjenim posljedicama trgovinskih ograničenja i činjenici da su kineski inženjeri postigli usporedive uspjehe i postignuća koristeći besplatni softver i lako dostupne alate.
Promjena paradigme
Prema istom izvoru i ponad priloženim testovima DeepSeek odgovara na pitanja, rješava logičke probleme i kreira računalni kod s jednakom vještinom i lakoćom kao bilo koji drugi AI sustav dostupan na tržištu, iako je za njegovo treniranje i razvoj trebalo samo šest milijuna dolara sirove računalne snage.
Za poredbu Meta je u razvoj svojeg aktualnog AI modela uložila oko 10 puta više novca.
Većina stručnjaka neposredno prepoznaje da je kineski proboj velebna promjena paradigme i ističe da je “do jučer” vrijedilo gledište da je razvoj umjetne inteligencije rezerviran za tržišne lidere spremne da u specijalizirane čipove ulože gargantuanske iznose.
“Broj tvrtki koje imaju šest milijuna dolara za potrošiti naširoko je veći nego broj kompanija koje na raspolaganju imaju 100 milijuna ili jednu milijardu dolara,” komentirao je Chris V. Nicholson, investitor iz tvrtke rizičnog kapitala Page One Ventures s fokusom na AI tehnologije.
Konkretno, američki prvaci za razvoj svojih modela koriste superračunala s do 16.000, izgledno i više čipova, dok su inženjeri DeepSeeka sustav trenirali s njih 2.000.
Ograničenja nametnuta Kini prisilila su tamošnje inženjere da “uvježbavaju učinkovitije kako bi još uvijek bili konkurentni,” rekao je za NYT Jeffrey Ding, docent na Sveučilištu George Washington specijaliziran za nove tehnologije i međunarodne odnose.
Dar čovječanstvu
Možda najzanimljivije i najznačajnije kineski je model uistinu otvorenog koda, što znači da svatko može unaprijediti njegovu srž ili ga koristiti u poslovne i istraživače svrhe.
S druge strane OpenAI je pregazio svoj “neprofitni” zavjet i statut te ušao u komercijalnu suradnju s Microsoftom kako bi monetizirao svoje modele, što je izazvalo prijepor i tužbu Elona Muska, jednog od njegovih djevičanskih investitora.
“Deepseek R1 jedan je od najnevjerojatnijih i najimpresivnijih proboja koje sam ikad vidio – i kao otvoreni kod, veliki dar svijetu,” napisao je u sukusu bivši softverski inženjer i poduzetnik, milijarder Marc Andreessen.
Povezane vijesti

Grabancijaš djeluje s integritetom, neovisnošću i slobodom od pristranosti.
Comment here
Morate biti prijavljeni da biste objavili komentar.