
Ajo që e bën DeepSeek të veçantë është se është, me sa duket, shumë më lirë. Ndërsa udhëheqësi i industrisë OpenAI raportohet të ketë shpenzuar më shumë se 100 milionë dollarë për zhvillimin e GPT-4, DeepSeek zhvilloi modelin e tij nga 6 milionë dollarë. Ky avantazh i kostos u arrit nga përdorimi i çipeve të lartë Nvidia A100 në kombinim me procesorë të tjerë relativisht më të lirë.
Ekspertët argumentojnë se kjo shifër është mashtruese, sepse nuk llogaritet për kostot më të gjera të kërkimit dhe zhvillimit, blerjen e të dhënave, shpenzimet e personelit, kostot e infrastrukturës dhe investimet harduerike.
Performanca dhe veçoritë
Ashtu si ChatGPT, DeepSeek punon duke dhënë përgjigje për pyetjet, dhe është i krahasueshëm me modelin o1 të OpenAI në matematikë dhe kodim. Është një model ‘arsyetimi’ që mendon dhe përgjigjet ashtu siç bëjnë qeniet njerëzore, duke e bërë atë veçanërisht të dobishëm për qëllime biznesi dhe shërbimi ndaj klientit.

Performance compared Source: Artificial Analysis Graphic: Jasmine Cui and Joe Murphy / NBC News
Sistemi është veçanërisht i mirë në demonstrimin e procesit të tij të arsyetimit në zgjidhjen e një problemi duke prishur procesin e tij të arsyetimit në hapa. Ajo gjithashtu, ashtu si një njeri që zgjidh një enigmë, mund të gjurmojë prapa në logjikën e saj dhe të korrigjojë hapat e mëparshëm nëse është e nevojshme.
Kjo qasje transparente u mundëson përdoruesve të dinë se si vjen deri te rekomandimet e saj.
DeepSeek ngre shqetësime etike
Rritja e DeepSeek në peisazhin e IA po ngre pyetje të rëndësishme rreth pasojave të teknologjisë së saj, veçanërisht duke pasur parasysh se ajo u trajnua në shtyllën kurrizore të harduerit të shtrenjtë që mund të jetë zhvilluar për të thyer kontrollet e eksportit të SHBA.
Ndërsa performanca e modelit të saj R1, i cili është në gjendje të replikojë funksionalitetin e o1 të OpenAI por me një fraksion të kostos, është mbresëlënëse, ajo zbulon gjithashtu mundësinë e praktikave të pamonitoruara ose joetike në zhvillimin e IA në pjesën tjetër të botës.
Kapaciteti i kompanisë për të inkorporuar me sukses çipet Nvidia A100, të cilat më parë ishin të kufizuara nga rregulloret amerikane, është një flamur i kuq mbi vërtetësinë e kompanisë dhe se si teknologji të tilla mund të përdoren për të përmbysur rendin ndërkombëtar.
Për më tepër, përputhja e përgjigjeve të DeepSeek ndaj ngjarjeve të ndjeshme historike ndaj censurës së qeverisë kineze është shqetësuese, pasi tregon se modeli mund të përdoret për të mbështetur narrativat e kontrolluara nga shteti, të cilat mund të kufizojnë dobinë dhe besueshmërinë e modelit në nivel global.
Kështu, ndërsa tregjet reagojnë ndaj këtij kërcënimi të perceptuar ndaj supremacisë teknologjike amerikane, implikimet më të gjera të strategjisë së DeepSeek, novatore por moralisht të shëndosha, duhet të analizohen plotësisht.