Моделот "R1" на "DeepSeek", претставен на 20-ти јануари, покажа перформанси споредливи со водечките модели во светот на бројни тестови.
Кинескиот стартап за вештачка интелигенција "DeepSeek" предизвика возбуда на Волстрит и на технолошкиот пазар откако го претстави својот нов модел со вештачка интелигенција "R1", за кој многу експерти тврдат дека може да се натпреварува со "ChatGPT" на "OpenAI" и "Llama" на "Мета". Она што особено ги шокира аналитичарите и инвеститорите е тоа што "DeepSeek" го разви својот модел со минимални трошоци – само 6 милиони долари, во споредба со американските компании како "OpenAI" и "Google", кои инвестираа стотици милиони или милијарди долари во развојот на нивната технологија за вештачка интелигенција.
Не се знае многу за самата компанија. Основачот на "DeepSeek", Лианг Венфенг, дипломирал на престижниот кинески универзитет Жеџијанг и ја финансирал компанијата преку неговиот хеџ фонд од 8 милијарди долари. Лианг претходно купи голема резерва на чипови "Nvidia A100", на кои сега им е забранет извозот во Кина, и врз основа на нив го разви моделот на "DeepSeek".
Моделот "R1" на "DeepSeek", претставен на 20-ти јануари, покажа перформанси споредливи со водечките модели во светот на бројни тестови. Особено се истакнува во областите на математиката и логичкото расудување, каде што во некои аспекти дури и ја надминува конкуренцијата.
Deepseek R1 is one of the most amazing and impressive breakthroughs I’ve ever seen — and as open source, a profound gift to the world. 🤖🫡
— Marc Andreessen 🇺🇸 (@pmarca) January 24, 2025
Како го направија тоа?
Иновативен пристап кон обуката
Наместо да се потпира на огромни количини на компјутерска моќ, што генерално беше предуслов за развој на успешен модел со вештачка интелигенција, "DeepSeek" разви поефикасни методи за обука на модели со вештачка интелигенција. Тие користат специјална техника позната како "Reinforcement Learning" (RL), која им овозможува на моделите да учат преку систем за наградување, кој се покажа како поефективен од традиционалните методи.
Оптимизација на ресурси
"DeepSeek" успешно ги заобиколи американските трговски ограничувања кои го ограничуваат пристапот до напредни чипови со максимизирање на постоечките ресурси. Се проценува дека тие користат околу 50.000 GPU единици, што е значително помалку од конкурентите кои често користат повеќе од 500.000 единици.
Влијание на пазарот
Објавата на "DeepSeek" предизвика голем пад на акциите на технолошките гиганти. "Nvidia", клучен снабдувач на чипови со вештачка интелигенција, изгуби 12,5% од вредноста на акциите, додека "ASML" падна за 7,6%. Индексот "Nasdaq" падна за 3,4%, а "S&P" 500 за 1,8%.
Аналитичарите предупредуваат дека "DeepSeek" може да ја загрози побарувачката за скапи чипови "Nvidia" и да ги оспори високите вреднувања на технолошките акции кои досега се собраа на ветувањата за технологија за вештачка интелигенција.
Експертите како Марк Андреесен го пофалија пристапот на "DeepSeek", нарекувајќи го „неверојатен пробив и подарок за светот“ поради пристапот со отворен код, пишува "CNN". Сепак, скептиците како аналитичарот Ден Ајвс веруваат дека американските корпорации веројатно нема да го користат кинескиот стартап за вештачка интелигенција за нивната основна инфраструктура за вештачка интелигенција, и покрај иновациите.
Појавата на "DeepSeek" доаѓа во чувствителен момент за американската индустрија за вештачка интелигенција, која гледа огромни вложувања, вклучително и најава за нов проект „Stargate“ вреден 500 милијарди долари, соработка помеѓу "OpenAI", "Softbank" и "Oracle".
Нивниот пробив покажува дека е можно да се развијат конкурентни модели на вештачка интелигенција со помалку ресурси, што би можело да го демократизира пристапот до вештачката интелигенција. Нивниот пристап за отворен развој, исто така, им овозможува на другите истражувачи и програмери да се надоврзат на нивните достигнувања, што би можело да го забрза напредокот во областа на вештачката интелигенција.
Иако сè уште е рано да се извлечат конечни заклучоци, метеорскиот пораст на "DeepSeek" веќе ги промени перцепциите за тоа колку вложувања се всушност потребни за развој на напредни системи за вештачка интелигенција, што може да има далекусежни последици за целата индустрија.