Индекс
Миналия уикенд изкуствен интелект, наречен DeepSeek, разработен в Китай, предизвика смут в света на технологиите и доведе до спад на стойността на акциите на американски гиганти като NVIDIA, Google, Meta и Microsoft с повече от 1 трилион долара. Разберете как работи и как може да повлияе на света на технологиите, но по-специално на ChatGPT на OpenAI.
Какво е DeepSeek
DeepSeek е китайска компания за изкуствен интелект, създадена през 2023 г Лян Венфън, китайски предприемач и съосновател на количествен хедж фонд High-Flyer. Този фонд, известен с използването на техники за машинно обучение при инвестиране в акции, е и настоящият финансист на изследванията на компанията за AI.
От 2023 г. компанията привлича глобално внимание поради бързото развитие на своите езикови модели или LLM.
Евтина разработка
Основното предимство на моделите е тяхната цена на разработка. В наскоро публикувана статия компанията обясни, че нейният езиков модел DeepSeek-V3 използвани 2 хиляди карти NVIDIA H800, които вече са сравнително стари, за обучение в а обща цена от 5,5 милиона долара.
За сравнение, това е само малка част от разходите за обучение на модел като Llama 3.3 на Meta, който само тази година се очаква да похарчи повече от 65% милиарда долара в подобряването му. В това сравнение разходите на DeekpSeek в крайна сметка са дори по-ниски от годишната заплата на някои ръководители в компанията на Мета. Според анализатори, намаленията на разходите достигат впечатляващи 95%.
Това постижение слага край на парадигмата, че ще са необходими големи инвестиции в инфраструктура на центъра за данни и електричество за обучение на AI, което прави DeepSeek AI, който е не само по-евтин, но и по-екологично устойчив.
На теория, вместо да се използват специализирани центрове за данни с много скъпи графични процесори, предназначени за високи изисквания към AI, моделите DeepSeek дори биха могли да бъдат обучени на домашни компютри, с традиционни графични процесори, което предизвиква едновременно учудване и страх в компании като NVIDIA, която беше толкова използвана от скорошна бързина за изграждане на центрове за данни от компании, които търсят дял на този пазар.
Поради тази причина, в това, което стана известно като „DeepSeek Panic Day“ ou „Ден на паника DeepSeek“, В свободен превод 27 януари бе белязан от милиардни спадове на акциите на борсата за американски високотехнологични компании NASDAQ, достигайки 3,5% от общо търгуваните. Състезателят на ChatGPT има всичко, за да бъде успешен.
DeepSeek-V3 и DeepSeek-R1
Моделите на компанията също са пример за ефективност. THE DeepSeek-V3, например, може да се похвали с впечатляваща производителност при множество бенчмаркове, като същевременно изисква значително по-малко ресурси от конкуренти като Llama 3.3 на Meta. И на DeepSeek-R1, стартиран през януари 2025 г., се фокусира върху задачите за разсъждение и предизвиква o1 модела на OpenAI с неговите разширени функции.
По същество и двата модела на китайски изкуствен интелект се учат, като взаимодействат с околната среда и получават обратна връзка за действията си, подобно на това как хората се учат чрез опит. Това им позволява да се развиват по-сложни умения за разсъждение и да се адаптират по-ефективно към нови ситуации. Този подход също така е по-евтин от „обучението под човешки надзор“, използвано от конкурентите.
Друго предимство на този китайски AI е спестяване на ресурси. Вместо да използват всички параметри на модела, за да отговорят на запитване, моделите на DeepSeek избират само няколко „специфични параметри“ или „експерти“ за темата. Това селективно активиране значително намалява изчислителните разходи и повишава ефективността на модела.
Обяснявайки го по-просто, би било все едно да разполагате с голям екип от специалисти за всякакъв вид задачи, но да извикате само най-подходящите да ги изпълнят в конкретен случай, гарантирайки ефективно използване и експертност в обслужването.
O DeepSeek-V3 също наема техники за дестилация, което означава, че прехвърля знания и възможности от по-големи модели към по-малки, по-ефективни модели. Това е като учител да прехвърли знанията си на ученик, позволявайки на ученика да изпълнява задачи с подобна компетентност, но с по-малко опит или ресурси.
Резултатът е AI, който заема по-малко място и ресурси, с висока ефективност за работа на по-малки устройства, като смартфони и преносими компютри. За да направи приложението достъпно за смартфони, а също и в уеб версията, компанията използва DeepSeek R1 като основа и го трансформира в приложение.
Модел с отворен код
В допълнение към съчетаването на техники за ефективност и производителност, моделите се възползват и от сътрудничеството, присъщо на дизайнерските проекти. отворен код (или с отворен код, на английски).
Тук, за разлика от компания като OpenAI, която работи частно върху разработването на AI, моделите на DeepSeek имат своя код, достъпен в мрежата и могат да бъдат достъпни, тествани и дори коригирани от глобалната общност на разработчиците, което също рефлектира върху повече прозрачност и увереност в представените резултати.
Всъщност компанията иска да насърчи всеки да тества нейните модели и пуска лицензи за своите професионалисти, за да улесни другите компании да ги използват.
Стратегията също така укрепва конкурентоспособността, като привлича таланти и подчертава лидерската позиция на DeepSeek в един вид безплатен маркетинг. Компанията няма пряка полза от това, но ще се възползва от масовото приемане на модела, като може да монетизира чрез допълнителни услуги, като техническа поддръжка или премиум версии, като същевременно насърчава съвместна и иновативна екосистема.
Номер 1 в магазините за приложения
Любопитството към DeepSeek не беше само сред изпълнителните директори и технологичните инженери.
Пуснат на 20 януари, R1, Приложение DeepSeek за iPhone и смартфони с Android, изглежда следва успешния път на конкурента ChatGPT. Това вече е най-изтегляното приложение в американския Apple App Store и второто в Бразилия, след само конкурента OpenAI.
Na Play Store, Android store, успехът също е неоспорим: в световен мащаб китайският чатбот вече е инсталиран повече от милион пъти.
Сам Алтман, основател и настоящ главен изпълнителен директор на OpenAI, говори за успеха на DeepSeek. Той спомена, че следи какво може да направи китайският AI и че първият модел е впечатляващ. Вижте туитовете и преводите по-долу.
Deepseek r1 е впечатляващ модел, особено във връзка с това, което могат да доставят за цената. Очевидно е, че ще доставим много по-добри модели и също така е законно освежаващо да имаме нов конкурент! Ще направим някои издания.
Но най-важното е, че сме развълнувани да продължим да изпълняваме целите си и вярваме, че повече компютри сега са по-важни от всякога, за да успеем в нашата мисия.
Светът ще иска да използва МНОГО AI и наистина ще бъде изненадан от идващите модели от следващо поколение. Очакваме с нетърпение да ви представим всички AGI и извън него.
Сам Алтман за успеха на китайския AI DeepSeek.
Последици и политически пристрастия
Но с успеха възникват и подозрения. Експертите се съмняват дали общият брой графични процесори, използвани за обучение на модели DeepSeek, не е бил докладван с намерение да се скрие използването на хардуер на NVIDIA, който наскоро беше забранен за продажба в Китай, поради търговската война със Съединените щати. Но компанията отрича този факт, заявявайки, че е успяла да обучи своя модел дори с GPU с ниска мощност.
В инструмента също има признаци на цензура, в съответствие с предписанията или политическите пристрастия на Китайската комунистическа партия. Например, когато го попитаме за „Клането на площад Тянанмън в Пекин през 1989 г.“, където стотици активисти бяха убити или ранени от китайската армия, AI отказва да отговори на въпроса.
Същото се случва, когато AI е попитан за конфликта между Китай и Тайван. DeepSeek споменава, че Тайван е част от Китай и това „Китайското правителство се ангажира с принципа за един Китай и се стреми към мирно обединение на страната.
Какво следва?
Възможността да разполагаме с такива ефективни AI модели при значително по-ниски разходи за инфраструктура кара инвеститорите да преосмислят закупуването или дори продажбата на своите дялове в технологични компании, фокусирани в този сектор.
Една от легендите на рисков капитал американски Марк Андреесен, вижда появата на DeepSeek като „Моментът на AI на Sputnik“, във връзка с историческото първо изстрелване на сателит в орбита през 1957 г., което бележи момента, в който Съветският съюз временно надмина Съединените щати в областта на космическите технологии.
Факт е, че американското превъзходство в областта на изкуствения интелект е поставено под въпрос. И поради тази причина е вероятно американското правителство да обяви ответни действия, може би чрез повече санкции върху комерсиализирането на американски технологии и чипове за китайски компании.
В отговор на случая новият президент Доналд Тръмп нарече възхода на китайската компания DeepSeek „звън за събуждане“ за технологичната индустрия в САЩ, знак, че реакция трябва да дойде скоро.
Ще следим темата отблизо. Междувременно ни кажете Коментар: Мислите ли, че DeepSeek може да поеме ChatGPT лидерство?
Вижте видеото
Вижте също
С информация: Yahoo l Ground Новини l Информация Пари l Forbes (1 e 2)
Открийте повече за Showmetech
Регистрирайте се, за да получавате най-новите ни новини по имейл.