Хятадын DeepSeek лаборатори шинэ том хэлний загвар болох DeepSeek V4-ийн хоёр preview хувилбарыг танилцууллаа. Энэ нь өмнө нь зах зээлд ихээхэн анхаарал татсан V3.2 болон reasoning чиглэлийн R1 загварын дараах хүлээгдэж байсан шинэчлэл юм.
DeepSeek энэ удаа V4 Flash болон V4 Pro гэсэн хоёр хувилбар гаргасан байна. Хоёр загвар хоёулаа mixture-of-experts архитектур дээр бүтээгдсэн бөгөөд 1 сая хүртэлх токены контекст дэмждэг. Энэ нь том хэмжээний кодын сан, урт баримт бичигтэй ажиллах боломжийг нэмэгдүүлнэ. Ийм бүтэц нь нэг хүсэлт бүрт бүх параметрийг бус, зөвхөн тодорхой хэсгийг идэвхжүүлдэг тул тооцооллын зардлыг бууруулдаг.
V4 Pro нь 1.6 их наяд параметртэй бөгөөд үүнээс 49 тэрбум нь идэвхтэй ажилладаг. Ингэснээр уг загвар зах зээл дээрх хамгийн том open-weight модель болж байна. Тэрээр Moonshot AI-ийн Kimi K 2.6 загварын 1.1 их наяд параметр, MiniMax M1-ийн 456 тэрбум параметрээс давж, DeepSeek V3.2-ийн 671 тэрбум параметрээс хоёр дахинаас илүү том болжээ. Харин V4 Flash нь 284 тэрбум параметртэй бөгөөд 13 тэрбум нь идэвхтэй ажилладаг.
Компанийн мэдэгдсэнээр хоёр загвар хоёулаа өмнөх үеийнхээсээ илүү үр ашигтай, өндөр гүйцэтгэлтэй болсон. Мөн логик сэтгэлгээ шалгах тестүүдэд тэргүүлэх нээлттэй болон хаалттай загваруудтай ойртсон үзүүлэлт харуулж байгаа аж.
DeepSeek-ийн зүгээс V4-Pro-Max хувилбар нь reasoning benchmark тестүүдэд open-source өрсөлдөгчдөөсөө илүү гарч, зарим даалгаварт OpenAI GPT-5.2 болон Google Gemini 3.0 Pro-г давсан гэж мэдэгджээ. Харин програмчлалын даалгаварт V4 загваруудын гүйцэтгэл GPT-5.4-тэй ойролцоо түвшинд байна гэж тайлбарласан байна.
Гэсэн ч мэдлэгийн шалгалтын тестүүдэд DeepSeek V4 тэргүүлэх загваруудаас бага зэрэг хоцорч байгаа аж. Ялангуяа GPT-5.4 болон Gemini 3.1 Pro зэрэг шийдлүүдээс зарим үзүүлэлтээр доогуур байна. DeepSeek-ийн үнэлгээгээр энэ нь хамгийн сүүлийн үеийн загваруудаас ойролцоогоор 3–6 сарын хоцрогдолтой гэсэн үг юм.
V4-ийн хоёр хувилбар одоогоор зөвхөн тексттэй ажилладаг. Энэ нь аудио, видео, зураг боловсруулах чадвартай олон өрсөлдөгч загвараас ялгаатай тал болж байна.
DeepSeek V4-ийн нэг том давуу тал нь үнэ юм. V4 Flash нь 1 сая оролтын токенд 0.14 ам.доллар, 1 сая гаралтын токенд 0.28 ам.долларын үнэтэй. Энэ нь GPT-5.4 Nano, Gemini 3.1 Flash болон Claude Haiku 4.5-аас хямд байна. Харин V4 Pro нь 1 сая оролтын токенд 0.145 ам.доллар, 1 сая гаралтын токенд 3.48 ам.долларын үнэтэй бөгөөд Gemini 3.1 Pro, GPT-5.5 болон Claude Opus 4.7-оос хямд гэж мэдээлжээ.
Энэхүү танилцуулга нь АНУ-ын талаас Хятадыг прокси аккаунтууд ашиглан Америкийн AI лабораториудын оюуны өмчид нэвтрэхийг оролдсон гэх шүүмжлэл нэмэгдэж буй үед болж байна. Үүнээс өмнө Anthropic болон OpenAI мөн DeepSeek-ийг өөрсдийн загваруудыг дистилляци хийсэн гэж буруутгаж байсан юм.