Үнэ, зориулалт: олон хүсэлттэй урсгалд зориулагдсан “эдийн засгийн” хувилбар
Google хиймэл оюуны шинэ загвар Gemini 3.1 Flash-Lite-ыг танилцуулж, Gemini 3-р үеийн цуврал дотроо үнэ хамгийн боломжийн шийдэл гэж тодорхойлов. Энэ загвар нь асуулт боловсруулах хурд, өртөг багатай ажиллагаанд чиглэсэн тул хөгжүүлэгчдийн их хэмжээний, давтамж өндөртэй ажлуудад тохиромжтой гэж тайлбарлаж байна.
Моделийн үнэ:
- 1 сая оролтын токен: 0.25 ам.доллар
- 1 сая гаралтын токен: 1.50 ам.доллар
Google-ийн мэдээлснээр Flash-Lite нь асуултын тоо их, саатал бага шаарддаг хэрэглээнд чиглэнэ. Жишээлбэл, их өгөгдлийг хурдан боловсруулах автоматжуулсан процессууд, урсгалын шинжтэй системүүдэд ашиглахыг онцолжээ.
Гүйцэтгэлийн үзүүлэлтүүд: эхний токен хүртэлх хугацаа, генерацийн хурд
Artificial Analysis платформын тестийн дүнгээр Gemini 3.1 Flash-Lite нь Gemini 2.5 Flash-тай харьцуулахад Time to First Answer Token үзүүлэлтээр ойролцоогоор 2.5 дахин хурдан гарсан байна. Мөн хариулт үүсгэх хурд 45%-иар өссөн бөгөөд чанарын түвшин нь өмнөхтэй ойролцоо эсвэл зарим тохиолдолд илүү гэж дурджээ.
Рейтинг, бенчмарк: Elo 1432, GPQA Diamond ба MMMU Pro
Arena.ai Leaderboard дээр тус модель Elo 1432 оноо авсан байна. Мөн туршилтын үзүүлэлтүүдээр:
- GPQA Diamond: 86.9%
- MMMU Pro: 76.8%
гэсэн үр дүн үзүүлж, өөрийн ангиллын зарим загваруудаас гадна өмнөх үеийн зарим том шийдлүүдийг ч давсан гэж мэдээлэв.
Хэрэглээний хүрээ ба хүртээмж
Google Flash-Lite-ыг олон төрлийн даалгаварт ашиглах хэрэгсэл гэж байршуулж байна. Үүнд:
- их хэмжээгээр орчуулга хийх
- контент модерацлах
- өгөгдөл ангилалт хийх
- том хэмжээний кодын сан шинжлэх
- өргөн хүрээний мультимодаль ажиллагаа гүйцэтгэх
Gemini 3.1 Flash-Lite нь одоогоор урьдчилсан хандалтын горимоор Gemini API-гаар Google AI Studio орчинд, мөн байгууллагын хэрэглэгчдэд Vertex AI платформоор дамжин ашиглах боломжтой гэж мэдээлжээ.
