Офлайн горимд дуу хоолойг текст болгон хувиргах шинэ апп iPhone хэрэглэгчдэд хүрч эхэллээ
Google компани интернэт холболтгүй үед ч текст диктовк хийх боломжтой шинэ аппликэйшнээ танилцууллаа. Google AI Edge Eloquent нэртэй энэ шийдэл нь төхөөрөмж дээр шууд ажиллах Gemma загваруудыг ашигладаг бөгөөд илүү төвөгтэй даалгаварт шаардлагатай үед Gemini-ийн илүү хүчирхэг үүлэн загвар руу шилжих боломжтой юм. Тус апп одоогоор iOS дээр татаж авах боломжтой болж, яриаг текст болгон хувиргах үйл явцыг илүү байгаллаг, илүү нарийвчлалтай болгохыг зорьж байна.
Eloquent-ийг ярианы хэв маягийг илүү цэгцтэй, мэргэжлийн бичгийн хэлбэрт ойртуулах зорилгоор тусгайлан боловсруулжээ. Систем нь “аа”, “ээ”, “мм” гэх мэт дундын үгсийг автоматаар арилгаж, ярианы явц дахь завсрын засвар, тасалдлаас үүсдэг алдаануудыг ч цэвэрлэдэг байна.
Хэрэглэгч өөрөө офлайн эсвэл үүлэн горимоо сонгох боломжтой
Энэ аппын гол давуу тал нь офлайн горимд ажиллах чадвар юм. Ингэснээр хэрэглэгчийн мэдээлэл төхөөрөмжөөс гадагш гарахгүй, нууцлал илүү сайн хамгаалагдахаас гадна дуу хоолой боловсруулах хурд ч өндөр байна. Өөрөөр хэлбэл яриаг төхөөрөмж дээр шууд боловсруулдаг учраас хариу үйлдэл илүү хурдан байх боломжтой.
Гэхдээ текстээ илүү нарийн засварлуулахыг хүссэн хэрэглэгчид үүлэн горимыг сонгож болно. Энэ үед аудио өгөгдөл Gemini загварууд руу илгээгдэж, урт, нийлмэл өгүүлбэрүүдийг илүү оновчтой найруулж боловсруулах боломжтой аж.
Eloquent нь энгийн диктовкоос илүү өргөн боломж санал болгож байна
Google AI Edge Eloquent нь зөвхөн яриаг текст болгохоор хязгаарлагдахгүй. Хэрэглэгчид транскриптаас гол санаануудыг ялгаж авах, текстийн өнгө аясыг албан ёсны, товч, эсвэл дэлгэрэнгүй хэлбэрт өөрчлөх боломжтой байна.
Үүнээс гадна диктовкийн хурдыг үг минутын үзүүлэлтээр шалгах, нийт үгийн тоог харах, тусгай нэр томьёо нэмэх, мөн Gmail-ээс түлхүүр үг импортлох зэрэг нэмэлт хэрэгслүүдийг багтаажээ. Ингэснээр уг апп нь зөвхөн энгийн хэрэглэгчдэд бус, мэргэжлийн түвшинд текст боловсруулдаг хүмүүст ч илүү хэрэгцээтэй шийдэл болж байна.
Google Gemma загваруудын хүрээг AI Edge Gallery-аар улам тэлж байна
Google Eloquent-оос гадна AI Edge Gallery нэртэй өөр нэг апп санал болгож байгаа юм. Энэ апп нь Gemma загварын гэр бүлийг, тэр дундаа хамгийн сүүлийн Gemma 3n болон Gemma 4 хувилбаруудыг төхөөрөмж дээр шууд ажиллуулах боломж олгодог байна.
AI Edge Gallery нь загвар хэрхэн ажиллаж байгааг алхам алхмаар харуулдаг бөгөөд prompt туршилтын лаборатори, мөн тухайн төхөөрөмж дээр янз бүрийн загваруудын гүйцэтгэлийг шалгах хэрэгслүүдийг агуулжээ.
Шинэ Gemma 4 загварууд нь E2B, E4B зэрэг гар утсанд тохирсон хэмжээтэй хувилбаруудаас гадна 26B, 31B хэмжээтэй илүү том десктоп загваруудыг дэмждэг байна. Эдгээр нь гар утсан дээр 128 мянган токен, илүү том хувилбарууд дээр 256 мянган токен хүртэлх контексттэй ажиллах боломжтой болсон нь урт, төвөгтэй текстийг илүү сайн ойлгох нөхцөл бүрдүүлж байгаа юм.
Google AI Edge Eloquent нь нууцлал, хурд, ухаалаг боловсруулалтыг нэг дор авчирлаа
Google AI Edge Eloquent нь дуу хоолой боловсруулалт, диктовкийн салбарт хийсэн томоохон алхам гэж үнэлэгдэж байна. Энэ шийдэл нь хурд, хувийн мэдээллийн хамгаалалт, өндөр түвшний хиймэл оюуны боловсруулалтыг нэгтгэн, бүхнийг хэрэглэгчийн төхөөрөмж дээр шууд хийх боломж олгож байгаагаараа онцлог юм.
Ийнхүү Google интернэтгүй орчинд ч үр дүнтэй ажиллах хиймэл оюуны хэрэгслүүдээ өргөжүүлж, өдөр тутмын хэрэглээний төхөөрөмжүүдийг илүү ухаалаг, илүү бие даасан болгох шинэ чиглэлийг тодруулж байна.