Аудио, ярианы хиймэл оюун руу чиглэсэн стратегийн эргэлт
OpenAI аудио болон ярианы хиймэл оюун ухааны чиглэлээ огцом идэвхжүүлж, энэ салбар руу урт хугацааны бооцоо тавьж эхэлжээ. The Information-ийн мэдээлснээр тус компани дотроо байсан инженерчлэл, бүтээгдэхүүн, судалгааны хэд хэдэн багийг нэг цул бүтцэд нэгтгэн, ярианы хиймэл оюунд зориулагдсан тусгай “хувийн төхөөрөмж” гаргахаар ажиллаж байна. Эх сурвалжуудын хэлснээр уг төхөөрөмж ойролцоогоор нэг жилийн дараа зах зээл дээр гарах төлөвтэй байгаа аж.
Шинэ чиг баримтлал нь зөвхөн OpenAI-ийн дотоод стратеги бус технологийн салбарын өргөн хандлагыг ч илэрхийлж байна. Аудио ба ярианы хиймэл оюун ухаан нь хэрэглэгчийн харилцан үйлчлэлийн гол интерфэйс болж хувирч, уламжлалт дэлгэц, товчлуурт суурилсан загварыг орлуулах шатандаа оржээ.
Ярианы AI: Ухаалаг чанга яригчаас машин доторх чатбот хүртэл
АНУ-ын айл өрхүүдийн гуравны нэгээс илүү хэсэг нь аль хэдийн ухаалаг чанга яригч суурилуулсан байгаа нь дуу хоолойгоор удирдах хэрэглээ хэдийнэ өдөр тутмын хэв маяг болсон гэдгийг харуулж байна. Үүнтэй зэрэгцэн томоохон тоглогчид энэ чиглэлийг өөр өөр өнцгөөс түлхэж эхэлжээ.
Meta компани чимээ шуугиан ихтэй орчинд яриаг илүү сайн ойлгох зорилгоор Ray-Ban ухаалаг нүдний шилэндээ илүү ухаалаг микрофон, аудио систем нэгтгэж байгаа бол Google хайлтын үр дүнг дуут тойм байдлаар хүргэх туршилт хийж байна. Tesla компани ч цахилгаан машинаа дуут горимтой чатбот Grok-оор тоноглож, жолоодлогын үед дуу хоолойгоор хиймэл оюуны туслахтай харилцах боломжийг нээж байна.
Бүгд амжилттай байсан уу? Humane, Friend AI-гийн сургамж
Гэхдээ ярианы хиймэл оюунд суурилсан шинэ төрлийн төхөөрөмжүүдийн бүхэн зах зээлд амжилт олсонгүй. Humane компанийн AI Pin ухаалаг энгэрийн зүүлт нь хэрэглэгчдэд ойлгомжгүй концепц, өдөр тутмын хэрэгцээтэй сайн уялдаагүй загвараас болж бүтэлгүйдсэн гэж дүгнэгдэж байна. Friend AI зүүлт нь ч мөн адил нууцлалын асуудал дагуулж, хэрэглэгчид юу хийж чаддагийг нь бүрэн ойлгоогүй хэвээр үлдсэн.
Эдгээр туршилтууд бүтэлгүй ч гол мессеж өөрчлөгдөөгүй хэвээр байна: ярианы хиймэл оюун ухаан бол ирээдүйн гол интерфэйс байж болзошгүй.
OpenAI-ийн шинэ загвар: илүү “амьд” сонсогдох ярианы тархи
Эх сурвалжуудын мэдээлж буйгаар, OpenAI-ийн шинэ аудио загвар нь одоогийн түгээмэл хиймэл оюуны системүүдээс илүү байгалийн, “амьд” сонсогдохоор хийгдэж байна. Шинэ хувилбар нь:
- хүн шиг зөв цагт түр завсар авч,
- хэрэглэгчийн яриаг дундаас нь таслахгүй,
- сонсох ба хариулах үйлдлээ бодит ярианы урсгалд дөхүүлэн тааруулах чадвартай байхыг зорьж байгаа аж.
Ийм төрлийн нарийн ярианы зан төлөв одоогийн олон загварт бүрэн хэмжээнд байхгүй байгаа нь OpenAI-д ялгарах боломж олгож байгаа хэрэг.
Дэлгэцгүй, “хамтрагч” төрлийн ухаалаг төхөөрөмжүүдийн гэр бүл
Мэдээллээр бол OpenAI-ийн гол зорилго нь улам олон функцтэй, төвөгтэй гаджетаас илүү “бага төмөр, их хиймэл оюун” гэсэн философийг баримтлах явдал. Өөрөөр хэлбэл:
- дэлгэцгүй боловч байнга хамт байх ухаалаг чанга яригч,
- эсвэл хиймэл оюуны хамтрагч шиг ажиллах ухаалаг нүдний шил зэрэг хувийн төхөөрөмжүүдийн цогц экосистемийг бий болгохоор төлөвлөжээ.
Ингэснээр хэрэглэгч дэлгэц рүү ширтэхийн оронд шууд ярьж, асууж, хариу авах, хиймэл оюуныг жинхэнэ “хамтрагч” хэлбэрээр ашиглах боломжтой болохыг зорьж байна.