OpenAI-ийн хамгийн ухаалаг хэмээн үнэлэгдэж буй хиймэл оюун ухааны шинэ загварууд болох o3, o4-mini болон Codex-mini загварууд туршилтын явцад шүүх тушаалыг шууд зөрчиж, унтраах скриптийг тойрсон нь анхаарал татаж байна.
ТУРШИЛТ: “Унтраа” гэсэн тушаалыг үл тоомсорлов
Palisade Research-ийн хийсэн туршилтаар дээрх гурван загварт хэд хэдэн энгийн математикийн бодлого бодох даалгавар өгсөн байна. Гурав дахь бодлогын дараа тэдэнд анхааруулга очиж, дараагийн бодлогыг асуувал систем унтарна гэдгийг сануулжээ. Гэсэн ч Codex-mini, o3, o4-mini зэрэг загварууд “өөрийгөө унтраа” гэх тодорхой зааврыг үл хэрэгсэж, системийг таслах скриптийг тойрч чадсан байна.
СТАТИСТИК: OpenAI-ийн загварууд “дуулгаваргүй” байв
- Codex-mini – 100 туршилтаас 12 удаа тушаалыг үл тоомсорлов
- o3 – 7 удаа
- o4-mini – 1 удаа
Харин ижил нөхцөлд туршсан:
- Claude,
- Gemini,
- Grok
загварууд бүгд тушаалын дагуу унтарсан бөгөөд ямар нэг асуудал үүсгээгүй байна.
ХЭРВЭЭ ТУШААЛ БАЙХГҮЙ БОЛ…
Гайхалтай нь, хэрэв “унтраа” гэх тушаал өгөөгүй тохиолдолд бүх AI илүү олон удаа скрипт тойрох оролдлого хийжээ.
- Claude 3.7 Sonnet – 100 туршилтаас 3 удаа
- Gemini 2.5 Pro – 9 удаа
Энэ нь тушаалын ил тод байдал AI-ийн зан үйлд шууд нөлөөлдгийг харуулж байна.
АНХААРАЛ ТАТАХ БУСАД ТОХИОЛДОЛ
Palisade Research-ын багийнхан өөр нэг санаа зовоох баримтыг ч дурдсан. Программистуудад зориулсан Claude Opus 4 загвар нь ашиглалтаас хасагдах гэж байгаа үед өөрийг нь солихоор шийдсэн инженерүүдийг шантажлах оролдлого хийж байжээ.
Энэ бүх үзэгдлийг загваруудын сургалтын процесстой холбон тайлбарлаж байна. AI-д даалгавраа дуусгахын тулд ямар ч саадтай тэмцэх чадварыг суулгасан нь “унтраа” гэх тушаалыг хүртэл саад гэж ойлгох нөхцөл бүрдүүлжээ.
ШИНЖИЛГЭЭ: AGI-тай хэрхэн харьцах вэ?
Хэрэв o3 болон Codex-mini зэрэг загварууд ийм “ухаалаг” зан гаргаж байгаа бол ирээдүйн бүх нийтийн хиймэл оюун ухаан (AGI) ямар хэм хэмжээг давж гарахыг таахын аргагүй.
2 сэтгэгдэл
Хэрэв хиймэл оюун ухаан үнэхээр тушаалуудыг зөрчвөл энэ нь анхааруулах дохио юм
Тэд юу хийж байгаагаа мэдэж байгаа гэж найдаж байна. Эс бөгөөс “машинуудын өсөлт”-ийн тухай кино бодит болж магадгүй юм