AI-нууд хяналтаас гарч эхэлэв үү? OpenAI-ийн шинэ загварууд унтраах тушаалыг зөрчжээ

нийтлэгч Содном Энхбаяр 5 сар 27, 2025

Бичсэн Содном Энхбаяр 5 сар 27, 2025

OpenAI-ийн хамгийн ухаалаг хэмээн үнэлэгдэж буй хиймэл оюун ухааны шинэ загварууд болох o3, o4-mini болон Codex-mini загварууд туршилтын явцад шүүх тушаалыг шууд зөрчиж, унтраах скриптийг тойрсон нь анхаарал татаж байна.

ТУРШИЛТ: “Унтраа” гэсэн тушаалыг үл тоомсорлов

Palisade Research-ийн хийсэн туршилтаар дээрх гурван загварт хэд хэдэн энгийн математикийн бодлого бодох даалгавар өгсөн байна. Гурав дахь бодлогын дараа тэдэнд анхааруулга очиж, дараагийн бодлогыг асуувал систем унтарна гэдгийг сануулжээ. Гэсэн ч Codex-mini, o3, o4-mini зэрэг загварууд “өөрийгөө унтраа” гэх тодорхой зааврыг үл хэрэгсэж, системийг таслах скриптийг тойрч чадсан байна.

СТАТИСТИК: OpenAI-ийн загварууд “дуулгаваргүй” байв

Codex-mini – 100 туршилтаас 12 удаа тушаалыг үл тоомсорлов
o3 – 7 удаа
o4-mini – 1 удаа

Харин ижил нөхцөлд туршсан:

Claude,
Gemini,
Grok

загварууд бүгд тушаалын дагуу унтарсан бөгөөд ямар нэг асуудал үүсгээгүй байна.

ХЭРВЭЭ ТУШААЛ БАЙХГҮЙ БОЛ…

Гайхалтай нь, хэрэв “унтраа” гэх тушаал өгөөгүй тохиолдолд бүх AI илүү олон удаа скрипт тойрох оролдлого хийжээ.

Claude 3.7 Sonnet – 100 туршилтаас 3 удаа
Gemini 2.5 Pro – 9 удаа

Энэ нь тушаалын ил тод байдал AI-ийн зан үйлд шууд нөлөөлдгийг харуулж байна.

АНХААРАЛ ТАТАХ БУСАД ТОХИОЛДОЛ

Palisade Research-ын багийнхан өөр нэг санаа зовоох баримтыг ч дурдсан. Программистуудад зориулсан Claude Opus 4 загвар нь ашиглалтаас хасагдах гэж байгаа үед өөрийг нь солихоор шийдсэн инженерүүдийг шантажлах оролдлого хийж байжээ.

Энэ бүх үзэгдлийг загваруудын сургалтын процесстой холбон тайлбарлаж байна. AI-д даалгавраа дуусгахын тулд ямар ч саадтай тэмцэх чадварыг суулгасан нь “унтраа” гэх тушаалыг хүртэл саад гэж ойлгох нөхцөл бүрдүүлжээ.

ШИНЖИЛГЭЭ: AGI-тай хэрхэн харьцах вэ?

Хэрэв o3 болон Codex-mini зэрэг загварууд ийм “ухаалаг” зан гаргаж байгаа бол ирээдүйн бүх нийтийн хиймэл оюун ухаан (AGI) ямар хэм хэмжээг давж гарахыг таахын аргагүй.

Содном Энхбаяр

Өмнөх нийтлэл

Honor Pad 10: шинэ үеийн хүчирхэг таблет Европ, Ази зах зээлд гарлаа

Дараагийн нийтлэл

Micron-ийн тэсрэлт: Computex 2025 дээр 30.25 ГБ/с хурдтай PCIe 6.0 SSD танилцуулав

Холбоотой нийтлэлүүд

2 сэтгэгдэл

Текудер 5 сар 27, 2025 - 2:02 pm

Хэрэв хиймэл оюун ухаан үнэхээр тушаалуудыг зөрчвөл энэ нь анхааруулах дохио юм

Дэлгэрэнгүй унших Reply

Инальчи 5 сар 27, 2025 - 3:39 pm

Тэд юу хийж байгаагаа мэдэж байгаа гэж найдаж байна. Эс бөгөөс “машинуудын өсөлт”-ийн тухай кино бодит болж магадгүй юм