Agent гэдэг үгийг сүүлд хаа сайгүй сонсож байгаа. Хүмүүс LLM-тэй холилдуулж ойлгох нь элбэг. ChatGPT-д юм бичүүлж, код зохиолгож, зөвлөгөө авч байгаа шүү дээ — agent ч тийм юм биз дээ гэж.

Үгүй. Огт өөр зүйл.

LLM-д tool залгаад тэрийг agent гэж дуудаад байвал буруу ойлголттой байна гэсэн үг. Agent бол бүхэлдээ өөр түвшний abstraction — өөрийн зорилгыг бие даан хөөж чадах систем. Асуулт бүрт тусад нь хариулдаг юм биш, контекстоо хадгалж, урагшаа төлөвлөж, зорилгодоо хүрэхийн тулд санаачлага гаргадаг.


Google-ийн agent whitepaper юу гэж хэлдэг вэ?

"Generative AI agent гэдэг нь зорилгодоо хүрэхийн тулд ертөнцийг ажиглаж, өөрт байгаа хэрэгслүүдийг ашиглан үйлдэл хийдэг програм юм. Агентууд бие даасан бөгөөд хүний оролцоогүйгээр ажиллах чадвартай — ялангуяа тодорхой зорилго, даалгавар өгөгдсөн тохиолдолд. Агентууд зорилгодоо хүрэхийн тулд идэвхтэй хандлага баримталж чадна."

— Google Agent Whitepaper

LLM ба tool-ийг хослуулсан бүх зүйл agent биш. Энэ тодорхойлолтыг задалбал жинхэнэ agent-д таван гол чадвар байх ёстой.


Жинхэнэ agent-ыг жинхэнэ agent болгодог зүйлс
AI Agent-ын таван гол чадварын зураглал
Agent-ын таван гол чадвар — бүгд хамтдаа ажилласнаар жинхэнэ agent болдог
1

Зорилгод чиглэсэн байх

Агент асуултад хариулахаар биш зорилго руу ажиллахаар бүтээгдсэн. Одоогийн байдал ба хүссэн байдлын зөрүүг мэдэрч, түүнийг арилгахын тулд алхам хийнэ.

2

Бие даасан ажиллагаа

Зорилго өгөхөд л хангалттай. Тэндээсээ цааш ямар алхмууд хэрэгтэйг өөрөө тодорхойлж, алхам бүрт тусад нь заавар өгөх шаардлагагүй.

3

Идэвхтэй санаачлага

Зүгээр хариулаад суудаг биш. Тодорхой заавар байхгүй ч дараагийн алхам юу байх ёстойг өөрөө эргэцүүлж, зорилго руугаа идэвхтэй ажилладаг.

4

Орчноо мэдрэх

Хэрэглэгчийн хүсэлт, API хариулт, мэдээллийн сангийн төлөв, алдааны мессеж — эдгээрээс мэдээлэл авч, ертөнцийн загвараа байнга шинэчилж ажилладаг.

5

Хэрэгсэл ашиглах

API дуудах, мэдээллийн сантай ажиллах, гадаад сервис рүү хандах — зүгээр текст үүсгэхээс цааш бодит үйлдэл гүйцэтгэх чадвартай. Энэ нь агентыг зөвлөхөөс гүйцэтгэгч болгодог чадвар.


Таван чадвар хэрхэн ажилладгийг нэг жишээгээр харцгаая

"Өнөөдөр куртка өмсөх үү?" гэсэн маш энгийн асуулт. Гурван өөр хандлагаар яаж хариулагддагийг харьцуул.

LLM, Function Calling, Agent гурвын харьцуулалт
Нэг асуулт, гурван өөр хандлага
LLM-ЭЭРЭЭ АСУУХАД
Чи"Өнөөдөр куртка өмсөх үү?"
LLM"Надад одоогийн цаг агаарын мэдээлэл байхгүй, гэхдээ ерөнхийдөө 15°C-ээс доош эсвэл бороотой бол куртка өмсөх нь зүйтэй."
Орчноо мэдрэхгүй Хэрэгсэл ашиглахгүй