AI Agents, Clearly Explained

유튜브 이슈 요약 2026. 2. 24. 21:31

🧠 1단계: LLM과 챗봇의 기본 구조

대중적으로 사용되는 ChatGPT, Gemini, Claude 같은 서비스는 대규모 언어모델(LLM)을 기반으로 작동하는 애플리케이션입니다. 구조는 단순합니다. 사용자가 입력을 제공하면, 모델이 학습된 데이터에 기반해 출력을 생성하는 방식입니다. 예를 들어 커피 미팅 요청 이메일을 작성해 달라고 하면, 정중한 이메일 초안을 생성해 줍니다. 그러나 개인 일정이 언제인지 묻는 질문에는 답할 수 없습니다. 이는 LLM이 방대한 데이터를 학습했더라도 개인 캘린더나 회사 내부 정보 같은 사적 데이터에는 접근하지 못하기 때문입니다. 또한 LLM은 본질적으로 수동적이며, 사용자의 요청이 있어야만 반응하는 특성을 가집니다.

🔄 2단계: AI 워크플로우와 사전 정의된 경로

AI 워크플로우는 LLM에 외부 도구 접근 경로를 미리 설계해 두는 방식입니다. 예를 들어 “개인 일정에 대해 질문하면 먼저 구글 캘린더를 조회하라”는 규칙을 설정하면, 모델은 답변 전에 캘린더 데이터를 검색합니다. 그러나 이 구조는 사람이 정해 놓은 경로, 즉 ‘제어 로직(control logic)’을 따르는 데 그칩니다. 만약 같은 대화에서 날씨를 묻는다면, 캘린더만 조회하도록 설계된 워크플로우는 적절히 대응하지 못합니다. 단계가 수십, 수백 개로 늘어나더라도 인간이 의사결정 구조를 설계했다면 이는 여전히 워크플로우입니다.

여기서 자주 등장하는 RAG(Retrieval Augmented Generation)는 모델이 답변 전에 외부 정보를 조회하도록 하는 방식으로, 본질적으로 워크플로우의 한 유형입니다. 예시로 뉴스 링크를 구글 시트에 수집하고, 이를 요약한 뒤, 다시 다른 모델로 소셜미디어 게시글을 작성하고, 매일 자동 실행되도록 설정하는 구조가 소개됩니다. 이 모든 과정은 사람이 “1단계, 2단계, 3단계”를 명시적으로 정의했기 때문에 워크플로우에 해당합니다. 결과물이 마음에 들지 않을 경우 프롬프트를 수정하는 반복 작업 역시 인간이 수행합니다.

🤖 3단계: AI 에이전트의 핵심 전환점

AI 워크플로우가 AI 에이전트로 전환되기 위한 결정적 변화는 ‘의사결정자’가 인간에서 LLM으로 바뀌는 것입니다. 에이전트는 단순히 정해진 절차를 따르는 것이 아니라, 목표를 부여받으면 스스로 최적의 접근 방식을 추론합니다. 예를 들어 뉴스 기반 소셜미디어 게시물을 작성하라는 목표가 주어지면, 어떤 방식으로 뉴스를 수집하고 어떤 도구를 사용할지 스스로 판단합니다. 또한 선택한 도구를 실제로 실행하며 행동합니다.

이 구조를 설명하는 대표 개념이 ReAct 프레임워크입니다. 모든 AI 에이전트는 ‘추론(Reason)’과 ‘행동(Act)’을 수행합니다. 먼저 문제 해결 전략을 생각하고, 이후 적절한 도구를 선택해 실행합니다. 이때 인간은 세부 절차를 일일이 지정하지 않습니다. LLM이 판단과 실행을 주도하는 것이 핵심입니다.

🔁 자율적 반복과 자기 개선 능력

AI 에이전트의 또 다른 핵심 특성은 반복(iteration)입니다. 워크플로우에서는 결과가 만족스럽지 않을 경우 사람이 프롬프트를 수정해야 합니다. 반면 에이전트는 스스로 결과를 평가하고 개선 과정을 반복할 수 있습니다. 예를 들어 소셜미디어 게시물이 충분히 매력적인지 판단하기 위해 또 다른 LLM을 활용해 비평하도록 구성할 수 있으며, 기준을 충족할 때까지 수정 작업을 반복합니다. 이는 단순 실행을 넘어 자기 점검과 개선까지 포함하는 구조입니다.

🎥 실제 사례: 비전 AI 에이전트의 작동 방식

영상 검색 데모 사례에서는 ‘스키어’를 검색하면, AI 비전 에이전트가 먼저 스키어의 특징을 추론한 뒤, 영상 데이터를 분석해 해당 장면을 찾아 인덱싱하고 결과를 반환합니다. 기존 방식이라면 사람이 영상을 검토하고 태그를 달아야 했겠지만, 이 과정이 자동화되어 있습니다. 사용자 입장에서는 단순한 검색 결과처럼 보이지만, 내부적으로는 추론·행동·관찰·결과 반환의 일련 과정이 수행됩니다.

🗂 세 단계 구조의 비교 정리

첫째, LLM 단계에서는 입력에 대해 즉각적인 출력을 생성하는 단순 구조입니다. 둘째, AI 워크플로우는 사람이 설계한 경로에 따라 외부 도구를 활용해 답변을 생성합니다. 셋째, AI 에이전트는 목표를 부여받으면 LLM이 직접 의사결정을 수행하고, 최적의 방법을 추론하며, 도구를 사용해 실행하고, 중간 결과를 평가한 뒤 필요 시 반복 개선을 거쳐 최종 결과를 도출합니다. 차이의 본질은 ‘누가 의사결정을 하는가’에 있습니다. 에이전트 단계에서는 LLM이 워크플로우의 의사결정 주체가 됩니다.

🚀 결론: 사용자 관점에서의 의미

AI 에이전트는 복잡한 기술 개념처럼 보이지만, 핵심은 목표 중심의 자율적 문제 해결입니다. 사용자는 세부 절차를 설계하는 대신 목표를 제시하고, 시스템은 추론과 실행을 반복해 결과를 만들어냅니다. 이는 단순 대화형 도구를 넘어, 실제 업무를 대신 수행하는 자동화된 디지털 협업자로의 전환을 의미합니다.

'유튜브 이슈 요약' 카테고리의 다른 글

Master OpenClaw in 30 Minutes (5 Real Use Cases + Setup + Memory) (0)	2026.02.24
로봇과 AI 다 가진 '이 기업' 지금 싸도 너무 쌉니다 근데 앞으로 세계 1위 될 것입니다 (김대식 교수 / 풀버전) (0)	2026.02.24
Agentic AI의 기술적 해부 (RAG, A2A, MCP, MAS,...) (0)	2026.02.24
Lec 01. Introduction to Deep Learning (1)	2026.02.13
세계적인 두뇌 역노화 전문가가 말하는 「뇌에 가장 치명적인 행동 1가지 」 (0)	2026.02.12

ABOUT ME

cadabra cadabra

🧠 1단계: LLM과 챗봇의 기본 구조

🔄 2단계: AI 워크플로우와 사전 정의된 경로

🤖 3단계: AI 에이전트의 핵심 전환점

🔁 자율적 반복과 자기 개선 능력

🎥 실제 사례: 비전 AI 에이전트의 작동 방식

🗂 세 단계 구조의 비교 정리

🚀 결론: 사용자 관점에서의 의미

'유튜브 이슈 요약' 카테고리의 다른 글

티스토리툴바

ABOUT ME

🧠 1단계: LLM과 챗봇의 기본 구조

🔄 2단계: AI 워크플로우와 사전 정의된 경로

🤖 3단계: AI 에이전트의 핵심 전환점

🔁 자율적 반복과 자기 개선 능력

🎥 실제 사례: 비전 AI 에이전트의 작동 방식

🗂 세 단계 구조의 비교 정리

🚀 결론: 사용자 관점에서의 의미

'유튜브 이슈 요약' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바