4. AI 에이전트-명령하는 비서에서 실행하는 대행자로
뉴스 원문 정보
원문 : https://milgyonews.net/news/detail.php?wr_id=40522작성 : 밀교신문

모니터 속의 마우스 커서가 당신의 손을 거치지 않고 스스로 움직여 업무를 끝마치는 광경을 상상해 본 적이 있는가? 지금까지 우리가 경험한 인공지능은 훌륭한 대화 상대였지만, 정작 스스로 ‘일’을 완수하지는 못했다. 질문에 유려한 답변을 내놓아도 파일을 열고, 데이터를 가공하고, 이메일을 보내는 실제적인 노동은 언제나 사용자의 손끝에서 마무리되었다. 하지만 이제 인공지능은 이 정적인 상태를 깨고 나와 사용자의 키보드와 마우스를 직접 조작하기 시작했다. 지능이 관념의 세계를 벗어나 실제 도구를 쥐고 결과물을 만들어내는 시대가 열린 것이다.
1. 답변에서 실행으로
에이전트의 본질은 ‘답변’이 아닌 ‘완수’에 있다.
“제주도 맛집 알려줘”라고 물으면 리스트를 나열하는 것이 기존의 AI였다면, 에이전트는 사용자의 예산과 취향을 고려해 식당을 검색하고 예약 가능 여부를 확인한 뒤 결제 직전의 단계까지 스스로 진행한다.
이것을 가능하게 만든 기술적 성취가 바로 ‘컴퓨터 유즈(Computer Use)’다. 앤트로픽(Anthropic)이 공개한 이 기능은 인간처럼 화면의 픽셀을 보고, 어디를 클릭해야 할지 판단하며, 직접 마우스 커서를 움직여 웹 브라우저와 엑셀을 넘나든다. ‘클로드 코워크(Claude Cowork)’는 한 발 더 나아가, 스마트폰에서 명령을 보내면 사용자의 PC에서 문서를 열고 브라우저를 조작해 작업을 완료한다. 인공지능이 인간의 언어를 이해하는 단계를 넘어, 인간이 일하는 방식 그 자체를 학습하기 시작한 것이다.
2. 복잡한 목표를 스스로 쪼갠다
에이전트의 진짜 힘은 추론을 통한 과업의 분해에 있다.
“지난달 매출 데이터를 정리해서 보고서를 만들고 팀원들에게 공유해 줘”라는 단 한 줄의 명령을 던진다고 가정해 보자. 에이전트는 이 막연한 목표를 달성하기 위해 필요한 하위 과업들을 스스로 구조화하기 시작한다.
먼저 사내 시스템에 접속해 원본 데이터를 추출한다. 다음으로 통계 도구를 열어 유의미한 수치를 도출하고, 이를 차트로 시각화해 보고서에 배치한다. 마지막으로 이메일을 열어 관련 담당자를 참조로 넣고 파일을 전송한다. 이 모든 과정에서 인간의 역할은 최종 검토와 승인뿐이다. 직접 마우스를 잡고 씨름하는 ‘수행자’에서 결과물을 확인하고 방향을 조율하는 ‘감독자’로 역할이 바뀌는 것이다.
3. 나만의 에이전트 세팅하기
에이전트를 경험하는 가장 쉬운 방법은 ChatGPT의 ‘GPTs’ 기능을 활용하는 것이다. 별도의 코딩 없이 자연어만으로 나만의 AI 비서를 만들 수 있다.
ChatGPT 화면 왼쪽 메뉴에서 ‘GPTs 탐색’을 클릭하고 ‘만들기’를 선택한다. 그다음 AI에게 역할을 부여한다. “너는 나의 일정 관리 비서야. 내가 일정을 말하면 정리해서 알려줘”라고 입력하면 기본 설정은 끝이다. 여기에 구글 캘린더나 노션 같은 외부 도구를 연동하면 실제로 일정을 등록하거나 문서를 작성하는 것까지 가능해진다.
조금 더 복잡한 자동화를 원한다면 앤트로픽의 MCP(Model Context Protocol)를 활용할 수 있다. MCP는 AI가 다양한 도구와 데이터 소스에 접근할 수 있도록 만든 연결 표준이다. 2024년 11월 공개된 이후 빠르게 업계 표준으로 자리 잡았고, 현재는 오픈AI와 구글도 이 프로토콜을 지원한다. 파일 시스템, 데이터베이스, 웹 브라우저 등을 AI에게 ‘도구’로 제공하면, AI는 필요에 따라 이 도구들을 스스로 선택해 사용한다.
개발자라면 ‘클로드 코드(Claude Code)’를 눈여겨볼 만하다. 터미널에서 자연어로 명령을 내리면 AI가 파일 구조를 설계하고, 코드를 작성하고, 테스트까지 실행한다. “로그인 기능 만들어줘”라는 한 줄이 실제로 작동하는 코드가 되어 돌아온다.

4. 현실적인 활용과 한계
에이전트가 당장 잘하는 일과 아직 어려운 일을 구분할 필요가 있다.
현실적으로 지금 바로 활용 가능한 영역은 정보 수집과 정리다. 여러 웹사이트를 돌며 특정 주제에 대한 정보를 모아 비교표로 정리하거나, PDF 문서 여러 개를 읽고 핵심 내용을 요약하는 작업은 에이전트가 인간보다 빠르고 정확하게 해낸다. 이메일 초안 작성, 회의록 정리, 반복적인 데이터 입력 같은 작업도 마찬가지다.
반면, 외부 시스템과의 연동이 필요한 작업에는 아직 제약이 있다. 에이전트는 예약 가능한 병원을 검색하고 정보를 정리해 줄 수는 있지만, 실제로 전화를 걸어 예약하는 것은 어렵다. 결제가 필요한 작업도 마찬가지다. 에이전트는 결제 직전 단계까지 진행한 뒤 사용자의 최종 확인을 기다린다.
5. 권한의 경계를 설정하라
에이전트에게 마우스와 키보드를 빌려주는 행위에는 신중함이 필요하다. 그들은 때때로 엉뚱한 버튼을 누르거나 맥락을 오해하여 의도치 않은 결과를 만들기도 한다. 앤트로픽도 공식적으로 “컴퓨터 유즈는 아직 초기 단계이며, 클로드의 코딩이나 텍스트 처리 능력에 비하면 미숙하다”고 밝히고 있다.
그래서 중요한 것이 ‘가드레일’ 설정이다. “10만 원 이상의 결제는 반드시 나의 승인을 거칠 것”, “외부로 파일을 전송하기 전에는 반드시 내용을 보여줄 것” 같은 제약 조건을 명확히 걸어두는 것이다. 에이전트를 잘 다루는 사람은 AI의 자율성과 인간의 통제권 사이에서 최적의 균형점을 찾는 사람이다.
6. 시간을 버는 기술
에이전트를 활용하는 것은 단순히 최신 도구를 쓰는 행위가 아니다. 반복적이고 지루한 작업에서 벗어나 더 중요한 판단에 집중할 시간을 버는 행위다.
물론 모든 일이 자동화되는 것은 아니다. 하지만 매일 30분씩 소모하던 단순 작업이 사라진다면, 그 시간은 온전히 당신의 것이 된다. 이제 직접 에이전트 구축에 도전해 볼 차례다. 에이전트 시대의 경쟁력은 기술적 지식이 아니라 내 업무의 구조를 얼마나 명확하게 이해하고 있는가에 달려 있다.
김민지/데이터엔지니어