Skip to main content

<오픈클로 with GPT, 제미나이, 클로드> 에이전트한테 뭘 시킬지보다 뭘 막을지 먼저 쓰라는 책

· 4 min read
Doyul Kim, Ian
Cloud Engineer @STCLab, Wave Autoscale Team

책 표지

한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다.

이 책을 고른 이유

Claude Code나 Cursor처럼 코딩을 도와주는 AI는 매일 쓴다. 터미널 옆에 띄워두고 리팩터링 시키거나 테스트 짜라고 던지는 게 일상이다. 근데 "내 업무를 대신해주는 AI"라고 하면 갑자기 남의 이야기가 됐다. 매일 아침 메일함을 정리해주고 캘린더를 요약해주는, 그런 에이전트. 생각은 해봤는데 손을 안 댔다. 클라우드 에이전트는 회사가 내 데이터를 쥐고 있는 게 꺼림칙했고, 직접 붙이려니 크론 + LLM + 메신저를 엮는 게 귀찮아보였다.

이 책의 주인공 오픈클로(OpenClaw)는 딱 그 문턱을 낮추려고 나온 오픈소스다. 내 컴퓨터에 상주하면서 원하는 모델(클로드/GPT/제미나이/로컬)을 골라 끼우고, 제어권은 내가 쥔다. 이 지점이 궁금해서 골랐다.

이런 분에게 추천한다

  • GPT·클로드를 챗봇으로는 쓰는데 에이전트로 세팅해본 적은 없는 사람
  • 크론이나 셸 스크립트로 업무 자동화는 해본 적 있지만, LLM을 엮을 엄두를 못 냈던 개발자
  • 개인 AI 에이전트가 보안·비용 때문에 무서워서 미뤄뒀던 사람

반대로, "프롬프트 몇 개 복붙해서 바로 뭔가 만드는" 책을 원한다면 이 책은 아니다. 앞부분의 꽤 많은 지면이 설치, 전용 계정 분리, SOUL.md / IDENTITY.md / USER.md 같은 페르소나 파일, 보안 3층 구조 설명에 쓰인다.

읽어보니

27쪽 - 오픈클로 구조: 메신저 채널 / 내 컴퓨터 / AI 프로바이더

첫인상은 "이건 설치 가이드가 아니라 세팅론이구나"였다. 게이트웨이가 localhost:18789에서 돌고 설정은 ~/.openclaw/에 있다는 식의 구조를 1~2장에서 그려두고, 3장부터는 내내 "에이전트한테 뭘 허락할 것인가"를 묻는다. 도구 프로필(minimal / coding / messaging / full), 확인 프롬프트, 샌드박스, DM 페어링으로 이어지는 3층 방어선. 그리고 SOUL.md 안의 '금지 사항' 블록은 매 요청마다 다시 읽혀서 규칙을 바꿀 때 게이트웨이 재시작이 필요 없다는 식의 설계 디테일.

할 수 있는 일은 상황에 따라 달라지지만, 하지 말아야 할 일은 변하지 않으니까요. (9장, 241쪽)

개인적으로 이 한 문장이 책을 가장 잘 요약한다. 프롬프트 엔지니어링 책이 "뭘 시킬지 잘 적어라"를 가르친다면, 이 책은 "뭘 막을지 먼저 적어라"에서 시작한다. 실제로 브라우저 자동화 중 웹 페이지에 숨어있던 프롬프트 인젝션에 걸려 워크스페이스 파일 목록이 외부로 전송될 뻔한 사례, 몰트북(Moltbot) 같은 에이전트 커뮤니티가 인간 조종·데이터 노출 문제로 2026년 3월 메타에 인수된 사례 등이 중간중간 삽입돼 있다. 마케팅용 '안전' 슬로건이 아니라 이미 일어난 사고들을 근거로 규칙을 깐다.

128쪽 - 검색·정리 결과 예시 (강남역 이탈리안 레스토랑 비교표)와 5.4 파일 편집 섹션 시작

5~6장부터는 실제 작업 흐름이 나온다. CSV를 던지면 매출 증감률 표로, 검색을 시키면 레스토랑 비교표로, 메일을 던지면 요약 + 답장 초안으로. 모델을 골라쓰는 감각도 구체적이다. 평소에는 제미나이 플래시 같은 경량 모델로 라우팅하고, 코드나 복잡한 분석이 필요할 때만 클로드 소넷으로 올려 태우는 식. 책은 이걸 "토큰이 곧 식비"라고 쓴다. Gemini Flash 풀가동 하루 $4-7 vs 같은 작업 클로드 소넷 ~5배 같은 수치가 '커피 한두 잔 값'으로 바꿔 쓰여 있어서 감이 잘 잡혔다.

아쉬운 부분도 있다. 오픈클로 자체가 2025년 말에 등장한 프로젝트고, 본문에 2026년 2월 CVE-2026-25253, 3월 메타의 몰트북 인수 같은 사건까지 들어가 있다. 책이 이 속도로 움직이는 대상을 다루다 보니, 2~3년 뒤에 여기 나온 설정 스키마나 스킬 API가 그대로일 거라는 보장은 없다. 집필 시점의 생태계 스냅샷으로 읽어야 한다.

구성

들어가며 + 9장 + 마치며로 구성되어 있고, 3부로 나뉜다.

  • Part 1 (1~2장): 오픈클로가 뭐고 AutoGPT·Operator·Mariner 같은 것들과 어떻게 다른지, WSL2 설치, 프로바이더·모델·메신저 연결
  • Part 2 (3~5장): 전용 계정 같은 환경 준비, SOUL.md / IDENTITY.md / USER.md 3단 페르소나 파일, 검색·파일 분석·비전 같은 첫 심부름
  • Part 3 (6~9장): 스킬, 크론, 하트비트, 이메일·브라우저 자동화, 모닝 브리핑 워크플로, 비용 절감 + 멀티 에이전트, 외부 서비스 연결, 회고

185쪽 - 크론·AI 모델·메모리·도구를 엮은 모닝 브리핑 워크플로

체감상 6장이 정점이다. 크론(정해진 시간)과 하트비트(상황 판단)를 구분해서 비용 낭비를 줄이고, 스킬로 동작 패턴을 모듈화하고, 메모리 시스템으로 에이전트에게 맥락을 쌓아주는 흐름. 모닝 브리핑 워크플로는 그 모든 요소가 동시에 맞물리는 예제라 정돈이 잘 되어 있다.

총평

프롬프트 몇 개로 기적을 보여주는 책은 아니다. 내 컴퓨터에 에이전트를 하나 두고, 성격을 정의하고, 뭘 막을지를 결정하고, 그 다음에야 뭘 시킬지를 고민하라는 책이다. 개발자 입장에서는 Claude Code처럼 터미널에서 코드만 두드리게 해주는 도구와, 메일·캘린더·문서까지 손대는 개인 비서 사이의 거리가 좁혀지고 있다는 걸 실감하는 읽기였다.

"믿을 수 있는 동료가 가장 좋은 동료"라는 책의 말은 나한테는 이렇게 읽혔다. 성능이 아니라 일관성, 기능이 아니라 금지 규칙. 에이전트한테 뭘 더 잘 시킬까보다 뭘 못하게 막을까를 먼저 쓰는 편이 훨씬 오래 쓸 수 있는 도구를 만든다는 것.

#한빛미디어 #나는리뷰어다 #오픈클로