Hermes Agent 설치기: 텔레그램으로 부리는 AI 집사

안녕하세요, Mark입니다.

오늘은 서버 구축기 시리즈 중에서 제가 개인적으로 가장 흥미롭다고 느낀 프로그램을 소개합니다. 설치하고 나서 “이게 되네?” 하고 혼자 감탄했던 그거요. ㅎㅎ

🤖 Hermes Agent가 뭔가요?

Hermes Agent는 Nous Research가 2026년 2월에 출시한 오픈소스 자율 AI 에이전트입니다. 코드 작성 도우미나 단순 챗봇이 아니에요.

서버에 설치해두면 텔레그램 같은 메신저로 24시간 대화하고 작업을 시킬 수 있고, 사용할수록 스스로 학습하고 더 똑똑해지는 구조입니다.

출시 이후 GitHub 스타가 10만 개를 돌파하면서 가장 빠르게 성장하는 오픈소스 AI 에이전트 프로젝트 중 하나가 됐어요.

구조를 한 줄로 정리하면 이렇습니다:

텔레그램 (입출력 창구)
      ↕
Oracle Cloud 서버
  └── Hermes (Docker)
        └── Gemini API (뇌)

텔레그램 (입출력 창구)
      ↕
Oracle Cloud 서버
  └── Hermes (Docker)
        └── Gemini API (뇌)

텔레그램으로 말 걸면, 서버에서 Hermes가 받아서, Gemini한테 생각을 시키고, 결과를 텔레그램으로 돌려주는 거예요.

🐦 이름의 유래: 제우스의 전령

Hermes는 그리스 신화의 전령 신 이름이기도 하지만, Nous Research의 AI 모델 시리즈 이름이기도 해요.

그리고 재미있게도, 바로 전 편에서 소개한 Huginn도 북유럽 신화의 까마귀 전령이었죠. 이름부터 스토리가 있는 프로그램들만 모이고 있네요 ㅎㅎ

💡 n8n, Huginn이 있는데 Hermes까지?

제 서버 자동화 라인업이 이제 꽤 됩니다.

도구	역할
n8n	반드시 지켜야 할 정형화된 자동화
Huginn	웹 스크래핑, 페이지 감시
Hermes	말로 시키는 자유로운 AI 작업

셋이 겹치는 것 같아도 실제로는 역할이 달라요.

n8n은 측정 데이터 저장, 보고서 생성처럼 반드시 정해진 대로 실행되어야 하는 업무용입니다. KOLAS 관련 데이터처럼 정확성이 생명인 작업이죠.

Hermes는 반대예요. LLM 기반이라 매번 답이 조금씩 달라질 수 있어요. 그래서 틀려도 크게 문제없는 것들, 창의적인 작업, 검색·요약·글감 탐색 같은 용도가 딱 맞습니다.

💡 한 줄 정리: n8n은 반드시 지켜져야 할 항목, Hermes는 약간 안 지켜져도 되는 항목.

📦 설치 방법이 좀 특이합니다

Hermes는 설치 방식이 다른 서비스들이랑 달라요. 포테이너에서 바로 스택 붙여넣기로 끝나지 않습니다.

설정 마법사를 SSH 터미널에서 직접 실행해야 해요.

이유는 API 키, 텔레그램 봇 토큰 같은 걸 인터랙티브하게 입력받는 방식이라서요. 포테이너 콘솔로는 안 되고, 반드시 SSH 터미널에서 진행해야 합니다.

순서는 2단계예요:

1단계: SSH에서 설정 마법사 실행 → API 키, 텔레그램 봇 연결
2단계: 포테이너 스택으로 배포 → 백그라운드 실행

1단계: SSH에서 설정 마법사 실행 → API 키, 텔레그램 봇 연결
2단계: 포테이너 스택으로 배포 → 백그라운드 실행

🤳 사전 준비: 텔레그램 봇 만들기

Hermes와 대화할 창구가 필요해요. 텔레그램 봇을 먼저 만들어야 합니다.

텔레그램에서 @BotFather 검색
/newbot 입력
봇 이름 입력 (예: MyServer_bot)
Bot Token 복사해두기 ← 이게 중요해요

그리고 내 텔레그램 User ID도 필요해요. @userinfobot에 아무 메시지나 보내면 알려줍니다.

1단계: SSH에서 설정 마법사 실행

SSH 터미널을 열고 아래 명령어를 실행합니다.

mkdir -p ~/.hermes
docker run -it --rm \
  -v ~/.hermes:/opt/data \
  nousresearch/hermes-agent setup

mkdir -p ~/.hermes
docker run -it --rm \
  -v ~/.hermes:/opt/data \
  nousresearch/hermes-agent setup

이미지 다운로드 후 설정 마법사가 시작되면 순서대로 입력하면 됩니다.

단계	선택/입력
설치 방식	Quick setup 선택
LLM 프로바이더	Google AI Studio (Gemini)
API 키	Gemini API 키 입력
Base URL	그냥 Enter (기본값)
모델	gemini-3.5-flash
Terminal backend	Keep current
메신저 설정	일단 Skip

2단계: 포테이너 스택으로 배포

포테이너 → Stacks → Add Stack에서 아래 내용을 붙여넣으세요.

services:
  hermes:
    image: nousresearch/hermes-agent:latest
    container_name: hermes
    restart: unless-stopped
    volumes:
      - /home/ubuntu/.hermes:/opt/data
    command: gateway run

services:
  hermes:
    image: nousresearch/hermes-agent:latest
    container_name: hermes
    restart: unless-stopped
    volumes:
      - /home/ubuntu/.hermes:/opt/data
    command: gateway run

⚠️ command: gateway run 반드시 넣어야 합니다! 없으면 Hermes가 TUI(터미널 UI) 모드로 시작하려다가 터미널이 없어서 컨테이너가 재시작 루프에 빠져요. 이거 빠뜨리면 포테이너에서 컨테이너가 계속 재시작되는 걸 구경하게 됩니다. ㅎㅎ

3단계: 텔레그램 봇 연결

포테이너 → hermes 컨테이너 → Console → Connect에서 아래 명령어를 실행합니다.

hermes setup gateway

hermes setup gateway

이후 순서대로:

Telegram 선택
아까 복사해둔 Bot Token 입력
Telegram User ID 입력 (@userinfobot에서 확인)
Home channel → Y
Restart gateway → Y

이제 텔레그램에서 내 봇한테 말을 걸면 Hermes가 응답합니다. 🎉

🛠️ 기본 제공 기능 (설정 없이 바로 사용)

설치만 하면 아래 기능들이 바로 됩니다.

기능	설명
웹 검색	최신 정보 검색
URL 요약	링크 던지면 내용 요약
코드 작성/실행	서버에서 직접 실행
파일 읽기/쓰기	서버 파일 조작
스케줄 자동화	크론 작업 설정
85개 스킬	`/help`로 전체 확인

n8n처럼 노드 연결하고 플로우 설계할 필요 없이, 그냥 텔레그램으로 말로 시키면 됩니다.

📈 얼마나 빠르게 성장하는 프로젝트냐면

2026년 2월 출시 이후 불과 몇 달 만에 GitHub 스타 10만 개를 돌파했고, 지금도 활발하게 업데이트되고 있어요.

현재는 텔레그램, 디스코드, 슬랙, 왓츠앱, 시그널을 포함해 18개 이상의 메신저 플랫폼을 지원합니다.

v0.14.0 기준으로는 웹 검색, AI 이미지 생성, 텍스트 음성 변환, 브라우저 자동화까지 추가됐어요.

유용한 기본 명령어도 정리해 드릴게요:

명령어	설명
`/help`	전체 명령어 보기
`/update`	최신 버전 업데이트
`/model gemini-3.5-pro`	모델 변경
`/new`	새 대화 시작

💡 활용 팁: 가벼운 작업은 Gemini Flash, 깊은 분석이 필요하면 /model gemini-3.1-pro로 바꿔서 쓰세요.

✅ 핵심 요약

항목	내용
프로그램	Hermes Agent (Nous Research)
출시	2026년 2월, GitHub 스타 10만 돌파
핵심 구조	텔레그램 ↔ 서버 Hermes ↔ Gemini API
설치 순서	SSH 설정 마법사 → 포테이너 스택 배포
주의사항	`command: gateway run` 필수, ARM 서버 호환
n8n과 차이	n8n=정형화 자동화, Hermes=말로 시키는 자유 작업

마치며

n8n, Huginn, 그리고 Hermes까지 서버에 올리고 나니 자동화 삼총사가 완성된 느낌이에요.

다만 Hermes의 두뇌 역할을 하는 Gemini 3.5 Flash는 API 비용이 만만치 않습니다. 백만 토큰당 입력 $1.50, 출력 $9.00으로, 이전 버전인 3.0 Flash에 비해 약 3배 수준이에요. 구글 공식 발표에 따르면 이번 3.5 Flash는 에이전트 기능과 코딩 능력에 특화된 모델이라고 하니, Hermes 같은 AI 에이전트 프레임워크에는 잘 맞는 선택이긴 합니다.

그렇다고 이 비싼 모델에게 날씨 확인이나 뉴스 기사 요약 같은 단순한 작업을 맡기는 건 좀 아깝죠. 그래서 저는 단순 반복 작업은 n8n의 텔레그램 트리거 워크플로우에서 저렴한 하위 모델로 처리하고, Hermes는 판단과 추론이 필요한 작업에만 투입하는 방식으로 운용하고 있어요.

Huginn이 인터넷을 돌아다니며 정보를 물어오고, n8n이 그걸 정해진 규칙대로 처리하고, Hermes에게 “이 데이터 분석해줘” 하고 말로 시키는 구조. 오딘이 까마귀 두 마리 거느리고 세상 정보를 파악하듯, 저도 서버 위에서 비슷한 걸 꿈꾸고 있습니다. ㅎㅎ

Mark의 한마디: “텔레그램으로 말 한마디 했더니 서버가 알아서 검색하고 요약해서 돌려줬을 때, ‘아, 이게 집사구나’ 싶었습니다.”