【Hermes Agent入門 #1】Hermes Agentとは何か? AIエージェントとして何ができるのか
この記事は約 18 分で読めます
最近、AI エージェントという言葉をよく見かけるようになりました。Claude Code、GitHub Copilot、Codex、Cursor。でも「Hermes Agent」という名前は、まだ日本語圏ではあまり見かけないかもしれません。
私が Hermes Agent の GitHub を初めて開いたのは、GBrain の記憶設計を調べていたときでした。170,000 スター。この数字を見て「これ、なんで日本であまり話題になっていないんだろう」とちょっと不思議に感じたのを覚えています。
調べていくうちに分かったのは、Hermes Agent は「チャット AI」とはかなり違うということ。会話するだけの AI ではなくて、自分でコードを書いて、ファイルを編集して、Web を検索して、タスクを実行する。しかも使い込むほど賢くなる仕組みが入っている。
今回はまず、公式ドキュメントをベースに、「Hermes Agent って結局何なのか」「何ができるのか」を整理します。セットアップ方法や具体的な使い方は Part 2 以降で扱うので、この記事では全体像をつかむことに集中してください。
Hermes Agent って、そもそも何?
Hermes Agent は、AI 研究企業 Nous Research が開発するオープンソース(MIT ライセンス)の AI エージェントです。2026 年 5 月時点で v0.14.0、GitHub で 170,000 スター超、28,500 フォーク超。Python 88.9%、TypeScript 8.3% で書かれています。
公式が掲げるキャッチコピーは「The Agent That Grows With You」。使い込むほど成長する AI エージェント、という位置づけです。
ポイントは、これが「チャットボットのラッパー」ではないこと。公式ドキュメントでも明確に区別されていますが、Hermes Agent は:
- サーバー上で 24 時間動き続ける(必要なときだけ起動するのではなく、常駐プロセスとして動く)
- 自分からメッセージを送れる(予約タスクやアラートなど、ユーザーの発話なしに動ける)
- コードを「提案する」のではなく、書いて実行する
- 使い込むうちにスキルを自動生成して、自分を改善する
最後の「スキルの自動生成」はちょっと驚きました。5 回以上のツール呼び出しを含む複雑なワークフローを完了すると、そのプロセスを SKILL.md ファイルとして自動保存する。次に似たタスクが来たら、保存したスキルを参照して効率的に処理する。しかもこのスキルは 7 日サイクルで自動評価・統合・刈り込みされるので、使われないスキルは淘汰されていく。
この「学習ループが内蔵されている」という設計が、他の AI エージェントと Hermes Agent を分ける一番大きな特徴だと私は思っています。
普通のチャット AI と何が違うのか
ChatGPT や Claude のチャット画面を使ったことがある人は多いと思います。質問すれば答えが返ってくる。それ自体はとても便利。でも、あなたが「AI にタスクを任せたい」と思ったとき、チャット AI だけだとどうしても壁にぶつかります。
たとえば:
- 「この調査結果をまとめてファイルに保存して」→ チャット AI はファイルを作れない
- 「昨日の会話の続きから始めて」→ セッションが切れたら忘れている
- 「毎朝 9 時にニュースを集めて送って」→ チャット AI は自分からは動けない
- 「前にうまくいったやり方で同じ作業をして」→ チャット AI は前のやり方を学習しない
Hermes Agent はこれらを仕組みとして解決しています。
ファイルを読み書きし、コードを実行し、Web を検索する
40 以上の統合ツールを持っていて、ターミナル操作、ファイル読み書き、Web 検索(Firecrawl / SearXNG / Tavily 等 5 バックエンド)、ブラウザ操作、画像生成、音声合成まで対応しています。「調べて → まとめて → ファイルに書いて → 次のステップに進む」を AI が自分でやれる。
記憶を持っている
Persistent Memory として MEMORY.md(環境メモ、約 2,200 字)と USER.md(ユーザー情報、約 1,375 字)を持ち、セッションをまたいで記憶が残ります。さらに過去のセッションを全文検索する Session Search(SQLite + FTS5、約 20ms)も組み込み。加えて Mem0、Hindsight、Holographic など 8 種類の外部メモリプロバイダにも対応しています。
自分から動ける
cron ジョブを自然言語で設定できます。「毎朝 9 時に AI ニュースを収集して Telegram に送って」のような指示が、cronjob ツールで実現できる。チャット AI は「聞かれたら答える」だけですが、Hermes Agent は「決まった時間に自分から動く」ことができます。
23 以上のプラットフォームで動く
Telegram、Discord、Slack、WhatsApp、Signal、Email、Microsoft Teams、LINE など 23 以上のプラットフォームに同時接続できます。CLI(ターミナル)だけでなく、普段使っているメッセージアプリからそのまま指示できる。設定は hermes gateway setup の対話式メニューで進められます。
学習ループが内蔵されている
先ほど触れたスキルの自動生成。複雑なタスクを完了すると、そのワークフローを SKILL.md として保存する。スキルは agentskills.io のオープン標準に準拠していて、Claude Code や Cursor など他のエージェントとも互換性があります。
さらに、スキルの読み込みは 3 段階(Level 0: メタデータのみ、Level 1: 全文、Level 2: 参照ファイル)で管理されていて、必要なときだけ必要な分だけ読み込む。トークンを無駄にしない設計です。ここ、地味だけどよく考えてあるなと思いました。

Hermes Agent でできること
公式ドキュメントとユーザーストーリー(237 件公開)をベースに、具体的に何ができるかを整理します。
調査・情報収集
Web 検索(5 バックエンド対応)、ブラウザ操作(Browserbase / Browser Use / ローカル Chrome)、X(旧 Twitter)検索を組み合わせて、調査タスクをこなせます。「○○について調べて、要点をまとめて」が本当に動く。
コード作成・実行
ターミナルにアクセスして、コードを書いて実行できます。ターミナルバックエンドは 6 種類(ローカル、Docker、SSH、Singularity、Modal、Daytona)。ローカル環境を汚したくなければ Docker コンテナ内で実行する設定もあります。
ファイル操作
read_file でファイルを読み、patch で差分編集する。レポートの下書き、設定ファイルの修正、データの整形など、ファイルを扱う作業を任せられます。
タスクの自動化・予約実行
cronjob ツールで定期タスクを設定できます。「毎日 18 時にプロジェクトの進捗をまとめて」「週に 1 回、競合サイトの更新をチェックして」のような定期業務を AI に任せられる。
外部ツール連携(MCP)
MCP(Model Context Protocol)経由で外部ツールサーバーに接続できます。GitHub、データベース、ファイルシステム、各種 API を MCP サーバーとして接続すれば、Hermes Agent のツールとして使える。hermes mcp コマンドで Nous 承認済みの MCP カタログからワンクリックインストールも可能です。
サブエージェントへの作業委任
delegate_task ツールで、最大 3 つの並行サブエージェントにタスクを分割できます。大きなリサーチを 3 方向に分けて同時に走らせる、といった使い方。
メディア処理
画像生成(FLUX 2、GPT-Image 2 など 9 モデル対応)、動画生成・分析、テキスト音声変換(Edge TTS 無料版含む 10 プロバイダ対応)。マルチモーダルな作業もカバーしています。
AI モデルの切り替え
300 以上のモデルに対応。hermes model コマンドで Anthropic(Claude)、OpenAI(GPT)、Google(Gemini)、DeepSeek、Ollama(ローカル)など自由に切り替えられます。コードの変更は不要。ローカルモデルを使えば API コストゼロで運用できます。
性格のカスタマイズ
SOUL.md というファイルで、エージェントの性格や振る舞いを定義できます。「端的に話して」「不確実なことは正直に言って」「悪いアイデアにはちゃんと反対して」のように、自分好みにチューニングできる。プリセットも 14 種類用意されています。
こういう人に向いていると思う
ここからは公式情報を踏まえた上での、私の受け止め方です。
Hermes Agent はかなり多機能ですが、全員に必要かというとそうではないと思います。向いているのは、たぶんこういう人。
- AI に「作業」を任せたい人:会話だけじゃなくて、調査・ファイル作成・定期タスクを実際にやってほしい。チャット AI の「ここまではできるけど、その先は自分で」という壁にストレスを感じている人
- 複数のプラットフォームで AI を使いたい人:Telegram で指示して Discord で報告を受け取る、みたいな使い方。CLI だけに閉じないのは大きい
- ローカルモデルで動かしたい人:Ollama や llama.cpp 対応なので、API 課金なしでエージェントを動かせる。プライバシーが気になる作業にも向いている
- AI エージェントの仕組みを理解したい開発者:オープンソースで中身が全部見える。スキルシステム、メモリ設計、MCP 連携の実装を読むだけでも勉強になる
逆に、「AI と会話できれば十分」「ファイル操作やコード実行は不要」「セットアップに時間をかけたくない」という人には、ChatGPT や Claude のチャット画面のほうが合うと思います。
副業・個人開発にはどう使えるか
AIニュースラボの読者向けに、副業・個人開発での使い道を考えてみます。
- リサーチ業務の自動化:「○○の市場動向を調べて、表にまとめて」を Hermes Agent に任せて、自分はレビューと判断に集中する。クライアントワークの下調べを効率化できます
- ブログ運営の補助:ネタ収集、競合調査、下書きの素材集め、SEO 分析を定期タスクとして設定する。毎朝 AI がネタリストを用意してくれる運用も組める
- 個人開発のアシスタント:コード生成 + テスト + デバッグのサイクルを Hermes Agent に回させる。Docker バックエンドを使えば開発環境を隔離したまま作業できる
- AI エージェント運用の知見を発信する:Hermes Agent を使いこなした経験をブログや SNS で発信する。日本語で Hermes Agent について書いている人はまだ少ないので、検索流入を取りやすい
注意
「Hermes Agent を入れれば副業がすぐ成立する」わけではありません。まず自分の作業フローのどこを AI に任せたいかを整理して、小さなタスクから試すのが現実的です。
「AI エージェントを使いこなせる」こと自体が価値になる時代
ここは少し大きな話になりますが、「AI エージェントのセットアップと運用ができる」こと自体が、今後スキルとして価値を持つようになると感じています。
- AI エージェント運用コンサルティング:「Hermes Agent でこういうタスクを自動化したい」という相談に乗って、設計・構築する。MCP の接続設計やスキルのカスタマイズまで含めたサービス
- スキルパックの開発・公開:特定業務に特化したスキルを
SKILL.mdとして設計し、agentskills.io で公開する。他のユーザーがインストールして使えるので、エコシステムへの貢献がそのまま実績になる - 日本語チュートリアル:セットアップから運用まで、日本語で体系的に解説するコンテンツ。Hermes Agent の日本語情報はまだほとんどないので、先に書いた人が有利
ただし、Hermes Agent は v0.14.0(2026 年 5 月)で、まだ急速に開発が進んでいるプロジェクトです。仕様変更のペースが速いので、コンテンツは更新し続ける前提で組む必要があります。
始めるために必要なもの
セットアップの詳細は Part 2 で扱いますが、「始めるのにどれくらい必要なのか」だけ先にお伝えしておきます。
最低限必要なもの
- PC:Linux / macOS / WSL2 が推奨。Windows ネイティブは早期ベータ
- Python 3.11+:インストールスクリプトが自動で入れてくれる
- LLM の API キー:Anthropic(Claude)、OpenAI、Google、DeepSeek など。ローカルモデル(Ollama 等)なら API キー不要
コスト感
- Hermes Agent 本体:無料(MIT ライセンス)
- LLM API:使うモデルとタスク量による。Claude Sonnet で日常的なタスクを回すなら月 $5〜$20 が目安。ローカルモデルなら $0
- オプション:Nous Portal(300+ モデル統合サービス)を使うと、API キーの管理が楽になる
必要なスキル
- CLI(ターミナル)の基本操作ができること
- API キーの取得・設定ができること
- 英語のドキュメントを読む抵抗が少ないこと(現時点で日本語ドキュメントはほぼない)
プログラミング経験は「あった方がいい」けど必須ではないです。ターミナルで pip install hermes-agent が打てれば、最低限のスタートは切れます。
まだ注意が必要なこと
ここは正直に書きます。
- 何でも自動化できるわけではない:ツールが 40 以上あっても、想定外のタスクではうまく動かないことがある。特に複雑な判断が必要な場面では、人間の確認が不可欠です
- AI の出力は必ず確認する:コードを書いて実行までできるということは、間違ったコードも実行される可能性がある。Docker バックエンドで実行環境を隔離するなど、安全策を取ることを推奨します
- メモリの設計は自分で考える必要がある:Core Memory は約 1,300 トークン。何を覚えさせて何を忘れさせるかのルールは、自分で決める必要がある。全部覚えさせようとすると溢れます
- セキュリティ・機密情報には慎重に:Hermes Agent はデータ収集やテレメトリを行わない設計ですが、接続する LLM プロバイダには会話が送信されます。機密情報を扱う場合はローカルモデルの利用を検討してください
- 英語前提:公式ドキュメント、エラーメッセージ、コミュニティ(Discord)はすべて英語。日本語の情報は、この記事を含めてまだごくわずかです
- 開発途上:v0.14.0 はまだメジャーバージョン 1.0 に達していません。破壊的な変更が入る可能性は念頭に置いてください

私は Hermes Agent を「作業パートナー」として見ている
Hermes Agent のドキュメントを読み込んでいて、一番印象に残ったのは「The Agent That Grows With You」というキャッチコピーでした。
最初は正直、「よくあるマーケティングコピーかな」と思っていたんですが、スキルの自動生成、7 日サイクルの評価・淘汰、セッションをまたぐ記憶、cron による自律動作。これらの仕組みを一つひとつ見ていくと、「成長する」という表現がただのコピーじゃなくて、設計として実装されていることが分かった。
私の受け止め方としては、Hermes Agent は「万能ツール」ではなく「作業パートナー」。最初はぎこちないけど、使い続けるとこちらの仕事の進め方を覚えて、少しずつ頼れるようになっていく。そういうタイプの AI だと思います。
ただし、いきなり全機能を使おうとすると確実につまずきます。最初はターミナルで簡単な調査タスクを 1 つ任せるところから。それがうまくいったら、次はメモリの設定、その次は MCP で外部ツールをつなぐ。段階的に広げていくのが現実的です。
前回の記事で紹介した GBrain や Obsidian との 3 層設計も、Hermes Agent 単体を理解した上で初めて意味が出てきます。まずは Part 1 の「何ができるか」を押さえてから、Part 2 以降で手を動かしていきましょう。
私自身、次の Part 2 に向けて実際にインストールして触ってみるつもりです。触った上で「ここはドキュメント通りにいかなかった」「ここは想像以上に楽だった」を Part 2 でそのまま書きます。
参考にしたもの
一次情報
- Hermes Agent GitHub リポジトリ(Nous Research / MIT License)
- Hermes Agent 公式サイト
- Hermes Agent 公式ドキュメント
- Hermes Agent: Features Overview
- Hermes Agent: Tools and Toolsets
- Hermes Agent: Skills System
- Hermes Agent: Persistent Memory
- Hermes Agent: Memory Providers
- Hermes Agent: MCP Integration
- Hermes Agent: Personality / SOUL.md
- Hermes Agent: Messaging Platforms
- Hermes Agent: User Stories (237件)
- Agent Skills: オープン標準ハブ
関連記事
声で下書き、声で検索──Docs Live・Gmail Liveで始まる「音声ワークスタイル」の現在地
AIエージェントの「scaffold」と「harness」──設計を間違えないための用語整理
GitHub Copilot CLIでゲームを作ると、個人開発はどう変わる?