AIツール活用・比較 【Hermes Agent入門 #1】Hermes Agentとは何か? AIエージェントとして何ができるのか

【Hermes Agent入門 #1】Hermes Agentとは何か? AIエージェントとして何ができるのか

2026.05.28 · AIツール活用・比較 · AIニュース解説 · 約18分

この記事は約 18 分で読めます

最近、AI エージェントという言葉をよく見かけるようになりました。Claude Code、GitHub Copilot、Codex、Cursor。でも「Hermes Agent」という名前は、まだ日本語圏ではあまり見かけないかもしれません。

私が Hermes Agent の GitHub を初めて開いたのは、GBrain の記憶設計を調べていたときでした。170,000 スター。この数字を見て「これ、なんで日本であまり話題になっていないんだろう」とちょっと不思議に感じたのを覚えています。

調べていくうちに分かったのは、Hermes Agent は「チャット AI」とはかなり違うということ。会話するだけの AI ではなくて、自分でコードを書いて、ファイルを編集して、Web を検索して、タスクを実行する。しかも使い込むほど賢くなる仕組みが入っている。

今回はまず、公式ドキュメントをベースに、「Hermes Agent って結局何なのか」「何ができるのか」を整理します。セットアップ方法や具体的な使い方は Part 2 以降で扱うので、この記事では全体像をつかむことに集中してください。

Hermes Agent って、そもそも何?

Hermes Agent は、AI 研究企業 Nous Research が開発するオープンソース(MIT ライセンス)の AI エージェントです。2026 年 5 月時点で v0.14.0、GitHub で 170,000 スター超、28,500 フォーク超。Python 88.9%、TypeScript 8.3% で書かれています。

公式が掲げるキャッチコピーは「The Agent That Grows With You」。使い込むほど成長する AI エージェント、という位置づけです。

ポイントは、これが「チャットボットのラッパー」ではないこと。公式ドキュメントでも明確に区別されていますが、Hermes Agent は:

  • サーバー上で 24 時間動き続ける(必要なときだけ起動するのではなく、常駐プロセスとして動く)
  • 自分からメッセージを送れる(予約タスクやアラートなど、ユーザーの発話なしに動ける)
  • コードを「提案する」のではなく、書いて実行する
  • 使い込むうちにスキルを自動生成して、自分を改善する

最後の「スキルの自動生成」はちょっと驚きました。5 回以上のツール呼び出しを含む複雑なワークフローを完了すると、そのプロセスを SKILL.md ファイルとして自動保存する。次に似たタスクが来たら、保存したスキルを参照して効率的に処理する。しかもこのスキルは 7 日サイクルで自動評価・統合・刈り込みされるので、使われないスキルは淘汰されていく。

この「学習ループが内蔵されている」という設計が、他の AI エージェントと Hermes Agent を分ける一番大きな特徴だと私は思っています。

普通のチャット AI と何が違うのか

ChatGPT や Claude のチャット画面を使ったことがある人は多いと思います。質問すれば答えが返ってくる。それ自体はとても便利。でも、あなたが「AI にタスクを任せたい」と思ったとき、チャット AI だけだとどうしても壁にぶつかります。

たとえば:

  • 「この調査結果をまとめてファイルに保存して」→ チャット AI はファイルを作れない
  • 「昨日の会話の続きから始めて」→ セッションが切れたら忘れている
  • 「毎朝 9 時にニュースを集めて送って」→ チャット AI は自分からは動けない
  • 「前にうまくいったやり方で同じ作業をして」→ チャット AI は前のやり方を学習しない

Hermes Agent はこれらを仕組みとして解決しています。

ファイルを読み書きし、コードを実行し、Web を検索する

40 以上の統合ツールを持っていて、ターミナル操作、ファイル読み書き、Web 検索(Firecrawl / SearXNG / Tavily 等 5 バックエンド)、ブラウザ操作、画像生成、音声合成まで対応しています。「調べて → まとめて → ファイルに書いて → 次のステップに進む」を AI が自分でやれる。

記憶を持っている

Persistent Memory として MEMORY.md(環境メモ、約 2,200 字)と USER.md(ユーザー情報、約 1,375 字)を持ち、セッションをまたいで記憶が残ります。さらに過去のセッションを全文検索する Session Search(SQLite + FTS5、約 20ms)も組み込み。加えて Mem0、Hindsight、Holographic など 8 種類の外部メモリプロバイダにも対応しています。

自分から動ける

cron ジョブを自然言語で設定できます。「毎朝 9 時に AI ニュースを収集して Telegram に送って」のような指示が、cronjob ツールで実現できる。チャット AI は「聞かれたら答える」だけですが、Hermes Agent は「決まった時間に自分から動く」ことができます。

23 以上のプラットフォームで動く

Telegram、Discord、Slack、WhatsApp、Signal、Email、Microsoft Teams、LINE など 23 以上のプラットフォームに同時接続できます。CLI(ターミナル)だけでなく、普段使っているメッセージアプリからそのまま指示できる。設定は hermes gateway setup の対話式メニューで進められます。

学習ループが内蔵されている

先ほど触れたスキルの自動生成。複雑なタスクを完了すると、そのワークフローを SKILL.md として保存する。スキルは agentskills.io のオープン標準に準拠していて、Claude Code や Cursor など他のエージェントとも互換性があります。

さらに、スキルの読み込みは 3 段階(Level 0: メタデータのみ、Level 1: 全文、Level 2: 参照ファイル)で管理されていて、必要なときだけ必要な分だけ読み込む。トークンを無駄にしない設計です。ここ、地味だけどよく考えてあるなと思いました。

チャットAIとHermes Agentの違いを示した図。普通のチャットAIは回答するだけ、Hermes Agentはメモリ・タスク・ツール・ワークフロー・レビュー機能を持つ

Hermes Agent でできること

公式ドキュメントとユーザーストーリー(237 件公開)をベースに、具体的に何ができるかを整理します。

調査・情報収集

Web 検索(5 バックエンド対応)、ブラウザ操作(Browserbase / Browser Use / ローカル Chrome)、X(旧 Twitter)検索を組み合わせて、調査タスクをこなせます。「○○について調べて、要点をまとめて」が本当に動く。

コード作成・実行

ターミナルにアクセスして、コードを書いて実行できます。ターミナルバックエンドは 6 種類(ローカル、Docker、SSH、Singularity、Modal、Daytona)。ローカル環境を汚したくなければ Docker コンテナ内で実行する設定もあります。

ファイル操作

read_file でファイルを読み、patch で差分編集する。レポートの下書き、設定ファイルの修正、データの整形など、ファイルを扱う作業を任せられます。

タスクの自動化・予約実行

cronjob ツールで定期タスクを設定できます。「毎日 18 時にプロジェクトの進捗をまとめて」「週に 1 回、競合サイトの更新をチェックして」のような定期業務を AI に任せられる。

外部ツール連携(MCP)

MCP(Model Context Protocol)経由で外部ツールサーバーに接続できます。GitHub、データベース、ファイルシステム、各種 API を MCP サーバーとして接続すれば、Hermes Agent のツールとして使える。hermes mcp コマンドで Nous 承認済みの MCP カタログからワンクリックインストールも可能です。

サブエージェントへの作業委任

delegate_task ツールで、最大 3 つの並行サブエージェントにタスクを分割できます。大きなリサーチを 3 方向に分けて同時に走らせる、といった使い方。

メディア処理

画像生成(FLUX 2、GPT-Image 2 など 9 モデル対応)、動画生成・分析、テキスト音声変換(Edge TTS 無料版含む 10 プロバイダ対応)。マルチモーダルな作業もカバーしています。

AI モデルの切り替え

300 以上のモデルに対応。hermes model コマンドで Anthropic(Claude)、OpenAI(GPT)、Google(Gemini)、DeepSeek、Ollama(ローカル)など自由に切り替えられます。コードの変更は不要。ローカルモデルを使えば API コストゼロで運用できます。

性格のカスタマイズ

SOUL.md というファイルで、エージェントの性格や振る舞いを定義できます。「端的に話して」「不確実なことは正直に言って」「悪いアイデアにはちゃんと反対して」のように、自分好みにチューニングできる。プリセットも 14 種類用意されています。

こういう人に向いていると思う

ここからは公式情報を踏まえた上での、私の受け止め方です。

Hermes Agent はかなり多機能ですが、全員に必要かというとそうではないと思います。向いているのは、たぶんこういう人。

  • AI に「作業」を任せたい人:会話だけじゃなくて、調査・ファイル作成・定期タスクを実際にやってほしい。チャット AI の「ここまではできるけど、その先は自分で」という壁にストレスを感じている人
  • 複数のプラットフォームで AI を使いたい人:Telegram で指示して Discord で報告を受け取る、みたいな使い方。CLI だけに閉じないのは大きい
  • ローカルモデルで動かしたい人:Ollama や llama.cpp 対応なので、API 課金なしでエージェントを動かせる。プライバシーが気になる作業にも向いている
  • AI エージェントの仕組みを理解したい開発者:オープンソースで中身が全部見える。スキルシステム、メモリ設計、MCP 連携の実装を読むだけでも勉強になる

逆に、「AI と会話できれば十分」「ファイル操作やコード実行は不要」「セットアップに時間をかけたくない」という人には、ChatGPT や Claude のチャット画面のほうが合うと思います。

副業・個人開発にはどう使えるか

AIニュースラボの読者向けに、副業・個人開発での使い道を考えてみます。

  • リサーチ業務の自動化:「○○の市場動向を調べて、表にまとめて」を Hermes Agent に任せて、自分はレビューと判断に集中する。クライアントワークの下調べを効率化できます
  • ブログ運営の補助:ネタ収集、競合調査、下書きの素材集め、SEO 分析を定期タスクとして設定する。毎朝 AI がネタリストを用意してくれる運用も組める
  • 個人開発のアシスタント:コード生成 + テスト + デバッグのサイクルを Hermes Agent に回させる。Docker バックエンドを使えば開発環境を隔離したまま作業できる
  • AI エージェント運用の知見を発信する:Hermes Agent を使いこなした経験をブログや SNS で発信する。日本語で Hermes Agent について書いている人はまだ少ないので、検索流入を取りやすい

注意

「Hermes Agent を入れれば副業がすぐ成立する」わけではありません。まず自分の作業フローのどこを AI に任せたいかを整理して、小さなタスクから試すのが現実的です。

「AI エージェントを使いこなせる」こと自体が価値になる時代

ここは少し大きな話になりますが、「AI エージェントのセットアップと運用ができる」こと自体が、今後スキルとして価値を持つようになると感じています。

  • AI エージェント運用コンサルティング:「Hermes Agent でこういうタスクを自動化したい」という相談に乗って、設計・構築する。MCP の接続設計やスキルのカスタマイズまで含めたサービス
  • スキルパックの開発・公開:特定業務に特化したスキルを SKILL.md として設計し、agentskills.io で公開する。他のユーザーがインストールして使えるので、エコシステムへの貢献がそのまま実績になる
  • 日本語チュートリアル:セットアップから運用まで、日本語で体系的に解説するコンテンツ。Hermes Agent の日本語情報はまだほとんどないので、先に書いた人が有利

ただし、Hermes Agent は v0.14.0(2026 年 5 月)で、まだ急速に開発が進んでいるプロジェクトです。仕様変更のペースが速いので、コンテンツは更新し続ける前提で組む必要があります。

始めるために必要なもの

セットアップの詳細は Part 2 で扱いますが、「始めるのにどれくらい必要なのか」だけ先にお伝えしておきます。

最低限必要なもの

  • PC:Linux / macOS / WSL2 が推奨。Windows ネイティブは早期ベータ
  • Python 3.11+:インストールスクリプトが自動で入れてくれる
  • LLM の API キー:Anthropic(Claude)、OpenAI、Google、DeepSeek など。ローカルモデル(Ollama 等)なら API キー不要

コスト感

  • Hermes Agent 本体:無料(MIT ライセンス)
  • LLM API:使うモデルとタスク量による。Claude Sonnet で日常的なタスクを回すなら月 $5〜$20 が目安。ローカルモデルなら $0
  • オプション:Nous Portal(300+ モデル統合サービス)を使うと、API キーの管理が楽になる

必要なスキル

  • CLI(ターミナル)の基本操作ができること
  • API キーの取得・設定ができること
  • 英語のドキュメントを読む抵抗が少ないこと(現時点で日本語ドキュメントはほぼない)

プログラミング経験は「あった方がいい」けど必須ではないです。ターミナルで pip install hermes-agent が打てれば、最低限のスタートは切れます。

まだ注意が必要なこと

ここは正直に書きます。

  • 何でも自動化できるわけではない:ツールが 40 以上あっても、想定外のタスクではうまく動かないことがある。特に複雑な判断が必要な場面では、人間の確認が不可欠です
  • AI の出力は必ず確認する:コードを書いて実行までできるということは、間違ったコードも実行される可能性がある。Docker バックエンドで実行環境を隔離するなど、安全策を取ることを推奨します
  • メモリの設計は自分で考える必要がある:Core Memory は約 1,300 トークン。何を覚えさせて何を忘れさせるかのルールは、自分で決める必要がある。全部覚えさせようとすると溢れます
  • セキュリティ・機密情報には慎重に:Hermes Agent はデータ収集やテレメトリを行わない設計ですが、接続する LLM プロバイダには会話が送信されます。機密情報を扱う場合はローカルモデルの利用を検討してください
  • 英語前提:公式ドキュメント、エラーメッセージ、コミュニティ(Discord)はすべて英語。日本語の情報は、この記事を含めてまだごくわずかです
  • 開発途上:v0.14.0 はまだメジャーバージョン 1.0 に達していません。破壊的な変更が入る可能性は念頭に置いてください
Hermes Agentでできることを整理した機能マップ。Research・Memory・Tools・Code・Workflow・Files・Review・Automation・MCPの9カテゴリが中央のエージェントを囲む

私は Hermes Agent を「作業パートナー」として見ている

Hermes Agent のドキュメントを読み込んでいて、一番印象に残ったのは「The Agent That Grows With You」というキャッチコピーでした。

最初は正直、「よくあるマーケティングコピーかな」と思っていたんですが、スキルの自動生成、7 日サイクルの評価・淘汰、セッションをまたぐ記憶、cron による自律動作。これらの仕組みを一つひとつ見ていくと、「成長する」という表現がただのコピーじゃなくて、設計として実装されていることが分かった。

私の受け止め方としては、Hermes Agent は「万能ツール」ではなく「作業パートナー」。最初はぎこちないけど、使い続けるとこちらの仕事の進め方を覚えて、少しずつ頼れるようになっていく。そういうタイプの AI だと思います。

ただし、いきなり全機能を使おうとすると確実につまずきます。最初はターミナルで簡単な調査タスクを 1 つ任せるところから。それがうまくいったら、次はメモリの設定、その次は MCP で外部ツールをつなぐ。段階的に広げていくのが現実的です。

前回の記事で紹介した GBrainObsidian との 3 層設計も、Hermes Agent 単体を理解した上で初めて意味が出てきます。まずは Part 1 の「何ができるか」を押さえてから、Part 2 以降で手を動かしていきましょう。

私自身、次の Part 2 に向けて実際にインストールして触ってみるつもりです。触った上で「ここはドキュメント通りにいかなかった」「ここは想像以上に楽だった」を Part 2 でそのまま書きます。

参考にしたもの