2.8 KiB
BrowserUse_and_ComputerUse_skills
Чтобы запустить tool browser-use вместе с hermes agent тебе нужно выполнить следующие действия
git clone https://git.lambda.coredump.ru/APEX/BrowserUse_and_ComputerUse_skills.git
git switch feature/telegram-browser-integration
touch .env
В создавшемся .env файле заполните переменные в соответствии с шаблоном, расположенном в .env.example BROWSER_VIEW_URL заполняется после запуска
docker compose up -d --build
docker compose logs tunnel
После команды логов листаешь терминал и ищешь ссылку https в рамке. Её вписываешь в переменную BROWSER_VIEW_URL. Чтобы увидеть действия агента, переходишь по данной сслыке и выбираешь vnc.html.
Выбор браузера
Browser-use контейнер поддерживает два движка через одну и ту же CDP/noVNC схему:
BROWSER_ENGINE=chromium
chromium — обычный локальный Chromium, используется по умолчанию.
BROWSER_ENGINE=cloak
cloak — CloakBrowser stealth-режим для задач, где важны fingerprint,
WebGL/Canvas/OS/CDP-сигналы и антибот-проверки. Telegram live-логи, noVNC,
CDP-порт 9222 и browser-use RPC остаются теми же.
Дополнительные настройки CloakBrowser в .env:
CLOAK_HEADLESS=false
CLOAK_HUMANIZE=true
CLOAK_HUMAN_PRESET=default
CLOAK_PROXY=
CLOAK_GEOIP=false
CLOAK_ARGS=
После смены BROWSER_ENGINE пересобери и перезапусти контейнеры:
docker compose up -d --build
Далее в мессенджере просишь агента сделать что-то через tool browser-use.
Во время выполнения Hermes будет обновлять одно progress-сообщение в Telegram:
текущая страница, короткие действия, ошибки и просьба помочь, если замечена капча
или антибот-проверка. Частоту и объем можно настроить через
BROWSER_LIVE_LOG_POLL_INTERVAL и BROWSER_LIVE_LOG_MAX_EVENTS в .env.
Возможно придётся перезапустить контейнеры, но при перезапуске контейнеров меняется ссылка.
docker compose down
docker compose up -d