Browser Use Agent

Browser Use Agent 使用自然語言描述任務目標,並透過大型語言模型(LLM)自主操作瀏覽器。

API KEY

輸入 OpenAI 或 Google 的 API 金鑰。支援 %VARIABLE% 格式。

MODEL

目前支援以下模型:

平台
Model

OpenAI

o3, gpt-4.1, gpt-4.1-mini

Google

gemini-2.5-pro, gemini-2.5-flash, gemini-2.0-flash

一般來說, 使用上述模型會依使用量計費。詳細計費資訊請參閱:

MAX ACTION

設定代理最多可執行的動作次數。範圍為 1–100。

GUARDRAIL

設定代理的操作範圍限制:

  • SAME PAGE: 僅限目前網頁

  • SAME SITE: 僅限同一網域中的網頁

因為使用模型會依使用量計費,建議適當的設定 MAX ACTIONGUARDRAIL 參數來避免預期外的花費。

GOAL

用自然語言描述任務。

ACTION

由模型判斷並執行的下一步瀏覽器操作。 每個步驟都會自動擷取螢幕畫面,並儲存至工作資料夾中以供追蹤與檢視。

Example

目標: 用特定選項操作下方網頁中的搜尋引擎

使用自然語言提示模型:

Result:

Last updated