Browser Use Agent
Browser Use Agent 使用自然語言描述任務目標,並透過大型語言模型(LLM)自主操作瀏覽器。

API KEY
輸入 OpenAI 或 Google 的 API 金鑰。支援 %VARIABLE%
格式。
OpenAI API Key: 請參閱 https://platform.openai.com/api-keys
Google API Key: 請參閱 https://ai.google.dev/gemini-api/docs/api-key
MODEL
目前支援以下模型:
平台
Model
OpenAI
o3, gpt-4.1, gpt-4.1-mini
gemini-2.5-pro, gemini-2.5-flash, gemini-2.0-flash
一般來說, 使用上述模型會依使用量計費。詳細計費資訊請參閱:
OpenAI: https://openai.com/pricing
Google Gemini: https://ai.google.dev/gemini-api/docs/pricing
MAX ACTION
設定代理最多可執行的動作次數。範圍為 1–100。
GUARDRAIL
設定代理的操作範圍限制:
SAME PAGE: 僅限目前網頁
SAME SITE: 僅限同一網域中的網頁
因為使用模型會依使用量計費,建議適當的設定 MAX ACTION 與 GUARDRAIL 參數來避免預期外的花費。
GOAL
用自然語言描述任務。
ACTION
由模型判斷並執行的下一步瀏覽器操作。 每個步驟都會自動擷取螢幕畫面,並儲存至工作資料夾中以供追蹤與檢視。
Example
目標: 用特定選項操作下方網頁中的搜尋引擎

使用自然語言提示模型:

Result:

Last updated