Browser Use Agent

Browser Use Agent 使用自然語言描述任務目標，並透過大型語言模型(LLM)自主操作瀏覽器。

輸入 OpenAI 或 Google 的 API 金鑰。支援 %VARIABLE% 格式。

目前支援以下模型：

平台

Model

OpenAI

o3, gpt-4.1, gpt-4.1-mini

Google

gemini-2.5-pro, gemini-2.5-flash, gemini-2.0-flash

一般來說，使用上述模型會依使用量計費。詳細計費資訊請參閱：
OpenAI: https://openai.com/pricing
Google Gemini: https://ai.google.dev/gemini-api/docs/pricing

設定代理最多可執行的動作次數。範圍為 1–100。

設定代理的操作範圍限制：

因為使用模型會依使用量計費，建議適當的設定 MAX ACTION 與 GUARDRAIL 參數來避免預期外的花費。

用自然語言描述任務。

由模型判斷並執行的下一步瀏覽器操作。每個步驟都會自動擷取螢幕畫面，並儲存至工作資料夾中以供追蹤與檢視。

目標: 用特定選項操作下方網頁中的搜尋引擎

使用自然語言提示模型:

Result:

Last updated 5 months ago