Browser Use Agent 使用自然語言描述任務目標,並透過大型語言模型(LLM)自主操作瀏覽器。
輸入 OpenAI 或 Google 的 API 金鑰。支援 %VARIABLE% 格式。
%VARIABLE%
OpenAI API Key: 請參閱 https://platform.openai.com/api-keysarrow-up-right
Google API Key: 請參閱 https://ai.google.dev/gemini-api/docs/api-keyarrow-up-right
目前支援以下模型:
OpenAI
o3, gpt-4.1, gpt-4.1-mini
Google
gemini-2.5-pro, gemini-2.5-flash, gemini-2.0-flash
一般來說, 使用上述模型會依使用量計費。詳細計費資訊請參閱:OpenAI: https://openai.com/pricingarrow-up-rightGoogle Gemini: https://ai.google.dev/gemini-api/docs/pricingarrow-up-right
一般來說, 使用上述模型會依使用量計費。詳細計費資訊請參閱:
OpenAI: https://openai.com/pricingarrow-up-right
Google Gemini: https://ai.google.dev/gemini-api/docs/pricingarrow-up-right
設定代理最多可執行的動作次數。範圍為 1–100。
設定代理的操作範圍限制:
SAME PAGE: 僅限目前網頁
SAME SITE: 僅限同一網域中的網頁
因為使用模型會依使用量計費,建議適當的設定 MAX ACTION 與 GUARDRAIL 參數來避免預期外的花費。
用自然語言描述任務。
由模型判斷並執行的下一步瀏覽器操作。 每個步驟都會自動擷取螢幕畫面,並儲存至工作資料夾中以供追蹤與檢視。
目標: 用特定選項操作下方網頁中的搜尋引擎
使用自然語言提示模型:
Result:
最后更新于6个月前
这有帮助吗?