
原標題:截胡OpenAI!清華復旦等搶先開源智能體框架Eko,一句話打造「虛擬員工」
文章來源:新智元
內容字數:6728字
Eko:革新生產級智能體開發框架
本文概要介紹Eko,一個由清華、復旦和斯坦福的研究者聯合開發的Agent開發框架。Eko旨在幫助開發者快速構建可用于生產環境的“虛擬員工”,以自動化完成各種任務,從簡單的指令到復雜的工作流程。它通過創新技術,實現了高效、靈活且安全的自動化工作流程,搶先一步超越了OpenAI計劃于2025年推出的“虛擬員工計劃”Operator。
核心技術創新
Eko的三大核心技術創新使其脫穎而出:
1. 混合智能體表示 (Mixed Agentic representation):Eko無縫結合了自然語言(高層次設計)和程序語言(低層次實現),簡化了開發流程。開發者可以使用自然語言描述任務,同時利用代碼實現細節控制。
2. 跨平臺Agent框架:Eko采用環境感知架構,支持瀏覽器、電腦以及瀏覽器插件等多種平臺,開發者只需編寫一套代碼即可在不同環境中運行。
3. 生產級干預機制:不同于強調完全自主性的現有Agent框架,Eko提供了顯性的生產級干預機制,允許開發者隨時中斷和調整智能體的工作流程,確保對生產環境的有效監管和控制。
易用性與實際應用
Eko的易用性令人印象深刻。只需一句話,即可讓Eko生成一個完整的Agent來執行復雜任務,例如股票分析或自動化測試。例如,一句“在雅虎財經上收集納斯達克的最新數據,包括主要股票的價格變化、市值、交易量,分析數據并生成可視化報告”就能啟動一個完整的股票分析Agent。
文章還提供了當前登錄頁面自動化測試的例子,展示了Eko如何輕松處理復雜的測試流程,并生成測試報告。
架構設計
Eko的跨平臺能力源于其環境感知架構,該架構由三個關鍵層次構成:
1. 通用核心 (Universal Core):提供與環境無關的基本功能,如工作流管理、工具注冊管理、LLM集成和鉤子系統。
2. 環境特定工具 (Environment-Specific Tools):為每種環境(瀏覽器擴展、Web環境、Node.js環境等)提供優化的工具集。
3. 環境橋接 (Environment Bridge):負責環境檢測、工具注冊、資源管理和安全控制,確保不同平臺間的順利交互。
安全性和訪問控制
Eko在安全性方面也考慮周全。它針對不同環境實施了適當的安全措施,例如瀏覽器擴展和Web環境采用嚴格的權限控制和API密鑰管理,而Node.js環境則基于用戶權限進行文件操作和命令執行,并提供執行前的用戶確認機制。
層次化規劃與優化
Eko采用層次化感知框架,將任務拆解為Planning layer和Execution layer。Planning layer負責將用戶需求分解成任務圖,Execution layer則根據任務圖調用LLM合成具體的執行行為和工具調用。Eko還實現了多步合并優化,提高了推理速度。
視覺-交互要素聯合感知 (VIEP)
Eko的VIEP技術顯著提升了瀏覽器自動化任務的準確性和效率。它通過結合視覺識別和元素上下文信息,精確定位并操作網頁交互元素,并通過生成精簡的偽HTML結構,降低了資源消耗和處理難度,大幅提升了自動化操作的處理速度和精準度。
生產級的可干預機制
Eko的鉤子系統允許開發者在工作流執行前后插入自定義邏輯,從而實現對自動化流程的監控、調整和干預。它提供了三種不同層級的鉤子:工作流鉤子、子任務鉤子以及工具鉤子,滿足不同的監控和干預需求。
總結
Eko是一個功能強大且易于使用的Agent開發框架,它為開發者提供了構建生產級“虛擬員工”的有效工具,顯著提升工作效率和質量。其創新技術和易用性使其成為自動化領域的一大進步。
聯系作者
文章來源:新智元
作者微信:
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。

粵公網安備 44011502001135號