標簽:上下文理解

Fluently

Fluently 是 AI英語學習應用,幫助用戶提升英語水平。Fluently基于評估用戶的英語能力,生成個性化學習計劃,涵蓋發音、語法、詞匯和流利度等方面。用戶在真...
閱讀原文

MT-MegatronLM

MT-MegatronLM 是摩爾線程推出的面向全功能 GPU 的開源混合并行訓練框架,主要用于高效訓練大規模語言模型。支持 dense 模型、多模態模型及 MoE(混合專家)...
閱讀原文

COMET

COMET是字節跳動推出的針對Mixture-of-Experts(MoE)模型的優化系統,能解決分布式訓練中通信開銷過大的問題。基于細粒度的計算-通信重疊技術,COMET將通信...
閱讀原文

BGE-VL

BGE-VL 是北京智源研究院聯合多所高校推出的多模態向量模型,基于大規模合成數據 MegaPairs 訓練而成。BGE-VL專注于多模態檢索任務,如圖文檢索和組合圖像檢...
閱讀原文

Pika 2.2

Pika 2.2 是 Pika Labs 推出的升級版 AI 視頻生成工具,基于深度學習技術,能將圖片或文字提示轉化為高質量的視頻內容。與前代版本相比,Pika 2.2 在功能和性...
閱讀原文

Gemini Code Assist

Gemini Code Assist 是 Google 推出的 AI 編程工具,能幫助開發者更高效地編寫代碼、提升代碼質量。Gemini Code Assist 基于 Gemini 2.0 模型,支持所有公開...
閱讀原文

MME-CoT

MME-CoT 是香港中文大學(深圳)、香港中文大學、字節跳動、南京大學、上海人工智能實驗室、賓夕法尼亞大學、清華大學等機構共同推出的用于評估大型多模態模...
閱讀原文

ConverzAI

ConverzAI是基于AI技術優化招聘流程的平臺。ConverzAI基于部署虛擬招聘人員(AI Agents),幫助企業在商業、醫療保健和專業招聘領域實現招聘流程的自動化和優...
閱讀原文

AnyCharV

AnyCharV 是香港中文大學、清華大學深圳國際研究生院、香港大學聯合推出的角色可控視頻生成框架,能將任意參考角色圖像與目標驅動視頻相結合,生成高質量的角...
閱讀原文

RAG-FiT

RAG-FiT(曾用名RAG Foundry)是英特爾實驗室推出的開源框架,用在微調(fine-tuning)增強大型語言模型(LLMs)在檢索增強生成(RAG)任務中的表現。RAG-FiT...
閱讀原文

LlamaV-o1

LlamaV-o1是阿聯酋穆罕默德·本·扎耶德人工智能大學等機構提出的新多模態視覺推理模型,旨在提升大型語言模型的逐步視覺推理能力。引入視覺推理鏈基準測試VRC-...
閱讀原文

什么是智能體RAG(Agentic RAG)

智能體RAG(Agentic RAG)是一種結合了AI智能體(Agent)和檢索增強生成(RAG)系統的方法。它通過引入智能體框架來改變處理問答方式的技術。與僅依賴大模型...
閱讀原文

日日新融合大模型

“日日新”融合大模型(SenseNova)是商湯科技于2025年1月10日正式推出的多模態大模型。模型實現了原生融合模態,深度推理能力與多模態信息處理能力均大幅提升...
閱讀原文

NMT

NMT(No More Tuning)是UC Berkeley和阿里巴巴集團聯合推出的多任務學習框架,能解決多任務學習中不同任務優先級優化的問題。NMT將多任務學習問題轉化為約束...
閱讀原文

Psi R0

Psi R0是靈初智能發布的首個基于強化學習的端到端具身模型。支持雙靈巧手協同進行復雜操作,能夠將多個技能串聯混訓,生成具有推理能力的智能體,完成并閉環...
閱讀原文