AI工具

Fireworks f1:復合AI模型融合多元開源技術以應對復雜推理挑戰

Fireworks f1是Fireworks公司推出的復合AI模型,針對復雜推理任務設計。基于在推理層融合多個開放模型,實現超越單一模型的性能和可靠性。f1模型支持開發者用...
閱讀原文

Skyo:智能語音助手引領實時對話新時代

Skyo是昆侖萬維推出的智能實時語音對話助手,具備快速響應和多語言對話能力,能主動發起對話并實時打斷。擁有情感化反應和個性化聲音定制功能,提供溫暖貼心...
閱讀原文

AgileGen:智能代碼自動生成與原型設計的創新解決方案

AgileGen是生成式軟件開發框架,通過人與AI協作增強軟件的創建過程。AgileGen包含兩個核心部分:終端用戶決策制定和AgileGen智能體。框架用Gherkin語言設計和...
閱讀原文

OmniSearch:多模態智能檢索與生成技術的全面升級

OmniSearch是阿里巴巴通義實驗室推出的多模態檢索增強生成框架,具備自適應規劃能力。OmniSearch能動態拆解復雜問題,根據檢索結果和問題情境調整檢索策略,...
閱讀原文

Perplexica:智能開源AI搜索引擎實現多模式搜索與實時信息更新

Perplexica是開源的AI驅動搜索引擎,是Perplexity AI的開源替代品。基于機器學習算法和自然語言處理技術理解用戶查詢,提供精確答案。Perplexica支持多種搜索...
閱讀原文

Memoripy:智能記憶管理庫助力上下文感知的AI應用開發

Memoripy是一個Python庫,為AI應用提供上下文感知的記憶管理。Memoripy支持短期和長期記憶存儲,兼容OpenAI和Ollama API。核心功能包括記憶檢索、概念提取、...
閱讀原文

AnimateAnything:創新統一可控視頻生成技術提升內容創作效率

AnimateAnything是浙江大學和北京航空航天大學研究者推出的統一可控視頻生成技術。AnimateAnything能精確操作視頻,包括控制相機軌跡、文本提示和用戶動作注...
閱讀原文

抖音AI分身:打造你的虛擬分身,開啟創作新紀元的AI工具

抖音AI分身是抖音“V項目”中專為創作者推出的AI虛擬分身工具,支持創作者培養與自己性格和思維習慣相似的虛擬分身,與用戶進行互動。抖音AI分身基于豆包大模型...
閱讀原文

RAG-Diffusion:區域感知文本到圖像生成技術的創新應用與優勢分析

RAG-Diffusion是南京大學團隊推出的區域感知文本到圖像生成方法。基于區域硬綁定和區域軟細化兩個階段,實現對圖像中各個區域的精確控制和細節優化。RAG-Diff...
閱讀原文

FitDiT:騰訊與復旦攜手打造的高保真虛擬試穿技術實現無縫體驗與精準匹配

FitDiT是高保真虛擬試穿技術,是騰訊和復旦大學聯合推出的。基于Diffusion Transformers(DiT)關注高分辨率特征,提升服裝細節的呈現。FitDiT用服裝紋理提取...
閱讀原文

口語達人:游戲化學習助力口語能力飛躍提升

口語達人是專為非英語國家人士設計的英語學習應用,旨在幫助用戶提升英語口語能力。通過游戲化的學習方式,將日常生活場景劃分為多個單元,涵蓋旅行、購物、...
閱讀原文

桐小烏:桐鄉市AI智能助手助力便民服務提升生活效率

桐小烏是桐鄉市人民政府與支付寶合作推出的智能體,國內首個集會務與文旅服務于一體的智能助手。為2024年世界互聯網大會參會者和烏鎮游客提供全面的服務,包...
閱讀原文

Copilot Actions:微軟推出智能助手簡化重復任務,提高工作效率

Copilot Actions 是微軟在 Ignite 大會上推出的?Microsoft 365 Copilot一項新功能,支持用戶用簡單的提示自動完成日常的重復性任務,如總結 Teams 會議、生成...
閱讀原文

閃令:沉浸式角色扮演與劇情探索的無限可能

閃令是互動內容社交平臺,為年輕人打造的AI劇情社區。用戶進行高自由度的角色扮演和劇情體驗,選擇古風、同人、穿越等多種劇情故事。閃令提供有聲互動和情感...
閱讀原文

Documind:高效PDF轉圖像工具助力結構化數據提取

Documind是開源的AI文檔處理工具,能從PDF文檔中提取結構化數據。Documind具備將PDF轉換為圖像、用OpenAI API進行信息提取,根據用戶定義的模式格式化輸出結...
閱讀原文