AI工具
桐小烏:桐鄉(xiāng)市AI智能助手助力便民服務(wù)提升生活效率
桐小烏是桐鄉(xiāng)市人民政府與支付寶合作推出的智能體,國內(nèi)首個(gè)集會(huì)務(wù)與文旅服務(wù)于一體的智能助手。為2024年世界互聯(lián)網(wǎng)大會(huì)參會(huì)者和烏鎮(zhèn)游客提供全面的服務(wù),包...
Copilot Actions:微軟推出智能助手簡化重復(fù)任務(wù),提高工作效率
Copilot Actions 是微軟在 Ignite 大會(huì)上推出的?Microsoft 365 Copilot一項(xiàng)新功能,支持用戶用簡單的提示自動(dòng)完成日常的重復(fù)性任務(wù),如總結(jié) Teams 會(huì)議、生成...
閃令:沉浸式角色扮演與劇情探索的無限可能
閃令是互動(dòng)內(nèi)容社交平臺,為年輕人打造的AI劇情社區(qū)。用戶進(jìn)行高自由度的角色扮演和劇情體驗(yàn),選擇古風(fēng)、同人、穿越等多種劇情故事。閃令提供有聲互動(dòng)和情感...
Documind:高效PDF轉(zhuǎn)圖像工具助力結(jié)構(gòu)化數(shù)據(jù)提取
Documind是開源的AI文檔處理工具,能從PDF文檔中提取結(jié)構(gòu)化數(shù)據(jù)。Documind具備將PDF轉(zhuǎn)換為圖像、用OpenAI API進(jìn)行信息提取,根據(jù)用戶定義的模式格式化輸出結(jié)...
MARS:提升大模型訓(xùn)練效率的字節(jié)優(yōu)化框架解析
MARS(Make vAriance Reduction Shine)是字節(jié)跳動(dòng)推出的創(chuàng)新的優(yōu)化框架,提升大型模型訓(xùn)練的效率。MARS融合預(yù)條件梯度方法與方差減少技術(shù),基于縮放隨機(jī)遞歸...
Verifier Engineering:創(chuàng)新后訓(xùn)練范式推動(dòng)產(chǎn)品智能化與個(gè)性化升級
Verifier Engineering(驗(yàn)證器工程)是中國科學(xué)院、阿里巴巴和小紅書聯(lián)合推出的新型后訓(xùn)練范式,為基礎(chǔ)模型設(shè)計(jì),解決提供有效監(jiān)督信號的挑戰(zhàn)。Verifier Engi...
眾影AI:智能動(dòng)畫創(chuàng)作:從劇本與音頻到視覺作品的自動(dòng)生成
眾影AI是AI視頻生成工具,專注于輕動(dòng)畫創(chuàng)作。基于自研的大模型自動(dòng)分析劇本或音頻,能一鍵生成角色表演,平均1分鐘內(nèi)完成視頻制作。適于多種創(chuàng)作場景,如夫妻...
Vidu 1.5:生數(shù)科技發(fā)布支持多主體一致性的多模態(tài)大規(guī)模模型
Vidu 1.5是生數(shù)科技推出的AI視頻生成平臺最新版本,致力于幫助創(chuàng)作者自由表達(dá)和高效創(chuàng)作。具備多模態(tài)視頻大模型,支持參考生視頻、圖生視頻和文生視頻,確保...
AgentReview:基于大語言模型代理的同行評審過程模擬框架
AgentReview是基于大型語言模型(LLM)的框架,模擬學(xué)術(shù)同行評審過程。AgentReview基于LLM代理模擬評審者、作者和領(lǐng)域主席的角色,支持研究者在尊重隱私的同...
CHANGER:利用AI換頭技術(shù)實(shí)現(xiàn)演員與目標(biāo)身體的完美融合
CHANGER是工業(yè)級超自然AI換頭與色鍵技術(shù),用在數(shù)字內(nèi)容創(chuàng)作中將演員頭部無縫集成到目標(biāo)身體上,適于視覺特效、數(shù)字人類創(chuàng)建和虛擬化身。CHANGER基于色鍵技術(shù)...
Kiroku:多智能體系統(tǒng)下學(xué)生與導(dǎo)師的互動(dòng)與文檔協(xié)作模擬研究
Kiroku是多智能體系統(tǒng),輔助用戶組織和撰寫文檔。靈感源自創(chuàng)始人在斯坦福大學(xué)攻讀博士期間的學(xué)術(shù)寫作經(jīng)歷,Kiroku模擬學(xué)生與導(dǎo)師間的互動(dòng),幫助用戶快速生成...
Vision Search Assistant:結(jié)合視覺語言模型與網(wǎng)絡(luò)代理搜索技術(shù)的開源框架研究
Vision Search Assistant(VSA)是結(jié)合視覺語言模型(VLMs)和網(wǎng)絡(luò)代理的框架,提升模型對未知視覺內(nèi)容的理解能力。基于互聯(lián)網(wǎng)檢索,使VLMs處理和回答有關(guān)未...
可栗口語:在線外教一對一,模擬雅思口語考試環(huán)境
可栗口語是基于AI技術(shù)的英語口語學(xué)習(xí)平臺,提供AI虛擬外教進(jìn)行一對一的口語練習(xí),支持實(shí)時(shí)語法和發(fā)音糾正。可栗口語包含豐富的實(shí)用場景,如日常生活、留學(xué)、...
MVDrag3D:南洋理工大學(xué)發(fā)布的可視化拖拽3D多視角編輯技術(shù)
MVDrag3D是創(chuàng)新的3D編輯框架,結(jié)合多視圖生成和重建先驗(yàn)實(shí)現(xiàn)靈活且富有創(chuàng)造性的拖拽編輯。框架用多視圖擴(kuò)散模型作為生成先驗(yàn),確保在多個(gè)渲染視圖間進(jìn)行一致...
Mubert:個(gè)性化音樂生成平臺:AI助力打造專屬旋律
Mubert是AI音樂生成平臺,提供免版稅音樂曲目,適用于視頻、播客、應(yīng)用等。Mubert包括Mubert Render(為創(chuàng)作者生成AI音軌)、Mubert Studio(藝術(shù)家貢獻(xiàn)樣本...
粵公網(wǎng)安備 44011502001135號