AI工具

IterComp

IterComp是一個由清華大學、北京大學、LibAI Lab、中國科學技術大學、牛津大學和普林斯頓大學的研究人員聯合推出的文本到圖像生成框架。基于迭代反饋學習機制...
閱讀原文

陌生人鬧鐘

陌生人鬧鐘是一款創新的鬧鐘應用,通過AI技術連接全球用戶,讓用戶每天早晨被隨機陌生人的語音喚醒。這款應用的特點包括AI內容過濾、自定義鬧鐘設置、聲音收...
閱讀原文

SoulGen

SoulGen是一個基于AI的藝術生成平臺,支持用戶基于文本提示創造獨特的圖像。工具基于深度學習技術,根據用戶提供的描述生成高質量的藝術作品,支持多種風格,...
閱讀原文

LayerSkip

LayerSkip是一種用在加速大型語言模型(LLMs)推理過程的技術。基于在訓練階段應用層dropout和早期退出損失,讓模型在推理時從早期層開始更準確地退出,不需...
閱讀原文

Spirit LM

Spirit LM是由Meta AI團隊推出的一種多模態語言模型,能無縫地混合文本和語音數據。Spirit LM基于一個預訓練的文本語言模型,用持續在文本和語音單元上的訓練...
閱讀原文

Story-Adapter

Story-Adapter 是一種新型的長篇故事可視化框架,能在保持語義一致性的同時,生成高質量且具有細膩交互的故事圖像序列。通過迭代方式,基于全局參考交叉注意...
閱讀原文

LOKI

LOKI是由中山大學和上海AI Lab聯合提出的合成數據檢測基準,旨在全面評估大型多模態模型(LMMs)在識別視頻、圖像、3D、文本和音頻等多種模態合成數據的能力...
閱讀原文

NotesGPT

NotesGPT是一款開源的AI驅動語音筆記工具,能將用戶的語音筆記快速轉錄成文本,自動生成行動項。工具基于包括Convex數據庫、Next.js框架、Together推理模型、...
閱讀原文

Browse AI

Browse AI是一款革命性的無代碼網頁數據提取工具,運用人工智能技術,讓用戶能夠快速從任何網站上抓取和監控數據,無需編寫代碼。用戶通過簡單的點擊操作即可...
閱讀原文

MEXMA

MEXMA是由Meta AI推出的一種新型的預訓練跨語言句子編碼器。基于結合句子級和詞語級的目標提升句子表示的質量。在訓練過程中,MEXMA用一種語言的句子表示預測...
閱讀原文

Lingua

Lingua 是 Meta AI推出的一個輕量級且獨立的代碼庫,旨在助力大規模訓練語言模型。基于易于修改的 PyTorch 組件,便于研究人員嘗試新的模型架構、損失函數和...
閱讀原文

VideoAgent

VideoAgent是一種自改進的視頻生成系統,由斯坦福大學、滑鐵盧大學、DeepMind等機構的研究人員共同推出。根據圖像觀察和語言指令生成視頻計劃,轉換為機器人...
閱讀原文

Llama Tutor

Llama Tutor 是一個基于AI的個性化學習平臺,由 Llama 3.1 和 Together AI 技術驅動,是一個完全開源的項目。支持用戶輸入想要學習的主題和教育水平,生成一...
閱讀原文

ComfyGen

ComfyGen是由NVIDIA和特拉維夫大學研究人員推出的一種文本到圖像生成系統,基于大型語言模型(LLM)自動創建與用戶文本提示相匹配的工作流,提升圖像生成的質...
閱讀原文

restorePhotos.io

restorePhotos.io 是一個開源的AI項目,專注于修復老舊和模糊的人臉照片。用GFPGAN機器學習模型,基于Next.js API路由處理上傳的照片,再返回修復后的照片。...
閱讀原文