標簽:上下文理解

Champ

Champ是由阿里巴巴、復旦大學和南京大學的研究人員共同提出的一種基于3D的將人物圖片轉換為視頻動畫的模型,該方法結合了3D參數化模型(特別是SMPL模型)和潛...
閱讀原文

GPT-4o

GPT-4o是OpenAI最新推出的一款先進的人工智能模型,具備強大的多模態推理能力,能夠處理語音、文本和視覺信息。該模型能夠實時響應用戶輸入,并且在音頻交互...
閱讀原文

GLM-4-long

GLM-4-long 是智譜AI推出的200萬字長文本模型,現已在 智譜AI開放平臺 BigModel 上開放API調用。支持超長輸入專為處理超長文本和記憶型任務設計,上下文長度...
閱讀原文

Grok-2

Grok-2是xAI公司推出的新一代AI模型,提供卓越的聊天、編程和推理能力。在學術基準測試中,Grok-2在GPQA、MMLU、MMLU-Pro和MATH等領域的表現超越了前代Grok-1...
閱讀原文

NextChat

NextChat是一個基于 Next.js 和 Vercel 的開源項目,支持用戶將 ChatGPT 等 AI 大模型集成到自己的網頁應用中。NextChat不僅提供了現成的代碼庫,還支持一鍵...
閱讀原文

OmniCorpus

OmniCorpus是一個大規模多模態數據集,包含86億張圖像和16960億個文本標記,支持中英雙語。由上海人工智能實驗室聯合多所知名高校及研究機構共同構建。OmniCo...
閱讀原文

STranslate

STranslate是專為Windows用戶設計的多功能翻譯和OCR工具。支持多種語言翻譯,具備劃詞、截圖、監聽剪貼板等多種翻譯方式,并提供多家翻譯服務接口。還擁有基...
閱讀原文

什么是自注意力(Self-Attention)

自注意力(Self-Attention)是一種高級的注意力機制,支持模型在處理序列數據時,對序列內部的不同部分進行關聯和加權,從而捕捉序列內部的長距離依賴關系。...
閱讀原文

什么是嵌入表示(Embedding Representations)

嵌入表示(Embedding Representations)是將實體(如單詞、圖像或用戶)映射到連續的向量空間的過程,這些向量捕捉實體的內在屬性和相互關系。在自然語言處理...
閱讀原文

Jina-embeddings-v3

Jina-embeddings-v3 是 Jina AI 推出的一款先進的文本嵌入模型,專為多語言數據處理和長文本上下文檢索任務設計。模型擁有 5.7 億參數,支持長達 8192 個 tok...
閱讀原文

RTranslator

RTranslator 是一款開源、免費、離線實時翻譯應用程序,專為 Android 設備設計。基于先進的AI技術,包括 Meta 的 NLLB 翻譯模型和 OpenAI 的 Whisper 語音識...
閱讀原文

Reply

Reply是一個AI驅動的銷售外展和潛在客戶開發平臺,基于人工智能技術自動化銷售流程,幫助企業提升銷售效率和效果。集成了多種功能,包括AI銷售助理、AI聊天、...
閱讀原文

Learn Prompting

Learn Prompting 是一個開源且免費的在線平臺,專注于教授如何有效地與人工智能(AI)進行交流。提供了一系列基于研究的課程,涵蓋從基礎到高級的提示工程技...
閱讀原文

libcom

libcom 是一個由上海交通大學 (BCMI) 實驗室推出的圖像合成工具箱。旨在解決前景和背景之間的不一致性問題,如外觀、幾何和語義上的不匹配,生成逼真的合成圖...
閱讀原文

Illuminate

Illuminate 是一個由谷歌開發的項目,能將學術論文轉化為人工智能生成的音頻討論。項目基于谷歌強大的語言模型 Gemini,將論文內容轉換成引人入勝的對話,使...
閱讀原文