標簽:文本生成

LLM2LLM

LLM2LLM是創新的迭代數據增強策略,旨在提升大型語言模型(LLM)在數據稀缺情況下的性能。方法通過基于一個強大的教師模型來生成合成數據,增強學生模型的訓...
閱讀原文

AutoRAG

AutoRAG是中國科學院計算技術研究所(ICT/CAS)、中國科學院的人工智能安全重點實驗室及中國科學院大學的研究人員共同推出的新型自主迭代檢索模型,專為大型...
閱讀原文

什么是上下文嵌入(Contextual Embedding)

上下文嵌入(Contextual Embedding)是一種將詞匯映射到向量空間的技術,它為每個詞生成一個基于其上下文的表示。這些表示能夠捕捉詞匯在不同上下文中的多樣...
閱讀原文

ModernBERT

ModernBERT是Answer.AI、LightOn、約翰斯·霍普金斯大學、英偉達和HuggingFace聯合推出的現代編碼器-only Transformer模型,是對經典BERT模型的一次重大升級。...
閱讀原文

Diff-Instruct

Diff-Instruct是先進的知識轉移方法,用于從預訓練的擴散模型中提取知識,指導其他生成模型的訓練。它基于一種新的散度度量——積分Kullback-Leibler (IKL) 散...
閱讀原文

什么是視覺語言模型(Vision-Language Models, VLMs)

視覺語言模型(Vision-Language Models, VLMs)是一種多模態人工智能系統,它結合了圖像和文本的處理能力,以執行高級視覺語言任務,如視覺問答(Visual Ques...
閱讀原文

AI Chinese

AI Chinese是嗨你好教育推出的AI雙語教學中文學習平臺,基于AI技術為外國人提供在線中文學習解決方案。平臺模擬中國真人老師在線授課,在TikTok用短視頻和直...
閱讀原文

HelloMeme:面部表情與姿態遷移技術驅動的Stable Diffusion 1.5模型實現全新創作體驗

HelloMeme是基于最新的Diffusion生成技術的框架,實現表情與姿態的遷移,HelloMeme集成空間編織注意力(Spatial Knitting Attentions)機制,基于Stable Diff...
閱讀原文

Bamba-9B

Bamba-9B是IBM、普林斯頓大學、卡內基梅隆大學和伊利諾伊大學香檳分校聯合推出的,基于Mamba2架構的僅解碼語言模型模型。模型在完全開放的數據集上訓練,能提...
閱讀原文

OpenAI o3

OpenAI o3模型是繼o1之后的新一代推理模型,包括o3和o3-mini兩個版本。o3在某些條件下接近于通用人工智能(AGI),在ARC-AGI基準測試中得分高達87.5%,遠超人...
閱讀原文

RWKV-7

RWKV-7是RWKV系列的最新大模型架構版本,超越了傳統的attention和linear attention范式,具有更靈活的狀態演化能力,能在相同算力消耗下解決attention無法解...
閱讀原文

RWKV-7:RWKV系列大模型架構提升上下文學習能力的創新產品特性解析

RWKV-7是RWKV系列的最新大模型架構版本,超越了傳統的attention和linear attention范式,具有更靈活的狀態演化能力,能在相同算力消耗下解決attention無法解...
閱讀原文

OpenAI o3:OpenAI推出超強推理模型,智能提升與創新思維的完美結合

OpenAI o3模型是繼o1之后的新一代推理模型,包括o3和o3-mini兩個版本。o3在某些條件下接近于通用人工智能(AGI),在ARC-AGI基準測試中得分高達87.5%,遠超人...
閱讀原文

Emoji AI:個性化AI表情包生成器,讓你的情感隨時隨地生動表達

Emoji AI是AI驅動的表情包制作應用,主打卡通風格,提供搜索和文生圖功能,讓用戶能快速創建個性化表情。Emoji AI特別推出節日主題表情,適應不同文化和節日...
閱讀原文

AI安全防線全面崩潰:Anthropic揭示的越獄技術震撼業界!

原標題:Anthropic 發現了一種 AI 越獄方法,安全護欄崩塌,文本視覺語音全部淪陷 文章來源:夕小瑤科技說 內容字數:4865字引言 近年來,Best-of-N (BoN) 方...
閱讀原文
12345611