<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        從問題到解法!對于大模型RAG技術的一些復盤思考

        AIGC動態1年前 (2024)發布 算法邦
        501 0 0

        從問題到解法!對于大模型RAG技術的一些復盤思考

        AIGC動態歡迎閱讀

        原標題:從問題到解法!對于大模型RAG技術的一些復盤思考
        關鍵字:向量,模型,文本,用戶,語義
        文章來源:算法邦
        內容字數:6670字

        內容摘要:


        智猩猩和智東西發起主辦的2024中國生成式AI大會將于4月18-19日在北京舉辦。主會場將進行開幕式、大模型專場、AI Infra專場和AIGC應用專場;分會場將進行具身智能技術研討會、AI智能體技術研討會和中國智算中心創新論壇。掃名,也可咨詢。最近在公司完成了一個內部知識問答應用,實現流程很簡單,實際上就是Langchain那一套:
        對文檔進行切片
        將切片后的文本塊轉變為向量形式存儲至向量庫中
        用戶問題轉換為向量
        匹配用戶問題向量和向量庫中各文本塊向量的相關度
        將最相關的Top 5文本塊和問題拼接起來,形成Prompt輸入給大模型
        將大模型的答案返回給用戶
        具體可以參考下圖,這個流程的打通其實特別容易,基本上1天就能把架子搭起來,然后開發好了API對外服務。并且在嘗試了幾個通用的文檔后,覺得效果也不錯。
        但是,當公司內部真實文檔導入之后,效果急轉直下。
        當時初步分析,有以下幾個原因:
        1. 文檔種類多
        有doc、ppt、excel、pdf,pdf也有掃描版和文字版。
        doc類的文檔相對來說還比較容易處理,畢竟大部分內容是文字,信息密度較高。但是也有少量圖文混排的情況。
        Excel


        原文鏈接:從問題到解法!對于大模型RAG技術的一些復盤思考

        聯系作者

        文章來源:算法邦
        作者微信:allplusai
        作者簡介:智猩猩矩陣賬號之一,連接AI新青年,講解研究成果,分享系統思考。

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产亚洲精品岁国产微拍精品| 免费在线看片网站| 亚洲黄色中文字幕| 久久成人免费播放网站| 亚洲人成中文字幕在线观看| 一个人看www免费高清字幕| 久久精品亚洲乱码伦伦中文| 一级毛片在线免费视频| 日日噜噜噜噜夜夜爽亚洲精品| 无码毛片一区二区三区视频免费播放 | 免费国产美女爽到喷出水来视频| 亚洲国产成人久久综合| 国产婷婷高清在线观看免费| 免费高清A级毛片在线播放| 国产成人A亚洲精V品无码| 国产一区二区三区免费观在线| 亚洲va久久久噜噜噜久久狠狠| 免费视频成人片在线观看| 亚洲婷婷综合色高清在线| 成人a免费α片在线视频网站| 国产亚洲精品美女久久久久| AV在线播放日韩亚洲欧| 日本免费久久久久久久网站| 亚洲二区在线视频| 免费一级做a爰片久久毛片潮喷| WWW国产成人免费观看视频| 亚洲国产精彩中文乱码AV| 国产精品怡红院永久免费| 亚洲乱亚洲乱妇无码| 国产亚洲成人久久| 精品免费久久久久久久| 国产成人精品久久亚洲高清不卡| 亚洲性猛交XXXX| av大片在线无码免费| 香蕉国产在线观看免费| 亚洲神级电影国语版| 亚洲AV永久无码精品一区二区国产| 免费看黄的成人APP| 77777亚洲午夜久久多喷| 一本久久a久久精品亚洲| 国产一精品一AV一免费孕妇|