金融研報數(shù)據(jù)魔改Yi-34B & DeepSeek 67B 誰更強？ Deepmoney金融大模型魔改方案分享&在線實測

AIGC動態(tài)2年前 (2024)發(fā)布機器之心

AIGC動態(tài)歡迎閱讀

原標(biāo)題：金融研報數(shù)據(jù)魔改Yi-34B & DeepSeek 67B 誰更強？ Deepmoney金融大模型魔改方案分享&在線實測
關(guān)鍵字：模型,報告,數(shù)據(jù),金融,領(lǐng)域
文章來源：機器之心
內(nèi)容字數(shù)：3014字

內(nèi)容摘要：

在微調(diào)大型模型的過程中，一個常用的策略是“知識蒸餾”，這意味著借助高性能模型，如GPT-4，來優(yōu)化性能較低的開源模型。這種方法背后隱含的哲學(xué)理念與logos中心論相似，把GPT-4等模型視為更接近唯一的邏輯或真理的存在。
雖然這種方法在許多領(lǐng)域已經(jīng)證明了其成功（例如Alpaca/Orca等研究），但其在特定的專業(yè)領(lǐng)域中效果有限，比如金融學(xué)。這是因為通過知識蒸餾得到的模型性能難以超越其原始模型。而像GPT-4這樣的模型，其訓(xùn)練和性能與人類反饋緊密相關(guān)。在一些尖端領(lǐng)域，如金融學(xué)中的有效市場理論與行為金融學(xué)的辯論、古典主義與貨幣主義的爭論等，并不存在所謂的“唯一邏輯”，這限制了模型在這些領(lǐng)域的應(yīng)用。
為了更好地幫助研究人員和投資者作出理性判斷，一個理想的金融領(lǐng)域大模型應(yīng)能理解新聞或數(shù)據(jù)，并能夠即時地從主觀和量化兩個角度對進行評估。
制作這樣一個模型是Deepmoney項目研究的目標(biāo)。
在金融投資領(lǐng)域，研報數(shù)據(jù)在分析和決策過程中起著關(guān)鍵作用。這些報告提供了深入的市場分析、行業(yè)趨勢、公司財務(wù)狀況及投資建議，對金融專業(yè)人士至關(guān)重要。在訓(xùn)練金融模型時，這些數(shù)據(jù)的深度和廣度使其成為理想的訓(xùn)練材

原文鏈接：金融研報數(shù)據(jù)魔改Yi-34B & DeepSeek 67B 誰更強？ Deepmoney金融大模型魔改方案分享&在線實測