金融研報(bào)數(shù)據(jù)魔改Yi-34B & DeepSeek 67B 誰更強(qiáng)? Deepmoney金融大模型魔改方案分享&在線實(shí)測
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:金融研報(bào)數(shù)據(jù)魔改Yi-34B & DeepSeek 67B 誰更強(qiáng)? Deepmoney金融大模型魔改方案分享&在線實(shí)測
關(guān)鍵字:模型,報(bào)告,數(shù)據(jù),金融,領(lǐng)域
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):3014字
內(nèi)容摘要:
在微調(diào)大型模型的過程中,一個(gè)常用的策略是“知識(shí)蒸餾”,這意味著借助高性能模型,如GPT-4,來優(yōu)化性能較低的開源模型。這種方法背后隱含的哲學(xué)理念與logos中心論相似,把GPT-4等模型視為更接近唯一的邏輯或真理的存在。
雖然這種方法在許多領(lǐng)域已經(jīng)證明了其成功(例如Alpaca/Orca等研究),但其在特定的專業(yè)領(lǐng)域中效果有限,比如金融學(xué)。這是因?yàn)橥ㄟ^知識(shí)蒸餾得到的模型性能難以超越其原始模型。而像GPT-4這樣的模型,其訓(xùn)練和性能與人類反饋緊密相關(guān)。在一些尖端領(lǐng)域,如金融學(xué)中的有效市場理論與行為金融學(xué)的辯論、古典主義與貨幣主義的爭論等,并不存在所謂的“唯一邏輯”,這限制了模型在這些領(lǐng)域的應(yīng)用。
為了更好地幫助研究人員和投資者作出理性判斷,一個(gè)理想的金融領(lǐng)域大模型應(yīng)能理解新聞或數(shù)據(jù),并能夠即時(shí)地從主觀和量化兩個(gè)角度對(duì)進(jìn)行評(píng)估。
制作這樣一個(gè)模型是Deepmoney項(xiàng)目研究的目標(biāo)。
在金融投資領(lǐng)域,研報(bào)數(shù)據(jù)在分析和決策過程中起著關(guān)鍵作用。這些報(bào)告提供了深入的市場分析、行業(yè)趨勢(shì)、公司財(cái)務(wù)狀況及投資建議,對(duì)金融專業(yè)人士至關(guān)重要。在訓(xùn)練金融模型時(shí),這些數(shù)據(jù)的深度和廣度使其成為理想的訓(xùn)練材
原文鏈接:金融研報(bào)數(shù)據(jù)魔改Yi-34B & DeepSeek 67B 誰更強(qiáng)? Deepmoney金融大模型魔改方案分享&在線實(shí)測
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)