<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        4000萬蛋白結構訓練,西湖大學開發基于結構詞表的蛋白質通用大模型,已開源

        AIGC動態1年前 (2024)發布 機器之心
        498 0 0

        4000萬蛋白結構訓練,西湖大學開發基于結構詞表的蛋白質通用大模型,已開源

        AIGC動態歡迎閱讀

        原標題:4000萬蛋白結構訓練,西湖大學開發基于結構詞表蛋白質通用大模型,已開源
        關鍵字:結構,蛋白質,模型,詞表,序列
        文章來源:機器之心
        內容字數:5725字

        內容摘要:


        將ScienceAI設為星標
        第一時間掌握
        新鮮的AI for Science資訊編輯 |ScienceAI
        蛋白質結構相比于序列往往被認為更加具有信息量,因為其直接決定了蛋白質的功能。而隨著AlphaFold2帶來的巨大突破,大量的預測結構被發布出來供人研究使用。如何利用這些蛋白質結構來訓練強大且通用的表征模型是一個值得研究的方向。
        西湖大學的研究人員利用Foldseek來處理蛋白質結構,將其編碼成一維的離散token,并與傳統的氨基酸進行結合,形成了結構感知詞表(Structure-aware Vocabulary),以此將結構信息嵌入到模型輸入中,增強模型的表征能力。
        在預訓練上,論文使用了目前最多的蛋白質結構(identity過濾后4000萬),在64張A100上訓練了3個月,最終開源了具備650M參數量的模型SaProt(同時包括了35M的版本)。實驗結果表明SaProt各種蛋白質任務上都要好于之前的序列和結構模型。
        研究《SaProt: Protein Language Modeling with Structure-aware Vocabulary》的預印版本,于2024


        原文鏈接:4000萬蛋白結構訓練,西湖大學開發基于結構詞表的蛋白質通用大模型,已開源

        聯系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: a毛片全部播放免费视频完整18| 边摸边吃奶边做爽免费视频网站| 国产色无码精品视频免费| 亚洲一区免费观看| 亚洲成a人片在线观看日本| 亚洲国产精品成人精品软件| 亚洲熟妇AV日韩熟妇在线| 亚洲黄片手机免费观看| 久久久久久成人毛片免费看| 亚洲精品国产品国语在线| 中文字幕不卡免费视频| 国产精品无码免费播放| 国产亚洲精品影视在线产品| 91亚洲国产成人久久精品网址| 最好看最新的中文字幕免费| 亚洲性猛交xx乱| 午夜毛片不卡高清免费| 无码天堂va亚洲va在线va| 久久精品毛片免费观看| 亚洲日韩中文字幕| 大学生美女毛片免费视频| 国产精品亚洲专一区二区三区| 亚洲欧洲日产国码一级毛片| 国产免费爽爽视频在线观看| 91亚洲va在线天线va天堂va国产| 国产又大又粗又长免费视频| 亚洲精品无码少妇30P| 亚洲成a人片在线观看日本麻豆| 亚洲不卡1卡2卡三卡2021麻豆| 国产一级a毛一级a看免费视频| 亚洲爆乳精品无码一区二区三区 | 看Aⅴ免费毛片手机播放| 无码国产亚洲日韩国精品视频一区二区三区 | 国产成人涩涩涩视频在线观看免费| 成人免费观看男女羞羞视频| 成人毛片免费网站| 国产精品高清免费网站| 亚洲乱码在线视频| 亚洲欧洲日产国码av系列天堂| 免费人人潮人人爽一区二区| 成人免费福利电影|