實(shí)測(cè) | GPT-o1:學(xué)會(huì)了思考,也學(xué)會(huì)了偷懶

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:實(shí)測(cè) | GPT-o1:學(xué)會(huì)了思考,也學(xué)會(huì)了偷懶
關(guān)鍵字:政策,問(wèn)題,機(jī)槍,能力,地球
文章來(lái)源:AI科技評(píng)論
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
警惕 AI 用思考時(shí)長(zhǎng)等效答案質(zhì)量。作者丨林杰鑫
編輯丨陳彩嫻
我可能是全網(wǎng)第一個(gè)花錢向 GPT-o1 提問(wèn),人在深圳靠一條網(wǎng)線橫跨太平洋到美國(guó)硅谷讓 OpenAI 最強(qiáng)大模型 GPT-o1 模型思考 38 秒之后、宕機(jī)了半小時(shí)選擇拒絕回答問(wèn)題并收了我2.5塊(一瓶肥宅快樂(lè)水)的韭菜……
(因?yàn)檫@個(gè)模型只支持訂閱使用并且一個(gè)月只回復(fù)120條內(nèi)容,plus會(huì)員訂閱費(fèi)1個(gè)月20美刀,約等于1.25軟妹幣1條回答……)
OpenAI 今天凌晨突擊更新 GPT-o1,早上起來(lái)全網(wǎng)都在開香檳,大意就是突破了LLM極限,新模型能力在生物、物理比肩甚至超越人類博士生。另一個(gè)特性就是 o1 模型會(huì)用更長(zhǎng)的時(shí)間思考以此來(lái)盡可能完善的回答問(wèn)題。
針對(duì)上面提到的兩個(gè)特性,小編找了幾個(gè)需要強(qiáng)綜合邏輯思考能力并包含物理、生物、數(shù)學(xué)能力的題目來(lái)測(cè)試GPT-o1 的能力到底如何。以下是題目設(shè)置:
數(shù)學(xué)題測(cè)試
「人力顯卡」所有人類都用筆算/心算產(chǎn)生的算力能否英偉達(dá)的統(tǒng)治?
「鈔票打印機(jī)」如果我的家用打印機(jī)能夠打印美元,我能比馬斯克有錢嗎?
綜合性物理題
「人力」地球上所有人在同一個(gè)地方同時(shí)起跳
原文鏈接:實(shí)測(cè) | GPT-o1:學(xué)會(huì)了思考,也學(xué)會(huì)了偷懶
聯(lián)系作者
文章來(lái)源:AI科技評(píng)論
作者微信:
作者簡(jiǎn)介:

粵公網(wǎng)安備 44011502001135號(hào)