上海

“書(shū)生·浦語(yǔ)”向社會(huì)用戶(hù)開(kāi)放同時(shí)在大模型界面上發(fā)布強(qiáng)推理模型InternThinker

記者俞陶然

昨天，上海人工智能實(shí)驗(yàn)室向社會(huì)用戶(hù)開(kāi)放了實(shí)驗(yàn)室開(kāi)發(fā)的“書(shū)生·浦語(yǔ)”大模型，并在這個(gè)大模型界面上發(fā)布了強(qiáng)推理模型InternThinker（書(shū)生思想者）。InternThinker模型具有長(zhǎng)思維能力，并能在推理過(guò)程中進(jìn)行反思和糾正，從而在數(shù)學(xué)、代碼、推理謎題等多種復(fù)雜推理任務(wù)上取得更優(yōu)結(jié)果。

據(jù)介紹，上海人工智能實(shí)驗(yàn)室一直在開(kāi)展強(qiáng)推理模型的原創(chuàng)研究，探索出一條高效構(gòu)建高質(zhì)量思維鏈的路徑。在訓(xùn)練數(shù)據(jù)側(cè)，實(shí)驗(yàn)室在國(guó)內(nèi)率先開(kāi)發(fā)出大規(guī)模合成數(shù)據(jù)技術(shù)；在任務(wù)場(chǎng)景側(cè)，InternThinker模型在數(shù)學(xué)、代碼、推理謎題等多種場(chǎng)景中，都能展現(xiàn)出較強(qiáng)的推理能力，并具備一定的任務(wù)泛化性。

實(shí)驗(yàn)室研發(fā)團(tuán)隊(duì)采用了更接近人類(lèi)學(xué)習(xí)方式的路徑，設(shè)計(jì)了一系列“元?jiǎng)幼?rdquo;來(lái)引導(dǎo)模型解決問(wèn)題的過(guò)程，如對(duì)問(wèn)題的理解、知識(shí)回憶、規(guī)劃、執(zhí)行、反思、總結(jié)等。InternThinker在面對(duì)復(fù)雜任務(wù)時(shí)，會(huì)動(dòng)態(tài)地選擇“元?jiǎng)幼?rdquo;，再進(jìn)一步展開(kāi)相關(guān)動(dòng)作的具體思維過(guò)程。

此外，研究人員還針對(duì)專(zhuān)業(yè)任務(wù)構(gòu)建了大規(guī)模的沙盒環(huán)境，為可形式化驗(yàn)證的推理任務(wù)提供反饋信號(hào)。通過(guò)自動(dòng)化專(zhuān)家模型、人機(jī)協(xié)同策略生成等方法，他們構(gòu)建了50種以上不同邏輯思維方式的推理任務(wù)思考過(guò)程，將執(zhí)行專(zhuān)業(yè)任務(wù)的能力融合到InternThinker中。

公眾可登錄“書(shū)生·浦語(yǔ)”大模型網(wǎng)頁(yè)版（https://internlm-chat.intern-ai.org.cn）體驗(yàn)。

聲明：本媒體部分圖片、文章來(lái)源于網(wǎng)絡(luò)，版權(quán)歸原作者所有，如有侵權(quán)，請(qǐng)聯(lián)系刪除：025-84707368，廣告合作：025-84708755。

熱點(diǎn)新聞

1007

上海

“書(shū)生·浦語(yǔ)”向社會(huì)用戶(hù)開(kāi)放 同時(shí)在大模型界面上發(fā)布強(qiáng)推理模型InternThinker

“書(shū)生·浦語(yǔ)”向社會(huì)用戶(hù)開(kāi)放同時(shí)在大模型界面上發(fā)布強(qiáng)推理模型InternThinker