1月15日,科大訊飛正式宣布,聯(lián)手華為成功攻克了訓(xùn)練推理強交互、高吞吐推理優(yōu)化以及國產(chǎn)算子優(yōu)化等一系列難題,成功訓(xùn)練出我國首個基于全國產(chǎn)算力訓(xùn)練的具備深度思考和推理能力的大模型——訊飛星火X1。該模型中文數(shù)學(xué)能力國內(nèi)第一,并率先應(yīng)用于教育、醫(yī)療等剛需場景。
發(fā)布會現(xiàn)場,科大訊飛研究院的研究員們依次展示了訊飛星火X1解答高考題、AIME競賽題以及高中奧賽題的表現(xiàn)。訊飛星火X1不僅準(zhǔn)確給出了這些題目的答案,還對解題思路和步驟進行了詳細(xì)拆解。與通用大模型相比,其解題過程更接近人類的“慢思考”方式。
值得一提的是,訊飛星火X1在近期參加的小初高(含競賽)、大學(xué)(含競賽)、AIME、MATH 500等多項“考試”中成績十分亮眼,用更少的算力,實現(xiàn)了業(yè)界一流的效果,多項指標(biāo)國內(nèi)第一。
在醫(yī)療領(lǐng)域,訊飛星火X1的模型策略已取得初步驗證成效,可使得??戚o助診斷和復(fù)雜病歷內(nèi)涵質(zhì)控的準(zhǔn)確率均達90%。發(fā)布會上,科大訊飛還宣布將在今年上半年正式發(fā)布基于訊飛星火X1的醫(yī)療大模型升級版,確保其深層次診斷推理效果和質(zhì)控能力業(yè)界領(lǐng)先。
同時,訊飛星火4.0 Turbo底座能力再次迎來全新升級,七大核心能力全面提升,全面對標(biāo)OpenAI最新版的GPT-4o。此次升級最重要的特點,是針對行業(yè)、企業(yè)的痛點問題,在數(shù)學(xué)能力、行業(yè)知識、圖文識別、長文本能力等能力上實現(xiàn)提升。
大模型的長文本能力一直是用戶關(guān)注的重點,特別是在企業(yè)知識問答這類嚴(yán)謹(jǐn)?shù)膽?yīng)用場景中,用戶對大模型幻覺的容忍度幾乎為零。因此,訊飛星火推出了基于智能體的全新長文本框架,并行業(yè)首發(fā)了句子級溯源功能。這一新框架優(yōu)化了超長注意力機制,同時利用大規(guī)模網(wǎng)頁和書籍?dāng)?shù)據(jù)進行知識關(guān)聯(lián)式合成,使得知識回復(fù)的錯誤率降低了40%,句子級溯源效果更是超越了GPT-4o。
根據(jù)第三方數(shù)據(jù),2024年,合肥本土企業(yè)訊飛星火在大模型中標(biāo)數(shù)量和中標(biāo)金額上取得“雙第一”,尤其是在能源、金融、汽車、運營商等行業(yè),合作打磨了近百個智能體應(yīng)用。
合報科學(xué)+融媒體工作室
合肥通客戶端-合報全媒體記者 劉小容