科研人員在調(diào)試安裝國產(chǎn)自主超導量子計算機
合肥高新區(qū)云飛路與方興大道交會處,有一座看似平凡卻蘊含無限可能的建筑——本源量子計算機組裝與測試實驗室。
當你走近這座建筑,透過那扇玻璃,仿佛能窺視到一個神秘而又充滿活力的微觀世界。
日前,中國第三代自主超導量子計算機“本源悟空”完成全球首個十億參數(shù)大模型微調(diào)任務,為深陷“算力焦慮”的AI產(chǎn)業(yè)打開了新世界的大門。
全球首個量子計算機十億級大模型微調(diào)實驗是做什么的?背后有何意義?本網(wǎng)進行了獨家解碼。
算力圍城中的量子突圍
在合肥綜合性國家科學中心人工智能研究院,副研究員陳昭昀坐在電腦前,點開一組實驗數(shù)據(jù):優(yōu)化后的模型在心理咨詢對話數(shù)據(jù)集(CPsyCountD)上訓練損失降低15%,數(shù)學推理任務(R1-Distill-SFT)的嚴格準確率從68%提升至82%。
數(shù)據(jù)的背后,是一塊不足指甲蓋大小的芯片——超導量子芯片“悟空芯”,讓量子計算與大模型微調(diào)技術完美結合。
那么,什么是大模型微調(diào)技術呢?不妨拿大家熟悉的DeepSeek來打個比方。
可以把通用大模型想象成一個擁有一定知識儲備的萬事通,但是在面對像醫(yī)療診斷、金融風控這樣高度專業(yè)的場景時,它可能就有點力不從心了。
這時候,微調(diào)就像是一場專門的特訓。通過在通用大模型的基礎上,用特定領域的數(shù)據(jù)對它進行進一步的訓練,就像是給這個萬事通在特定領域進行深度輔導,讓它能夠更好地適應這些專業(yè)場景。
此前,安徽醫(yī)科大學聯(lián)合中國科學技術大學附屬第一醫(yī)院和健康科技企業(yè),在合肥發(fā)布體重管理大模型智能助手“減單”,就是借助AI技術提高減重的個性化干預質(zhì)量和診療效率。
在這個過程中,通用大模型可能已經(jīng)具備了基礎的醫(yī)學知識,但要想讓它真正成為一名“醫(yī)生”,還需要通過微調(diào)來提升其在特定疾病診斷上的準確性。
與此同時,傳統(tǒng)的低秩微調(diào)方法就像是一個雖然努力但是有點“力不從心”的學徒。
它雖然在一定程度上提高了模型的性能,卻面臨著性能瓶頸和泛化能力有限的“參數(shù)膨脹”難題。這就好比是一個小房子,東西越來越多,空間就越來越擁擠,效率也就越來越低了。
而量子計算的出現(xiàn),為解決這些問題提供了新的思路。
以金融風控場景為例,通用大模型需處理數(shù)億條交易數(shù)據(jù),參數(shù)規(guī)模動輒千億級,訓練一次能耗相當于上百戶家庭全年用電量。
而量子計算憑借其疊加態(tài)和糾纏態(tài)的特性,可以同時探索海量的參數(shù)組合,從而大大提升大模型微調(diào)的訓練效率。
“就像給經(jīng)典模型裝上了量子引擎。”本源量子副總裁竇猛漢用了個形象的比喻,這樣的結合可以讓兩者協(xié)同發(fā)力,發(fā)揮出更強大的能力。
參數(shù)瘦身術的量子密碼
傳統(tǒng)計算機在處理海量數(shù)據(jù)時,隨著模型規(guī)模的增大,所需的算力也呈指數(shù)級增長,這不僅限制了大模型的應用范圍,還增加了訓練成本和時間,就像一個人在黑暗中摸索,效率低下且容易迷失方向。
而量子計算機則像是一群擁有超能力的人,能夠在同一時間探索無數(shù)條路徑,迅速找到最優(yōu)解。
為此,團隊創(chuàng)新設計了“量子加權張量混合參數(shù)微調(diào)”方法,通過量子計算特性實現(xiàn)智能“微調(diào)”,可以提高訓練效率,減少資源消耗。
具體來說,他們將模型權重轉(zhuǎn)化為量子神經(jīng)網(wǎng)絡與張量網(wǎng)絡混合架構。
這種混合架構的優(yōu)勢在于,它既能通過量子門操作提取高維非線性特征,又充分利用了張量網(wǎng)絡在參數(shù)壓縮方面的優(yōu)勢。
這使得模型在保持高性能的同時,大大減少了參數(shù)量,從而降低了計算復雜度和存儲需求。
“這是量子計算首次‘真機實戰(zhàn)’AI大模型任務,證明現(xiàn)有硬件已能初步支撐大模型微調(diào)。”陳昭昀表示。
值得一提的是,在這場量子計算與AI大模型的“跨界聯(lián)姻”里,“本源悟空”量子計算機無疑扮演了關鍵角色,堪稱“最強助攻”。
作為我國目前先進的可編程、已交付超導量子計算機,“本源悟空”展現(xiàn)出了強大的量子計算能力。已為全球139個國家超2300萬人次提供量子算力云服務,完成35萬個量子運算任務,涵蓋流體動力學、金融、生物醫(yī)藥等多個行業(yè)領域。
“本源悟空”能夠讓傳統(tǒng)計算機數(shù)年才能啃下的“硬骨頭”,在極短的時間內(nèi)快速完成。這種高效的計算能力,使得大模型領域微調(diào)變得更加高效。
量子計算與AI的深度融合
量子計算與大模型的結合,是當前AI領域研究的熱點之一。隨著量子計算技術的不斷發(fā)展,未來量子計算將在AI領域發(fā)揮更加重要的作用。
當下,“量子+”的化學反應正在你我身邊發(fā)生。從金融風控的參數(shù)優(yōu)化,到藥物研發(fā)的分子模擬,量子技術正在重構產(chǎn)業(yè)格局。
一方面,量子計算可以提供更強大的算力支持,加速大模型的訓練和優(yōu)化過程;另一方面,利用量子計算的疊加態(tài)和糾纏態(tài)特性,可以設計出更加高效的量子神經(jīng)網(wǎng)絡算法,從而提高AI模型的性能和效率。
此外,量子計算還可以用于解決一些傳統(tǒng)AI算法難以處理的問題,如組合優(yōu)化、量子機器學習等。
不過,我們也要清醒地認識到,盡管量子計算在大模型微調(diào)方面已經(jīng)取得了顯著的成果,但這個領域仍然像是一片充滿未知的海洋,還有許多挑戰(zhàn)等待著我們?nèi)フ鞣?/p>
量子計算機的硬件性能就像是一個還需要不斷成長的孩子,還有待進一步提升,這樣才能滿足更大規(guī)模、更復雜的計算需求。
而且,量子計算與AI技術的融合就像是一場剛剛開始的戀愛,還需要深入研究和探索。如何將量子計算的特性更好地融入AI模型,如何設計出更加高效的量子神經(jīng)網(wǎng)絡算法,這些都是科學家們需要攻克的難題,就像是一座座高山等待著勇敢的攀登者。
合肥在線-合新聞記者 王書滸
(圖片來源:安徽省量子計算工程研究中心)
新聞鏈接
合肥量子產(chǎn)業(yè)“十年磨一劍”
沿著合肥高新區(qū)望江西路向西,量子大道兩側聚集著本源量子等幾十家量子企業(yè),形成全國最完整的量子產(chǎn)業(yè)鏈。
在這個過程中,合肥正以“量子+”思維重構產(chǎn)業(yè)格局——量子通信保障金融安全、量子計算加速藥物研發(fā)、量子測量提升工業(yè)精度,一幅“量子賦能未來”的畫卷正在巢湖之濱徐徐展開。
如今,這里已建成中國第一條自主超導量子計算機制造鏈、國內(nèi)首條量子芯片生產(chǎn)線,并上線中國第三代自主超導量子計算機“本源悟空”。
在政策支持方面,合肥市出臺《量子信息產(chǎn)業(yè)發(fā)展規(guī)劃(2020-2030年)》,全力打造“量子科技”“量子產(chǎn)業(yè)”雙高地。
2024年,合肥高新區(qū)發(fā)布建設世界領先科技園區(qū)行動方案,提出到2035年,該區(qū)將成為全國首個以量子產(chǎn)業(yè)為領先標志的世界領先科技園區(qū),基本建成“世界量子中心”。
真正的科技進步不僅是實驗室里的數(shù)據(jù),還有普通民眾都能感受到的變化。
有理由相信,在不久的將來,量子計算將給我們的生活帶來更多的驚喜和便利。
不妨想象一下,未來的醫(yī)療診斷更加精準,金融服務更加高效,工業(yè)生產(chǎn)更加智能化。
而這一切,都離不開量子計算的強大支持。