第386章 遠超海內外的大模型
“是有新的工作任務嗎徐院?”
邱軒走至徐銘身旁,很是虛心的詢問,以為自己哪裡做的不到位。
正專注於量子指揮雲平臺的徐銘,聽到耳旁傳來熟悉聲音,他暫時停下手上動作,微微扭頭抬起目光向邱軒看過去。
頓時臉上浮現出笑容,直接回應對方。
“沒有。”
“你們的工作,完成的很好,廣寒月球模型已經全面升級。”
“後續等著計算機終端佈置到月球就行。”
說這番話時,還不忘誇讚了兩句,對這段時間廣寒模型的升級比較滿意。
把徐銘的話一字不漏聽進耳中,看到徐院士如此認可後,心裡高興之下不由得撓了撓頭,毫不掩飾堆出的靦覥笑容。
“多虧有徐院您的指導。”
然話音落下後,他並未直接轉身離開。
反倒再次表示道:
“有需要我幫忙的地方,徐院您儘管開口,剛好接下來半個月都很輕鬆。”
他這話一點沒說錯。
按照探月與航天工程中心的規劃,月底將會再次發射攬月著陸器,運送高效能運算機終端,好透過中繼衛星與地球量子計算機大腦建立聯絡。
其中還包括搬運和裝配月球機器人。
由於全面升級後的廣寒模型,和量子模組,都已整合到月球終端上。
所以在正式發射前的這段時間,相對比較空閒。
眼下看到,徐院士有新的工作內容,那肯定要積極參與進去。
畢竟這可是最佳的,學習和成長機會。
加上還和量子計算機有關係。
哪怕放眼全世界,都碰不到第二個。
而有類似想法的,還不單單他自己,幾乎是話音才剛落下的瞬間,身後另外幾位研究員也當即附和。
“是啊徐院,我們也想多找點事幹。”
“有事情直接交代我們就行。”
“我也一樣。”
徐銘迎上面前幾人的堅定目光,頓時樂了起來。
沒想到邱軒他們,對工作同樣如此積極。
考慮到對方在廣寒模型升級上的表現,他在略作思索後還是說明了情況。
“事情是這樣的。”
“我打算用量子計算機,訓練一個類似GPT的國產大模型。”
“智慧大模型?”邱軒剛一聽到,臉上的表情頓時充滿了興趣。
連帶其他幾個人,都同樣如此。
顯然對這方面的新聞,平時有過詳細瞭解。
最終稍頓了兩秒,只聽邱軒率先開口,主動講出自己的一些看法。
“這兩年無論國內還是海外,確實都在花大的精力和經費訓練模型,OpenAI最新發布的版本,似乎引數達到了十萬億級別。”
“在推理和程式碼生成,多模態理解上重新整理記錄。”
“國內的產品,雖奮力追趕,但仍有差距。”
“特別是在經典計算機的訓練成本,和資料質量以及工程能力上。”
“不過我們擁有通用量子計算機,確實能快速訓練出一個模型來。”
前腳把話說完,緊隨其後便有人補充。
“神經網路的矩陣運算,正是量子並行性的天然應用場景,祖沖之三號的邏輯位元數量,能輕鬆支撐萬億引數級模型的訓練。”
“甚至以超導量子計算機的水平,最多幾天就能完成模型訓練。”
瞧見邱軒他們,對這個話題討論的津津有味,他心裡忍不住暗笑。
看樣子訓練國產智慧模型,十有八九早就他們心裡產生了想法,只是礙於月球科研站專案,沒法去分心研究專案之外的事。
如今有這樣一個機會,肯定不會錯過。
念頭停留在這裡,徐銘心思頓時活躍起來,隨即點點頭選擇答應。
“那好吧。”
“你們這幾天就跟我打下手,爭取儘快完成這個模型的訓練。”
話音剛落。
便聽邱軒率先回道:“好的徐院。”
眼神中滿是期待之色。
除他之外其餘幾人,急忙開口的同時,想到馬上國內就要出現,由量子計算機訓練的智慧大模型,心臟都不爭氣的加快跳動了幾分。
深吸一口氣,才把感慨控制在兩句話。
“這將會是全球,首個基於量子架構的模型,肯定能引起全世界的轟動。”
“國產智慧模型的水平,也會徹底領先海外。”
但徐銘聽到後,卻搖了搖頭道:
“訓練一個領先的多模態大模型沒問題,不過還是要稍微限制下,不能讓其太超模暴露出量子算力。”
“把它當做我們對量子算力應用的實驗。”
說完。
連同邱軒在內的幾人,立刻點頭保證,明白徐銘話裡的意思。
“我們知道了徐院。”
就這樣。
接下來的時間,徐銘也不再單打獨鬥,給邱軒等人稍微分配了下工作。
然後才繼續動手操作指令。
在量子指揮雲平臺,對祖沖之三號的量子算力協調使用下,螢幕上跳動著訓練損失函式的曲線,它優雅地收斂沒有震盪,更沒有過擬合,每一步都精準得像是被計算好的。
隨著時間一分一秒流逝,徐銘也注意到,眼前面板上浮現出新的提示資訊。
——
【經過努力學習,你的[資訊]水平提升了,獲得經驗值1點。】
【經過……】
……
五天後。
2月12日,週三。
元宵節。
晚上七點左右,航天城探月與航天工程中心。
徐銘仍舊沒有下班。
經過量子計算機這幾天的訓練,他們的‘智元’大模型已進入基準測試階段。
眼下正處於最重要時刻,肯定要和大家在一起。
至於‘智元’這個名字,是他們商討後取得。
“邱軒怎麼樣了?”
隨著徐銘主動向邱軒詢問一句,後者臉上表情掛滿激動和興奮,顧不上起身立刻脫口彙報。
“徐院。”
“智元的MMLU和HumanEval,以及GSM8K等多個基準測試,全面超越當前市面上的大模型,同等硬體條件下生成速度快了近一倍。”
絲毫沒有掩飾語氣中的驚喜。
甚至不單單是他,旁邊其他人聽完這組資料,同樣倒吸了一口涼氣。
雖然知道量子計算機的強大,但面對這種實際的應用結果,實在是難以讓心情保持平靜和鎮定。
市面上的那些使用者量高的大模型,無不訓練了非常長的時間,投入巨大的研發成本資源和精力,然智元從決定開始動手,到今天滿打滿算還不到五天時間。
關鍵推理分析效率,卻遙遙領先。
更重要的是,這還是徐銘在訓練中,特意對引數進行限制,採用降級處理方式,避免模型太超模的結果。
思維快速運轉下,徐銘嘴角微微上揚,然後抬起胳膊帶頭鼓掌。
“不錯。”
“這幾天大家辛苦了。”
很快氛圍變得輕鬆熱鬧起來。
其他人面對這樣的大模型,也連連附和感嘆。
“我敢保證,如果智元上架市場,肯定會引起全民的狂熱。”
“OpenAI那邊絕對想不到,他們的產品會這麼快就被市場淘汰,成為非常落後的大模型。”
“你那純屬是廢話,智元可是全球,唯一份的全新量子架構模式,那些經典計算機架構的模型,根本沒有和智元比較的資格。”
“恐怕這對於不少行業來說,也會帶去衝擊。”
邱軒想到了什麼,接過其他人的話,最後略顯複雜的低喃一句。
他這幾天,配合徐銘訓練智元模型,太清楚它的恐怖實力,哪怕對引數進行了限制,上市後照樣會對其它大模型以及一些行業,帶來不小的衝擊和變革。
而徐銘聽到邱軒的話,則抬手輕拍了下對方的肩膀笑著開導一句。
“科技的發展,是不會停下腳步的。”
“至於在這個過程中,所帶來的一系列問題,我相信同樣能夠被科技解決。”
從全新的半導體生態環境建立,到奈米反應器大幅度降低癌症患者數量,科技向前發展的同時,勢必會對另一部分群體帶來或多或少影響。
這是無法避免的。
但總不能因為這個顧慮,便把已經攻克的先進技術隱藏起來。
不過在徐銘看來,這些都不是問題。
隨著常溫超導材料的問世,通用量子計算機祖沖之三號的應用,解決人類面臨的終極能源目標,實現可控核聚變只是時間問題。
當人類文明發展的最重要能源發生變革,相信整個文明也會進入全新的時代。
邱軒抬起目光,迎上徐銘的視線,再全部聽完後重重的點了下頭。
“嗯。”
雖僅應上一聲,卻是對徐銘話語的信任。
然緊接著,他又想到了什麼,於是再次開口又向徐銘詢問上一句。
“對了徐院,我們怎麼讓智元上架?”
“就以科學院的名義,註冊一個公司,把它偽裝成普通產品投放吧。”徐銘聞言想了想給出回答。
這是他深入考慮過的。
首先若以他的名義釋出上市,必然一開始就會成為全世界關注的目標,有可能影響到月底,攬月著陸器的發射和月球直播活動。
所以站在背後,讓科學院方面代為執行,是最為合適的辦法。
很多商業公司也都是採用類似的辦法。
另外儘快讓智元上線,能實際測試一些未發現的問題之外,更能幫助模型不斷迭代升級。
邱軒僅是隨口一問,對於徐銘的意見,自然不會有任何的異議。
也就在大家還沉浸在,智元帶來的成就,以及喜悅之中時,只見一道熟悉的身影從外面邁步走進來。
手裡還提著一個多層食盒。
徐銘很快注意到對方,連忙起身迎上去,邊接過其手裡的東西邊關心詢問。
“你怎麼過來了,令儀在家乖不乖?”
“爸媽今天專門做的湯圓,也不知道你什麼時候才能回去,怕放坨不好吃就讓我給你帶來了。”陳璐邊柔聲回答邊開啟放到桌上的食盒說:“令儀這會兒自己在房間寫作業呢。”
望向陳璐手中的湯圓,徐銘眼含愛意,接著又朝距他十幾步遠的邱軒幾人看過去。
“算你們有口福,都嚐嚐吧。”
聞言陳璐也很配合的,拿起另外一份,主動招呼其他人。
“知道你們估計都還沒吃,我特意多帶了一些。”
這段時間裡,陳璐來的次數並不少,有時候還會帶上女兒一起,所以邱軒等人對她自然不會陌生。
既然話都說到這裡,肯定不會再靦腆,當即大大方方走了過去。
“謝謝陳主任。”
他們並不算是徐銘的學生,因此稱呼陳璐,選擇了對方的職位身份。
這也是陳璐第一回過來時就用的。
是的。
如今陳璐在智庫宏觀經濟管理部門,已升任了辦公室主任。
徐銘坐下後,用勺子舀起一個湯圓,放進嘴裡吃完嚥下,不忘主動和身旁的陳璐搭話。
“這邊的工作已經忙完了,等下我們一起回去。”
“好。”
對此陳璐只是點了頭,輕聲吐出一個字,安靜坐在旁邊滿眼直勾勾看著徐銘。
思緒也不由得,重新回到了高三下學期。
那時的她,便是像現在這樣,經常偷瞄注視徐銘專注學習的模樣。
不多時。
待吃完全部的湯圓,徐銘便也不再耽擱,同邱軒他們交代了幾句,便和陳璐一起回家。
另外值得一提的是,關於智元多模態大模型,要在市場上架的事,徐銘路上也聯絡了餘高遠,向對方講明大致的訴求和標準。
作為科學院現任院長的餘高遠,得知徐銘在應用量子計算機,加快月球科研站專案進展之外,還順手訓練出一個遠超海內外的大模型。
心裡面也是非常高興。
他自然也知道,當前大模型熱度,以及未來前景。
國內公司雖出了不少產品,卻仍在對海外產品的效率進行追趕,目前依舊存在著一定的差距。
現在徐銘這邊搞出一個國家隊產品,無疑屬於是雪中送炭。
為此他直接在電話裡表態,會用最快的時間成立智元科技公司,並讓智元上市到海內外市場。
另外按照徐銘要求,隱藏公司實際資訊同時,給予絕大部分的股權。
可以說等智元模型佔領市場,將獲得的利益將會非常可觀。
不過對徐銘來講,金錢的多少早沒意義,對於這件事倒也沒有太多關注。
而回到家之後,他則把注意力放到面板上,檢視順利提升到5級的資訊學科和詞條。