無錯書吧

第386章 遠超海內外的大模型

“是有新的工作任務嗎徐院?”

邱軒走至徐銘身旁,很是虛心的詢問,以為自己哪裡做的不到位。

正專注於量子指揮雲平臺的徐銘,聽到耳旁傳來熟悉聲音,他暫時停下手上動作,微微扭頭抬起目光向邱軒看過去。

頓時臉上浮現出笑容,直接回應對方。

“沒有。”

“你們的工作,完成的很好,廣寒月球模型已經全面升級。”

“後續等著計算機終端佈置到月球就行。”

說這番話時,還不忘誇讚了兩句,對這段時間廣寒模型的升級比較滿意。

把徐銘的話一字不漏聽進耳中,看到徐院士如此認可後,心裡高興之下不由得撓了撓頭,毫不掩飾堆出的靦覥笑容。

“多虧有徐院您的指導。”

然話音落下後,他並未直接轉身離開。

反倒再次表示道:

“有需要我幫忙的地方,徐院您儘管開口,剛好接下來半個月都很輕鬆。”

他這話一點沒說錯。

按照探月與航天工程中心的規劃,月底將會再次發射攬月著陸器,運送高效能運算機終端,好透過中繼衛星與地球量子計算機大腦建立聯絡。

其中還包括搬運和裝配月球機器人。

由於全面升級後的廣寒模型,和量子模組,都已整合到月球終端上。

所以在正式發射前的這段時間,相對比較空閒。

眼下看到,徐院士有新的工作內容,那肯定要積極參與進去。

畢竟這可是最佳的,學習和成長機會。

加上還和量子計算機有關係。

哪怕放眼全世界,都碰不到第二個。

而有類似想法的,還不單單他自己,幾乎是話音才剛落下的瞬間,身後另外幾位研究員也當即附和。

“是啊徐院,我們也想多找點事幹。”

“有事情直接交代我們就行。”

“我也一樣。”

徐銘迎上面前幾人的堅定目光,頓時樂了起來。

沒想到邱軒他們,對工作同樣如此積極。

考慮到對方在廣寒模型升級上的表現,他在略作思索後還是說明了情況。

“事情是這樣的。”

“我打算用量子計算機,訓練一個類似GPT的國產大模型。”

“智慧大模型?”邱軒剛一聽到,臉上的表情頓時充滿了興趣。

連帶其他幾個人,都同樣如此。

顯然對這方面的新聞,平時有過詳細瞭解。

最終稍頓了兩秒,只聽邱軒率先開口,主動講出自己的一些看法。

“這兩年無論國內還是海外,確實都在花大的精力和經費訓練模型,OpenAI最新發布的版本,似乎引數達到了十萬億級別。”

“在推理和程式碼生成,多模態理解上重新整理記錄。”

“國內的產品,雖奮力追趕,但仍有差距。”

“特別是在經典計算機的訓練成本,和資料質量以及工程能力上。”

“不過我們擁有通用量子計算機,確實能快速訓練出一個模型來。”

前腳把話說完,緊隨其後便有人補充。

“神經網路的矩陣運算,正是量子並行性的天然應用場景,祖沖之三號的邏輯位元數量,能輕鬆支撐萬億引數級模型的訓練。”

“甚至以超導量子計算機的水平,最多幾天就能完成模型訓練。”

瞧見邱軒他們,對這個話題討論的津津有味,他心裡忍不住暗笑。

看樣子訓練國產智慧模型,十有八九早就他們心裡產生了想法,只是礙於月球科研站專案,沒法去分心研究專案之外的事。

如今有這樣一個機會,肯定不會錯過。

念頭停留在這裡,徐銘心思頓時活躍起來,隨即點點頭選擇答應。

“那好吧。”

“你們這幾天就跟我打下手,爭取儘快完成這個模型的訓練。”

話音剛落。

便聽邱軒率先回道:“好的徐院。”

眼神中滿是期待之色。

除他之外其餘幾人,急忙開口的同時,想到馬上國內就要出現,由量子計算機訓練的智慧大模型,心臟都不爭氣的加快跳動了幾分。

深吸一口氣,才把感慨控制在兩句話。

“這將會是全球,首個基於量子架構的模型,肯定能引起全世界的轟動。”

“國產智慧模型的水平,也會徹底領先海外。”

但徐銘聽到後,卻搖了搖頭道:

“訓練一個領先的多模態大模型沒問題,不過還是要稍微限制下,不能讓其太超模暴露出量子算力。”

“把它當做我們對量子算力應用的實驗。”

說完。

連同邱軒在內的幾人,立刻點頭保證,明白徐銘話裡的意思。

“我們知道了徐院。”

就這樣。

接下來的時間,徐銘也不再單打獨鬥,給邱軒等人稍微分配了下工作。

然後才繼續動手操作指令。

在量子指揮雲平臺,對祖沖之三號的量子算力協調使用下,螢幕上跳動著訓練損失函式的曲線,它優雅地收斂沒有震盪,更沒有過擬合,每一步都精準得像是被計算好的。

隨著時間一分一秒流逝,徐銘也注意到,眼前面板上浮現出新的提示資訊。

——

【經過努力學習,你的[資訊]水平提升了,獲得經驗值1點。】

【經過……】

……

五天後。

2月12日,週三。

元宵節。

晚上七點左右,航天城探月與航天工程中心。

徐銘仍舊沒有下班。

經過量子計算機這幾天的訓練,他們的‘智元’大模型已進入基準測試階段。

眼下正處於最重要時刻,肯定要和大家在一起。

至於‘智元’這個名字,是他們商討後取得。

“邱軒怎麼樣了?”

隨著徐銘主動向邱軒詢問一句,後者臉上表情掛滿激動和興奮,顧不上起身立刻脫口彙報。

“徐院。”

“智元的MMLU和HumanEval,以及GSM8K等多個基準測試,全面超越當前市面上的大模型,同等硬體條件下生成速度快了近一倍。”

絲毫沒有掩飾語氣中的驚喜。

甚至不單單是他,旁邊其他人聽完這組資料,同樣倒吸了一口涼氣。

雖然知道量子計算機的強大,但面對這種實際的應用結果,實在是難以讓心情保持平靜和鎮定。

市面上的那些使用者量高的大模型,無不訓練了非常長的時間,投入巨大的研發成本資源和精力,然智元從決定開始動手,到今天滿打滿算還不到五天時間。

關鍵推理分析效率,卻遙遙領先。

更重要的是,這還是徐銘在訓練中,特意對引數進行限制,採用降級處理方式,避免模型太超模的結果。

思維快速運轉下,徐銘嘴角微微上揚,然後抬起胳膊帶頭鼓掌。

“不錯。”

“這幾天大家辛苦了。”

很快氛圍變得輕鬆熱鬧起來。

其他人面對這樣的大模型,也連連附和感嘆。

“我敢保證,如果智元上架市場,肯定會引起全民的狂熱。”

“OpenAI那邊絕對想不到,他們的產品會這麼快就被市場淘汰,成為非常落後的大模型。”

“你那純屬是廢話,智元可是全球,唯一份的全新量子架構模式,那些經典計算機架構的模型,根本沒有和智元比較的資格。”

“恐怕這對於不少行業來說,也會帶去衝擊。”

邱軒想到了什麼,接過其他人的話,最後略顯複雜的低喃一句。

他這幾天,配合徐銘訓練智元模型,太清楚它的恐怖實力,哪怕對引數進行了限制,上市後照樣會對其它大模型以及一些行業,帶來不小的衝擊和變革。

而徐銘聽到邱軒的話,則抬手輕拍了下對方的肩膀笑著開導一句。

“科技的發展,是不會停下腳步的。”

“至於在這個過程中,所帶來的一系列問題,我相信同樣能夠被科技解決。”

從全新的半導體生態環境建立,到奈米反應器大幅度降低癌症患者數量,科技向前發展的同時,勢必會對另一部分群體帶來或多或少影響。

這是無法避免的。

但總不能因為這個顧慮,便把已經攻克的先進技術隱藏起來。

不過在徐銘看來,這些都不是問題。

隨著常溫超導材料的問世,通用量子計算機祖沖之三號的應用,解決人類面臨的終極能源目標,實現可控核聚變只是時間問題。

當人類文明發展的最重要能源發生變革,相信整個文明也會進入全新的時代。

邱軒抬起目光,迎上徐銘的視線,再全部聽完後重重的點了下頭。

“嗯。”

雖僅應上一聲,卻是對徐銘話語的信任。

然緊接著,他又想到了什麼,於是再次開口又向徐銘詢問上一句。

“對了徐院,我們怎麼讓智元上架?”

“就以科學院的名義,註冊一個公司,把它偽裝成普通產品投放吧。”徐銘聞言想了想給出回答。

這是他深入考慮過的。

首先若以他的名義釋出上市,必然一開始就會成為全世界關注的目標,有可能影響到月底,攬月著陸器的發射和月球直播活動。

所以站在背後,讓科學院方面代為執行,是最為合適的辦法。

很多商業公司也都是採用類似的辦法。

另外儘快讓智元上線,能實際測試一些未發現的問題之外,更能幫助模型不斷迭代升級。

邱軒僅是隨口一問,對於徐銘的意見,自然不會有任何的異議。

也就在大家還沉浸在,智元帶來的成就,以及喜悅之中時,只見一道熟悉的身影從外面邁步走進來。

手裡還提著一個多層食盒。

徐銘很快注意到對方,連忙起身迎上去,邊接過其手裡的東西邊關心詢問。

“你怎麼過來了,令儀在家乖不乖?”

“爸媽今天專門做的湯圓,也不知道你什麼時候才能回去,怕放坨不好吃就讓我給你帶來了。”陳璐邊柔聲回答邊開啟放到桌上的食盒說:“令儀這會兒自己在房間寫作業呢。”

望向陳璐手中的湯圓,徐銘眼含愛意,接著又朝距他十幾步遠的邱軒幾人看過去。

“算你們有口福,都嚐嚐吧。”

聞言陳璐也很配合的,拿起另外一份,主動招呼其他人。

“知道你們估計都還沒吃,我特意多帶了一些。”

這段時間裡,陳璐來的次數並不少,有時候還會帶上女兒一起,所以邱軒等人對她自然不會陌生。

既然話都說到這裡,肯定不會再靦腆,當即大大方方走了過去。

“謝謝陳主任。”

他們並不算是徐銘的學生,因此稱呼陳璐,選擇了對方的職位身份。

這也是陳璐第一回過來時就用的。

是的。

如今陳璐在智庫宏觀經濟管理部門,已升任了辦公室主任。

徐銘坐下後,用勺子舀起一個湯圓,放進嘴裡吃完嚥下,不忘主動和身旁的陳璐搭話。

“這邊的工作已經忙完了,等下我們一起回去。”

“好。”

對此陳璐只是點了頭,輕聲吐出一個字,安靜坐在旁邊滿眼直勾勾看著徐銘。

思緒也不由得,重新回到了高三下學期。

那時的她,便是像現在這樣,經常偷瞄注視徐銘專注學習的模樣。

不多時。

待吃完全部的湯圓,徐銘便也不再耽擱,同邱軒他們交代了幾句,便和陳璐一起回家。

另外值得一提的是,關於智元多模態大模型,要在市場上架的事,徐銘路上也聯絡了餘高遠,向對方講明大致的訴求和標準。

作為科學院現任院長的餘高遠,得知徐銘在應用量子計算機,加快月球科研站專案進展之外,還順手訓練出一個遠超海內外的大模型。

心裡面也是非常高興。

他自然也知道,當前大模型熱度,以及未來前景。

國內公司雖出了不少產品,卻仍在對海外產品的效率進行追趕,目前依舊存在著一定的差距。

現在徐銘這邊搞出一個國家隊產品,無疑屬於是雪中送炭。

為此他直接在電話裡表態,會用最快的時間成立智元科技公司,並讓智元上市到海內外市場。

另外按照徐銘要求,隱藏公司實際資訊同時,給予絕大部分的股權。

可以說等智元模型佔領市場,將獲得的利益將會非常可觀。

不過對徐銘來講,金錢的多少早沒意義,對於這件事倒也沒有太多關注。

而回到家之後,他則把注意力放到面板上,檢視順利提升到5級的資訊學科和詞條。

熱門

重生戰神超能力總裁萌寶系統聊天群萬界最強穿越