網路議題

阿裏巴巴員工透露中國建立 LLM 的生活點滴

## 阿裏巴巴員工投入大型語言模型研發生活的一瞥### 中國科技公司積極追趕 OpenAI 的步伐中國科技公司正積極蒐集各種資源和人才,以縮小與 OpenAI 的差距。中美兩岸的研究人員的經驗在某些方面可能有驚人的相似之處。最近,阿裏巴巴的一名研究人員在 X 上分享了一個發展大型語言模型的生活稀缺一 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

阿裏巴巴員工透露中國建立 LLM 的生活點滴
## 阿裏巴巴員工投入大型語言模型研發生活的一瞥 ### 中國科技公司積極追趕 OpenAI 的步伐 中國科技公司正積極蒐集各種資源和人才,以縮小與 OpenAI 的差距。中美兩岸的研究人員的經驗在某些方面可能有驚人的相似之處。最近,阿裏巴巴的一名研究人員在 X 上分享了一個發展大型語言模型的生活稀缺一瞥,該公司是中國眾多網際網路巨頭之一,致力於匹敵 ChatGPT 的能力。阿裏巴巴大型語言模型團隊 Qwen 的自然語言處理研究人員許斌遠分享了他在 X 上的日常時間安排,呼應了近期引起轟動的 OpenAI 研究人員韋健的一篇帖子。兩者對典型日常生活的一瞥顯示出驚人的相似之處,包括早上 9 點醒來,晚上約 1 點入睡。兩者開始他們的一天都是從會議開始,然後進行編碼、模型訓練和與同事進行頭腦風暴。即使回到家後,他們仍繼續在晚上進行實驗,並思考如何在入睡前增強他們的模型。較明顯的區別是,阿裏巴巴員工許斌遠提到了閱讀研究論文和瀏覽 X 來追蹤“世界上正在發生的事情”。正如一位評論員所指出的,許斌遠不像韋健那樣回到家後喝一杯葡萄酒。 ### 中國大型語言模型空間的工作文化 在中國當前的大型語言模型空間中,這種緊張的工作日程並不罕見。擁有頂尖學歷的技術人才紛紛加入科技公司,以建立具有競爭力的人工智慧模型。從某種程度上說,許斌遠的苛求時間表反映了個人的追求,即要匹敵,甚至超越,矽谷公司在人工智慧領域的發展。這似乎與與“996”工時有關的那些更“傳統”的中國網際網路企業形成了區別,其中包括重度運營,例如影片遊戲和電子商務。 ### 投入巨大努力的企業和投資者 即使是著名的人工智慧投資者和電腦科學家李開復也投入了大量精力。當我在去年 11 月採訪李開復時,他承認晚間工作是常態,但員工願意努力工作。那天,他的一名員工在凌晨 2 點 15 分給他發了訊息,表達了對 01.AI 使命的興奮。這種工作倫理在一定程度上解釋了中國科技公司能夠迅速推出大型語言模型的速度。 ### 中國科技公司的進展與競爭 舉例來說阿裏巴巴的 Qwen 團隊已經開源了一系列以英文和中文資料訓練的基礎模型。最大的模型擁有 720 億個引數,這些引數就像模型從歷史訓練資料中獲得的知識,並且定義了它生成相應內容的能力。該團隊還迅速推出了商業應用。去年四月,阿裏巴巴開始將 Qwen 整合到其企業通訊平臺釘釘和線上零售平臺天貓中。 到當前為止,在中國的大型語言模型空間中還沒有確保的領導者,風險投資公司和企業投資者正在向多個競爭者散布賭注。阿裏巴巴除了在內部打造自己的大型語言模型外,還積極投資於初創企業,如 Moonshot AI、智樸 AI、白船和 01.AI。面對競爭,阿裏巴巴一直在努力尋找自己的定位,而其多語種推出可能成為一個賣點。去年十二月,該公司釋出了一個針對東南亞多種語言的大型語言模型。這個名為 SeaLLM 的模型能夠處理越南語、印尼語、泰語、馬來語、高棉語、寮國語、塔加路語和緬甸語的訊息。透過其雲端計算業務和對電商平臺 Lazada 的收購,阿裏巴巴在該地區已經樹立了相當大的腳印,並有望將 SeaLLM 引入這些服務。
China,worklife,culture-阿裏巴巴,員工,中國,LLM,生活,點滴
江塵

江塵

Reporter

大家好!我是江塵,一名熱愛科技的發展和創新,我一直都保持著濃厚的興趣和追求。在這個瞬息萬變的數位時代,科技已經深入到我們生活的方方面面,影響著我們的工作、學習和娛樂方式。因此,我希望透過我的部落格,與大家分享最新的科技資訊、趨勢和創新應用。