
中國科技公司積極追趕 OpenAI 的步伐
中國科技公司正積極蒐集各種資源和人才,以縮小與 OpenAI 的差距。中美兩岸的研究人員的經驗在某些方面可能有驚人的相似之處。最近,阿裏巴巴的一名研究人員在 X 上分享了一個發展大型語言模型的生活稀缺一瞥,該公司是中國眾多網際網路巨頭之一,致力於匹敵 ChatGPT 的能力。阿裏巴巴大型語言模型團隊 Qwen 的自然語言處理研究人員許斌遠分享了他在 X 上的日常時間安排,呼應了近期引起轟動的 OpenAI 研究人員韋健的一篇帖子。兩者對典型日常生活的一瞥顯示出驚人的相似之處,包括早上 9 點醒來,晚上約 1 點入睡。兩者開始他們的一天都是從會議開始,然後進行編碼、模型訓練和與同事進行頭腦風暴。即使回到家後,他們仍繼續在晚上進行實驗,並思考如何在入睡前增強他們的模型。較明顯的區別是,阿裏巴巴員工許斌遠提到了閱讀研究論文和瀏覽 X 來追蹤“世界上正在發生的事情”。正如一位評論員所指出的,許斌遠不像韋健那樣回到家後喝一杯葡萄酒。
中國大型語言模型空間的工作文化
在中國當前的大型語言模型空間中,這種緊張的工作日程並不罕見。擁有頂尖學歷的技術人才紛紛加入科技公司,以建立具有競爭力的人工智慧模型。從某種程度上說,許斌遠的苛求時間表反映了個人的追求,即要匹敵,甚至超越,矽谷公司在人工智慧領域的發展。這似乎與與“996”工時有關的那些更“傳統”的中國網際網路企業形成了區別,其中包括重度運營,例如影片遊戲和電子商務。
投入巨大努力的企業和投資者
即使是著名的人工智慧投資者和電腦科學家李開復也投入了大量精力。當我在去年 11 月採訪李開復時,他承認晚間工作是常態,但員工願意努力工作。那天,他的一名員工在凌晨 2 點 15 分給他發了訊息,表達了對 01.AI 使命的興奮。這種工作倫理在一定程度上解釋了中國科技公司能夠迅速推出大型語言模型的速度。
中國科技公司的進展與競爭
舉例來說阿裏巴巴的 Qwen 團隊已經開源了一系列以英文和中文資料訓練的基礎模型。最大的模型擁有 720 億個引數,這些引數就像模型從歷史訓練資料中獲得的知識,並且定義了它生成相應內容的能力。該團隊還迅速推出了商業應用。去年四月,阿裏巴巴開始將 Qwen 整合到其企業通訊平臺釘釘和線上零售平臺天貓中。
到當前為止,在中國的大型語言模型空間中還沒有確保的領導者,風險投資公司和企業投資者正在向多個競爭者散布賭注。阿裏巴巴除了在內部打造自己的大型語言模型外,還積極投資於新創企業,如 Moonshot AI、智樸 AI、白船和 01.AI。面對競爭,阿裏巴巴一直在努力尋找自己的定位,而其多語種推出可能成為一個賣點。去年十二月,該公司釋出了一個針對東南亞多種語言的大型語言模型。這個名為 SeaLLM 的模型能夠處理越南語、印尼語、泰語、馬來語、高棉語、寮國語、塔加路語和緬甸語的訊息。透過其雲端計算業務和對電商平臺 Lazada 的收購,阿裏巴巴在該地區已經樹立了相當大的腳印,並有望將 SeaLLM 引入這些服務。
延伸閱讀
- Meta 員工探討使用版權內容進行 AI 訓練,背後隱祕曝光!
- 「Meta 技術長:若不滿新政策,員工應該考慮辭職!」
- 阿裏巴巴聯手蘋果!新 AI 功能將在中國 iPhone 中重磅登場!
- 蘋果拒絕 DeepSeek 合作,改與阿裏巴巴攜手推進中國 AI 戰略!
- Workday 大裁員:近 2000 名員工面臨失業危機!
- 數百家公司因中國資料風險封鎖 DeepSeek,背後的隱憂是什麼?
- WeDoSolar 轉型 B2B,背後是中國太陽能巨頭的戰略收購!
- 五角大廈緊急行動!員工存取中國伺服器,引發 DeepSeek 封鎖危機
- 印度讚揚中國 AI 實驗室 DeepSeek,計劃將其模型本地化伺服器託管!
- 失敗創業公司的員工遭竊個人資料危機:舊 Google 登入成失竊關鍵!