Web 3

AI 時代:關於人工智慧,你需要知道的一切

人工智慧時代:你需要理解的一切解讀術語,理解主要參與者,並保持對最新人工智慧新聞的最新瞭解作者:Devin Coldewey @techcrunch / 11 小時前人工智慧(Artificial Intelligence,簡稱 AI)似乎出現在現代生活的各個角落,從音樂和媒體到商業和生產力,甚至包 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

AI 時代:關於人工智慧,你需要知道的一切

人工智慧時代:你需要理解的一切

解讀術語,理解主要參與者,並保持對最新人工智慧新聞的最新瞭解

作者:Devin Coldewey @techcrunch / 11 小時前

人工智慧(Artificial Intelligence,簡稱 AI)似乎出現在現代生活的各個角落,從音樂和媒體到商業和生產力,甚至包括約會。有太多要理解的內容,讓人難以跟上時代的步伐。因此接著我們將介紹從最新的重大發展到你需要理解的術語和公司,以幫助你在這個快速發展的領域中保持更新。首先讓我們確保大家對人工智慧有相同的理解:什麼是人工智慧

人工智慧的基礎知識

神經網路

我們的大腦主要由稱為神經元的相互存取的細胞組成,這些細胞相互元件成複雜的網路,執行任務並儲存訊息。從 20 世紀 60 年代起,人們就試圖在軟體中再創造這個令人驚奇的系統。然而在 15 到 20 年前,隨著 GPU 的出現,數位定義的神經網路開始蓬勃發展。神經網路的核心結構由許多點和線組成:點代表資料,線代表這些數值之間的統計關係。與大腦類似,這種結構可以創造出一個靈活的系統:它能快速接受輸入,透過網路處理後產生輸出。這個系統被稱為模型。

模型

模型是真實接收輸入並返回輸出的程式碼集合。與統計模型或模擬複雜自然過程的建模系統的術語相似,AI 中的模型可以指任何 AI機器學習結構,無論它們的功能或產出如何。模型的大小有不同,這取決於它們需要多少儲存空間和計算資源。這取決於模型的訓練方式。

訓練

要建立一個 AI 模型,組成其基礎系統的神經網路需要透過一個名為資料集或語料庫的訊息集合來訓練。透過這一過程,這些巨大的網路將建立資料的統計表示。這個訓練過程是計算最為密集的部分,這意味著需要在大量高效能計算機上進行數週或數月的計算。之所以如此,不僅是因為網路本身復雜,而且資料集可能非常龐大:數十億個詞語或影象需要進行分析並在巨大的統計模型中進行表示。另一方面,一旦模型完成訓練,當它使用時,它可以更小且較少要求計算資源,這個過程稱為推理。

推理

當模型真正開始工作時,我們稱之為推理,這與詮釋的傳統意義相似:根據現有的證據陳述結論。當然這並不完全是“推理”,而是透過資料中的存取點來統計性地存取資料,並且實際上預測下一個連結。例如,問一個問題:“完成以下序列:紅色,橙色,黃色……”,模型會發現這些詞語對應了它所學到的一個列表的開始,即彩虹的顏色,並且透過推理得出其餘的列表。推理通常比訓練過程的計算成本要低得多:可以將其視為查詢卡片目錄而不是編制它。大型模型仍然需要在超級計算機和 GPU 上執行,但小型模型可以在智慧手機或簡單得多的裝置上執行。

生成 AI

大家都在談論生成 AI,這個廣義的術語指的是一個能夠生成原創輸出的 AI 模型,例如影象或文字。一些 AI 可以總結,一些可以重新組織,一些可以識別,等等。但是只因為 AI 生成了一些東西,並不意味著它是正確的,甚至不意味著它反映了現實!它只是在你提問之前不存在的故事或畫作。

當前的關鍵術語

在基礎知識之外,以下是當前最重要的人工智慧術語。

大型語言模型

大型語言模型是當今最具影響力和多才多藝的人工智慧形式,它們是根據組成網路的所有文字,包括網路內容和大量英語文學作品進行訓練。這些模型可以用自然語言交流並回答問題,並模仿各種風格和型別的書面檔案,如 ChatGPT、Claude 和 LLaMa 所展示的那樣。雖然這些模型無疑令人印象深刻,但必須謹記它們仍然是模式識別引擎,當它們回答問題時,只是嘗試完成它們所識別出的模式,不管這個模式是否反映現實。大型語言模型的答案往往帶有幻覺,我們將在稍後提到。

基礎模型

從頭開始在龐大的資料集上訓練一個巨大的模型非常昂貴且複雜,所以你肯定不希望不得不這樣做。基礎模型是需要超級計算機執行的從頭開始訓練的大型模型,但它們可以透過減少引數數量來縮小大小以適應較小的容器。你可以將引數視為模型需要處理的總點數,而現在的模型可以有數百萬、數十億甚至數萬億的引數。

微調

像 GPT-4 這樣的基礎模型是聰明的,但同時也是一個通才,它吸收了從狄更斯到維特根斯坦再到龍與地下城規則的一切,但如果你想讓它幫你寫一封求職信,這並沒有什麼幫助。幸運的是,可以透過使用一個專門的資料集對模型進行微調,例如一些數千個正在進行的工作應用程式。這樣,模型在該領域的工作方面會更有幫助,同時保留了從其餘訓練資料中獲得的通用知識。使用人類反饋進行強化學習(Reinforcement Learning from Human Feedback,簡稱 RLHF)是微調的一種特殊方式,它利用了人與大型語言模型進行互動的資料,以改進通訊技巧。

擴散

透過觀察一篇關於高級擴散技術的論文,你可以看到影象如何從非常嘈雜的資料中重建。影象生成可以透過多種方式進行,但到當前為止最成功的方法是擴散,這是 Stable Diffusion、Midjourney 和其他流行生成 AI 背後的技術。擴散模型透過展示逐步被數位噪音逐步劣化的影象來進行訓練,直到原始影象不再存在。透過觀察這一過程,擴散模型也學會了相反的過程,即逐步向純噪音中新增細節,以形成任意定義的影象。我們已經開始在影象生成方面取得進展,但這種技術可靠且相對容易理解,所以不要指望它很快會消失。

幻覺

最初,這是指訓練中某些影象特徵滲透到無關的輸出中,比如由於訓練模型中狗的數量過多,所以一些建築物似乎由狗組成。現在當一個 AI 因為訓練集中資料不足或相互矛盾而胡思亂想時,我們說它在幻覺。這可能是一個資源還是一個負擔:要求 AI 創作原創或者衍生的藝術作品時,它就在幻覺它的輸出;你可以要求大型語言模型以 Yogi Berra 的風格寫一首愛情詩,它會很樂意地這麼做,儘管在該模型的資料集中可能並不存在這樣一首詩。但當需要確切的答案時,幻覺就可能成為問題;模型會自信地提供一個既是真實、又是幻覺的回答。當前除非你自己檢查,否則沒有一種容易的方法能夠分辨出真實和幻覺,因為模型本身並不知道什麼是“真實”或“假”,它只是盡其所能地完成一個模式。

AGI 或強人工智慧

通用人工智慧(Artificial General Intelligence,簡稱 AGI)或強人工智慧並沒有一個明確的定義,但最簡單的解釋是,它是一種功能強大到足以不僅做人類所能做的事情,而且像我們一樣學習和改進自己的智慧。有人擔心這種學習、整合思想、學習和增長的迴圈將成為一種自我持續的迴圈,結果導致一個不可能被約束或控制的超智慧系統。有人甚至提議延遲或約束研究,以防止這種可能性的發生。這是一個令人恐懼的想法,肯定的,電影《駭客帝國》和《終結者》已經探討了如果人工智慧失控並試圖消滅或奴役人類會發生什麼的情節。但這些故事與現實沒有根基。我們在 ChatGPT 等系統中所看到的智慧表現是令人印象深刻的,但它與我們所理解的“真實”智慧的抽象推理和動態多域活動幾乎沒有什麼相似之處。雖然很難預測事物的進展,但將 AGI 視為星際太空旅行之類的東西可能有所幫助:我們都理解這個概念,並似乎正在朝著這方面努力,但同時我們還遠遠未能實現任何類似的東西。由於所需的巨大資源和基礎科學進步,沒有人會突然意外地實現它!AGI 是一個有趣的思考題,但在現實中,人工智慧已經在今天提出了真正有影響的威脅,儘管其局限性,人們仍然無法解決這些問題。沒有人希望出現 Skynet,但你不需要一個配備核彈的超智慧來造成真正的傷害:人們失去工作,並且容易上當受騙。如果我們無法解決這些問題,那麼對付 T-1000 的機會是多少?

AI 的領頭羊

OpenAI

如果在人工智慧領域有一個家喻戶曉的名字,那就是 OpenAI。正如它的名字所暗示的,OpenAI 最初是一個計劃進行研究並公開提供研究成果的組織。但後來,它為了更常規地提供其在語言模型(如 ChatGPT)方面的進展而進行了重組,並提供了 API 和應用程式的使用權。該組織由科技大亨 Sam Altman 領導,他同時也對 AI 可能帶來的風險提出了警告。OpenAI 被公認為是大型語言模型領域的領導者,但也在其他領域進行研究。

微軟

如你所料,微軟在人工智慧研究方面也付出了相當的努力,但與其他公司一樣,它在將其實驗轉化為重大產品方面並不成功。它最明智的舉動是早期投資於 OpenAI,這使得它與該公司達成了獨家的長期合作夥伴關係,該公司現在為微軟的 Bing 對話助手提供動力。儘管微軟自己的貢獻較小且不太立即應用,但該公司在研究領域擁有相當的實力。

Google

Google 以其勇於冒險的傳統而聞名,儘管它的研究人員實際上發明了直接導致當今人工智慧爆發的多頭注意力機制,但 Google 在人工智慧方面卻走錯了方向。現在它正在努力發展自己的大型語言模型和其他代理程式,但顯然是在失去了過去十年中大部分時間和資金來推進過時的“虛擬助手”概念的遊戲。執行長 Sundar Pichai 多次表示該公司正在將自己牢固地對齊在搜尋和生產力方面的人工智慧

Anthropic

在 OpenAI 轉向封閉性後,Dario 和 Daniela Amodei 兄妹離開該公司並創立了 Anthropic,意圖成為一個開放和具有倫理考慮的 AI 研究組織。憑藉其現有的資金,他們對 OpenAI 構成了嚴重的競爭,即使他們的模型(如 Claude 和 Claude 2)還不那麼受歡迎或知名。顯然,AI 市場足夠大,可以容納幾個主要供應商——如果他們有資本。

Stability

Stability 代表著“隨心所欲”的開源 AI 實現學派,它吸收網際網路上的所有內容,並使其訓練的生成 AI 模型在有合適硬體的情況下免費提供。這非常符合“資訊想要自由”的理念,但它也加速了一些倫理不確保的專案,例如生成淫穢影像和未經同意使用智慧財產權(有時同時進行)。

Elon Musk

Musk 不甘示弱,對於他對 AI 失控的擔憂他一直大聲疾呼,還有在他對 OpenAI 的早期貢獻之後走向了一條他不喜歡的道路。雖然 Musk 在這個話題上並不是一個專家,但通常他的古怪行為和評論引起廣泛回應(他是上述“AI 暫停”信中的簽署者),並且他正試圖開始一個自己的研究。

最新人工智慧新聞

以下是人工智慧領域的最新訊息:

Anthropic 推出 Claude 2

Claude 2 於 7 月 11 日在美國和英國推出測試版,可在網頁上和付費 API (部分約束性使用) 上使用。Claude 2 可以搜尋檔案、總結、寫作、編碼和回答特定主題的問題,但該公司聲稱 Claude 2 在幾個學術領域上更為優秀。

OpenAI 推出 GPT-4

從 7 月 6 日起,所有現有的 OpenAI API 開發人員如果進行過“成功支付”的歷史記錄,都可以存取 GPT-4。該公司計劃在 7 月底開放給新開發人員,並在之後根據計算資源的可用性提高可用性約束。從 2024 年 1 月 4 日起,某些較舊的 OpenAI 模型,具體地說是 GPT-3 及其衍生模型,將不再提供,並將用新的“基礎 GPT-3”模型取而代之。使用舊模型的開發人員必須在 1 月 4 日之前手動升級其整合,並且希望在 1 月 4 日之後繼續使用微調的舊模型的人需要在新的基礎 GPT-3 模型上進行覆蓋微調。

歐洲科技領袖警告過度管制人工智慧在歐盟法律草案中可能產生不利影響

這封公開信表示人工智慧提供了“重返技術先鋒”的機會,但當前歐盟提出的監管方案可能導致機會的窒息。Inflection AI 獲得 13 億美元投資以打造更“個人化”的人工智慧AI 新創公司 Inflection AI 完成了由 Microsoft、Reid Hoffman、Bill Gates、Eric Schmidt 和新投資者 Nvidia 領導的 13 億美元融資。執行長 Mustafa Suleyman(曾共同創立 Google 旗下的 AI 實驗室 DeepMind)表示這筆新資本將支援 Inflection 開發和設計其第一個產品 Pi,一個名為 Pi 的 AI 助手。

美國可能禁止將晶片向中國出口

美國商務部可能在來月初約束向中國的客戶出口晶片,包括顯示卡製造商 Nvidia 在內。約束向中國出口 AI 晶片的最新舉措是美國約束中國在 AI 領域的進展的整體戰略的一部分。然而這些措施也對中國的商業人工智慧行業產生了負面影響,許多公司在美國和中國兩地運營。

ChatGPT 結合 Bing,Bing 結合 ChatGPT

ChatGPT Plus 的訂閱使用者現在可以在 ChatGPT 應用程式中使用一個名為 Browsing 的新功能,該功能可以透過搜尋 Bing 來回答提示或問題。OpenAI 表示 Browsing 功能非常適用於與當前事件和其他超出 ChatGPT 最初訓練資料範圍的訊息相關的查詢。當禁用 Browsing 時,ChatGPT 的知識截至於 2021 年。

AI 不能獲得格萊美音樂獎

如果音樂家借助 AI 創作的作品有望獲得格萊美音樂獎,他們需要確保他們的人類貢獻“具有實質性且不少於最小限度”,新規定中闡明:“只有人類創作者才有資格提交申請進行評選”,且“不含人類創作貢獻的作品在任何類別中都不符合資格”。

Google 旗下的研究實驗室 DeepMind 聲稱,它的下一個聊天機器人將能與 ChatGPT 匹敵

DeepMind 正在使用 AlphaGo 的技術,AlphaGo 是 DeepMind 的 AI 系統,它是第一個在圍棋比賽中戰勝專業棋手的系統,以開發一個與 ChatGPT 匹敵的聊天機器人,名為 Gemini。如果一切按計劃進行,Gemini 將具有規劃或解決問題的能力以及分析文字的能力,DeepMind 執行長 Demis Hassabis 告訴 Wired 的 Will Knight。

Salesforce 承諾向人工智慧新創公司投資 5 億美元

Salesforce 宣布將將其生成 AI 基金從 2.5 億美元擴大至 5 億美元。自今年 3 月推出生成 AI 基金以來,Salesforce 已經在幾家生成 AI 技術公司中進行了投資。儘管不是唯一一個主要投資於生成 AI 的基金,Salesforce 計劃透過優先考慮其所描述的“倫理”AI 技術來使其與眾不同。

GPU 製造商 NVIDIA 成為萬億美元公司

GPU 製造商 NVIDIA 一直在向遊戲玩家和加密貨幣挖掘者出售產品,但人工智慧行業對其硬體的需求將其市值推向了頂峯,創下了同等市值的紀錄。他們並沒有顯示出放緩的跡象,最近在 Computex 展會上又取得了顯著的成果......

在 Computex 展會上,NVIDIA 再次承諾致力於人工智慧

在臺北的 Computex 展覽會上,NVIDIA 執行長 Jensen Huang 強調了 Grace Hopper 超級晶片的重要性,該晶片用於加速計算(他們的術語),並展示了可以將任何人變成開發人員的生成人工智慧
ArtificialIntelligence-wordpress,AI,人工智慧,技術,機器學習,深度學習,自然語言處理,智慧
江塵

江塵

Reporter

大家好!我是江塵,一名熱愛科技的發展和創新,我一直都保持著濃厚的興趣和追求。在這個瞬息萬變的數位時代,科技已經深入到我們生活的方方面面,影響著我們的工作、學習和娛樂方式。因此,我希望透過我的部落格,與大家分享最新的科技資訊、趨勢和創新應用。