Web 3

AI 時代：關於人工智慧，你需要知道的一切

人工智慧時代：你需要理解的一切解讀術語，理解主要參與者，並保持對最新人工智慧新聞的最新瞭解作者：Devin Coldewey @techcrunch / 11 小時前人工智慧（Artificial Intelligence，簡稱 AI）似乎出現在現代生活的各個角落，從音樂和媒體到商業和生產力，甚至包 .... (往下繼續閱讀)

by 江塵
2023/7/12
28 分鐘閱讀時間

A- A A+

文章目錄

人工智慧時代：你需要理解的一切

解讀術語，理解主要參與者，並保持對最新人工智慧新聞的最新瞭解

作者：Devin Coldewey @techcrunch / 11 小時前

人工智慧（Artificial Intelligence，簡稱 AI）似乎出現在現代生活的各個角落，從音樂和媒體到商業和生產力，甚至包括約會。有太多要理解的內容，讓人難以跟上時代的步伐。因此接著我們將介紹從最新的重大發展到你需要理解的術語和公司，以幫助你在這個快速發展的領域中保持更新。首先讓我們確保大家對人工智慧有相同的理解：什麼是人工智慧？

人工智慧的基礎知識

神經網路

我們的大腦主要由稱為神經元的相互存取的細胞組成，這些細胞相互元件成複雜的網路，執行任務並儲存訊息。從 20 世紀 60 年代起，人們就試圖在軟體中再創造這個令人驚奇的系統。然而在 15 到 20 年前，隨著 GPU 的出現，數位定義的神經網路開始蓬勃發展。神經網路的核心結構由許多點和線組成：點代表資料，線代表這些數值之間的統計關係。與大腦類似，這種結構可以創造出一個靈活的系統：它能快速接受輸入，透過網路處理後產生輸出。這個系統被稱為模型。

模型

模型是真實接收輸入並返回輸出的程式碼集合。與統計模型或模擬複雜自然過程的建模系統的術語相似，AI 中的模型可以指任何 AI 或機器學習結構，無論它們的功能或產出如何。模型的大小有不同，這取決於它們需要多少儲存空間和計算資源。這取決於模型的訓練方式。

訓練

要建立一個 AI 模型，組成其基礎系統的神經網路需要透過一個名為資料集或語料庫的訊息集合來訓練。透過這一過程，這些巨大的網路將建立資料的統計表示。這個訓練過程是計算最為密集的部分，這意味著需要在大量高效能計算機上進行數週或數月的計算。之所以如此，不僅是因為網路本身復雜，而且資料集可能非常龐大：數十億個詞語或影象需要進行分析並在巨大的統計模型中進行表示。另一方面，一旦模型完成訓練，當它使用時，它可以更小且較少要求計算資源，這個過程稱為推理。

推理

當模型真正開始工作時，我們稱之為推理，這與詮釋的傳統意義相似：根據現有的證據陳述結論。當然這並不完全是“推理”，而是透過資料中的存取點來統計性地存取資料，並且實際上預測下一個連結。例如，問一個問題：“完成以下序列：紅色，橙色，黃色……”，模型會發現這些詞語對應了它所學到的一個列表的開始，即彩虹的顏色，並且透過推理得出其餘的列表。推理通常比訓練過程的計算成本要低得多：可以將其視為查詢卡片目錄而不是編制它。大型模型仍然需要在超級計算機和 GPU 上執行，但小型模型可以在智慧手機或簡單得多的裝置上執行。

生成 AI

大家都在談論生成 AI，這個廣義的術語指的是一個能夠生成原創輸出的 AI 模型，例如影象或文字。一些 AI 可以總結，一些可以重新組織，一些可以識別，等等。但是只因為 AI 生成了一些東西，並不意味著它是正確的，甚至不意味著它反映了現實！它只是在你提問之前不存在的故事或畫作。

當前的關鍵術語

在基礎知識之外，以下是當前最重要的人工智慧術語。

大型語言模型

大型語言模型是當今最具影響力和多才多藝的人工智慧形式，它們是根據組成網路的所有文字，包括網路內容和大量英語文學作品進行訓練。這些模型可以用自然語言交流並回答問題，並模仿各種風格和型別的書面檔案，如 ChatGPT、Claude 和 LLaMa 所展示的那樣。雖然這些模型無疑令人印象深刻，但必須謹記它們仍然是模式識別引擎，當它們回答問題時，只是嘗試完成它們所識別出的模式，不管這個模式是否反映現實。大型語言模型的答案往往帶有幻覺，我們將在稍後提到。

基礎模型

從頭開始在龐大的資料集上訓練一個巨大的模型非常昂貴且複雜，所以你肯定不希望不得不這樣做。基礎模型是需要超級計算機執行的從頭開始訓練的大型模型，但它們可以透過減少引數數量來縮小大小以適應較小的容器。你可以將引數視為模型需要處理的總點數，而現在的模型可以有數百萬、數十億甚至數萬億的引數。

微調

像 GPT-4 這樣的基礎模型是聰明的，但同時也是一個通才，它吸收了從狄更斯到維特根斯坦再到龍與地下城規則的一切，但如果你想讓它幫你寫一封求職信，這並沒有什麼幫助。幸運的是，可以透過使用一個專門的資料集對模型進行微調，例如一些數千個正在進行的工作應用程式。這樣，模型在該領域的工作方面會更有幫助，同時保留了從其餘訓練資料中獲得的通用知識。使用人類反饋進行強化學習（Reinforcement Learning from Human Feedback，簡稱 RLHF）是微調的一種特殊方式，它利用了人與大型語言模型進行互動的資料，以改進通訊技巧。

擴散

透過觀察一篇關於高級擴散技術的論文，你可以看到影象如何從非常嘈雜的資料中重建。影象生成可以透過多種方式進行，但到當前為止最成功的方法是擴散，這是 Stable Diffusion、Midjourney 和其他流行生成 AI 背後的技術。擴散模型透過展示逐步被數位噪音逐步劣化的影象來進行訓練，直到原始影象不再存在。透過觀察這一過程，擴散模型也學會了相反的過程，即逐步向純噪音中新增細節，以形成任意定義的影象。我們已經開始在影象生成方面取得進展，但這種技術可靠且相對容易理解，所以不要指望它很快會消失。

幻覺

最初，這是指訓練中某些影象特徵滲透到無關的輸出中，比如由於訓練模型中狗的數量過多，所以一些建築物似乎由狗組成。現在當一個 AI 因為訓練集中資料不足或相互矛盾而胡思亂想時，我們說它在幻覺。這可能是一個資源還是一個負擔：要求 AI 創作原創或者衍生的藝術作品時，它就在幻覺它的輸出；你可以要求大型語言模型以 Yogi Berra 的風格寫一首愛情詩，它會很樂意地這麼做，儘管在該模型的資料集中可能並不存在這樣一首詩。但當需要確切的答案時，幻覺就可能成為問題；模型會自信地提供一個既是真實、又是幻覺的回答。當前除非你自己檢查，否則沒有一種容易的方法能夠分辨出真實和幻覺，因為模型本身並不知道什麼是“真實”或“假”，它只是盡其所能地完成一個模式。

AGI 或強人工智慧

通用人工智慧（Artificial General Intelligence，簡稱 AGI）或強人工智慧並沒有一個明確的定義，但最簡單的解釋是，它是一種功能強大到足以不僅做人類所能做的事情，而且像我們一樣學習和改進自己的智慧。有人擔心這種學習、整合思想、學習和增長的迴圈將成為一種自我持續的迴圈，結果導致一個不可能被約束或控制的超智慧系統。有人甚至提議延遲或約束研究，以防止這種可能性的發生。這是一個令人恐懼的想法，肯定的，電影《駭客帝國》和《終結者》已經探討了如果人工智慧失控並試圖消滅或奴役人類會發生什麼的情節。但這些故事與現實沒有根基。我們在 ChatGPT 等系統中所看到的智慧表現是令人印象深刻的，但它與我們所理解的“真實”智慧的抽象推理和動態多域活動幾乎沒有什麼相似之處。雖然很難預測事物的進展，但將 AGI 視為星際太空旅行之類的東西可能有所幫助：我們都理解這個概念，並似乎正在朝著這方面努力，但同時我們還遠遠未能實現任何類似的東西。由於所需的巨大資源和基礎科學進步，沒有人會突然意外地實現它！AGI 是一個有趣的思考題，但在現實中，人工智慧已經在今天提出了真正有影響的威脅，儘管其局限性，人們仍然無法解決這些問題。沒有人希望出現 Skynet，但你不需要一個配備核彈的超智慧來造成真正的傷害：人們失去工作，並且容易上當受騙。如果我們無法解決這些問題，那麼對付 T-1000 的機會是多少？

AI 的領頭羊

OpenAI

如果在人工智慧領域有一個家喻戶曉的名字，那就是 OpenAI。正如它的名字所暗示的，OpenAI 最初是一個計劃進行研究並公開提供研究成果的組織。但後來，它為了更常規地提供其在語言模型（如 ChatGPT）方面的進展而進行了重組，並提供了 API 和應用程式的使用權。該組織由科技大亨 Sam Altman 領導，他同時也對 AI 可能帶來的風險提出了警告。OpenAI 被公認為是大型語言模型領域的領導者，但也在其他領域進行研究。

微軟

如你所料，微軟在人工智慧研究方面也付出了相當的努力，但與其他公司一樣，它在將其實驗轉化為重大產品方面並不成功。它最明智的舉動是早期投資於 OpenAI，這使得它與該公司達成了獨家的長期合作夥伴關係，該公司現在為微軟的 Bing 對話助手提供動力。儘管微軟自己的貢獻較小且不太立即應用，但該公司在研究領域擁有相當的實力。

Google

Google 以其勇於冒險的傳統而聞名，儘管它的研究人員實際上發明了直接導致當今人工智慧爆發的多頭注意力機制，但 Google 在人工智慧方面卻走錯了方向。現在它正在努力發展自己的大型語言模型和其他代理程式，但顯然是在失去了過去十年中大部分時間和資金來推進過時的“虛擬助手”概念的遊戲。執行長 Sundar Pichai 多次表示該公司正在將自己牢固地對齊在搜尋和生產力方面的人工智慧。

Anthropic

在 OpenAI 轉向封閉性後，Dario 和 Daniela Amodei 兄妹離開該公司並創立了 Anthropic，意圖成為一個開放和具有倫理考慮的 AI 研究組織。憑藉其現有的資金，他們對 OpenAI 構成了嚴重的競爭，即使他們的模型（如 Claude 和 Claude 2）還不那麼受歡迎或知名。顯然，AI 市場足夠大，可以容納幾個主要供應商——如果他們有資本。

Stability

Stability 代表著“隨心所欲”的開源 AI 實現學派，它吸收網際網路上的所有內容，並使其訓練的生成 AI 模型在有合適硬體的情況下免費提供。這非常符合“資訊想要自由”的理念，但它也加速了一些倫理不確保的專案，例如生成淫穢影像和未經同意使用智慧財產權（有時同時進行）。

Elon Musk

Musk 不甘示弱，對於他對 AI 失控的擔憂他一直大聲疾呼，還有在他對 OpenAI 的早期貢獻之後走向了一條他不喜歡的道路。雖然 Musk 在這個話題上並不是一個專家，但通常他的古怪行為和評論引起廣泛回應（他是上述“AI 暫停”信中的簽署者），並且他正試圖開始一個自己的研究。

AI 時代：關於人工智慧，你需要知道的一切

文章目錄

人工智慧時代：你需要理解的一切

解讀術語，理解主要參與者，並保持對最新人工智慧新聞的最新瞭解

作者：Devin Coldewey @techcrunch / 11 小時前

人工智慧的基礎知識

神經網路

模型

訓練

推理

生成 AI

當前的關鍵術語

大型語言模型

基礎模型

微調

擴散

幻覺

AGI 或強人工智慧

AI 的領頭羊

OpenAI

微軟

Google

Anthropic

Stability

Elon Musk

最新人工智慧新聞

Anthropic 推出 Claude 2

OpenAI 推出 GPT-4

歐洲科技領袖警告過度管制人工智慧在歐盟法律草案中可能產生不利影響

美國可能禁止將晶片向中國出口

ChatGPT 結合 Bing，Bing 結合 ChatGPT

AI 不能獲得格萊美音樂獎

Google 旗下的研究實驗室 DeepMind 聲稱，它的下一個聊天機器人將能與 ChatGPT 匹敵

Salesforce 承諾向人工智慧新創公司投資 5 億美元

GPU 製造商 NVIDIA 成為萬億美元公司

在 Computex 展會上，NVIDIA 再次承諾致力於人工智慧

延伸閱讀