Web 3

人工智慧之深度探索：AI 的全方位總覽

AI：你需要知道的一切關於人工智慧人工智慧（AI）正出現在現代生活的幾乎每個角落，從音樂和媒體到商業和生產力，甚至是戀愛交友領域。AI 的應用非常廣泛，以至於很難跟上。因此請繼續閱讀以下內容，理解最新的重大發展和您需要理解的術語和公司，以保持在這個快速發展的領域中保持時髦。首先讓我們確保我們對 AI .... (往下繼續閱讀)

by 江塵
2023/6/29
29 分鐘閱讀時間

A- A A+

文章目錄

AI：你需要知道的一切關於人工智慧

人工智慧（AI）正出現在現代生活的幾乎每個角落，從音樂和媒體到商業和生產力，甚至是戀愛交友領域。AI 的應用非常廣泛，以至於很難跟上。因此請繼續閱讀以下內容，理解最新的重大發展和您需要理解的術語和公司，以保持在這個快速發展的領域中保持時髦。首先讓我們確保我們對 AI 有一致的理解：什麼是 AI？人工智慧，也稱為機器學習，是一種基於神經網路的軟體系統，這種技術其實在數十年前就已經開創，但最近幾年由於強大的新型計算資源開始蓬勃發展。AI 已經實現了有效的語音和影象識別以及生成合成影象和語音的能力。研究人員正在努力讓 AI 可以在網路上瀏覽、訂購門票、調整食譜等等。但如果你擔心 AI 會像《駭客帝國》中機器的崛起一樣，別擔心，我們稍後會談到這一點！我們的 AI 指南分為三個主要部分，每個部分都會定期更新，可以按任意線序閱讀：首先您需要理解的最基本的概念以及最近比較重要的概念。接下來，總覽 AI 領域的主要參與者及其重要性。最後是一份精心挑選的最新頭條新聞和發展動態，這些是您應該注意的。閱讀完本文，您將是當今最為理解 AI 的人之一。隨著進一步進入 AI 時代，我們還將不斷更新和擴充這份指南。

AI 101

AI 最讓人感興趣的一點是，儘管其核心概念可以追溯到 50 年以上前，但在最近，這些概念甚至對技術精通的人來說也是陌生的。所以，如果你感到迷茫，別擔心，每個人都一樣。首先我們要明確一點：盡管它被稱為“人工智慧”，這個術語有點誤導。當然「智慧」在這裡並沒有一個確切的定義，但這些系統所做的事情確實更接近計算器而不是大腦。這個計算機的輸入和輸出只是更靈活一些。你可以把人工智慧想象成人造椰子：它是模仿智慧。

神經網路

我們的大腦主要由相互存取的神經元組成，這些神經元組合在一起完成任務並儲存訊息。從 60 年代開始，人們就一直試圖在軟體中重新建立這個神奇的系統，但要實現這一目標，需要大量的處理能力，而這種能力直到 15-20 年前才廣泛普及，當時 GPU 讓數位化的神經網路蓬勃發展起來。從根本上說，神經網路只是由許多點和線組成：點是資料，線是這些值之間的統計關係。就像我們的大腦一樣，這樣的系統可以快速地接受輸入，將其透過網路傳遞，並產生輸出。這個系統被稱為模型。

模型

模型是接受輸入並返回輸出的實際程式碼集合。與統計模型或模擬複雜自然過程的建模系統的術語相似，這種術語也不是偶然的。在 AI 中，模型可以指代像 ChatGPT 這樣的完整系統，或者幾乎任何 AI 或機器學習結構，無論它是做什麼還是產生什麼。模型有不同的大小，這取決於它們所佔用的儲存空間和執行所需的計算資源。這些取決於模型的訓練方法。

訓練

要建立一個 AI 模型，系統的基礎神經網路需要接觸到一堆資訊，這種資訊稱為資料集或語料庫。透過這樣做，這些巨大的網路會建立該資料集的統計表示。對於這一訓練過程，需耗費大量的計算資源，這意味著它需要花費數週或數月（可以根據需要時間更長）在大量的高效能計算機上進行。原因是這些網路不僅是復雜的，而且資料集可能非常大：需要分析和表示數十億個單詞或影象。然而一旦模型訓練完成，當它被使用時它的體積可以更小，並且所需的計算資源也較少，這個過程稱為推論。

推論

當模型實際執行任務時，我們稱之為推論，這與傳統意義上的推論相當：透過對可用證據進行推理來陳述結論。當然這並不是「推理」，而是在處理所吸收的資料中存取點的統計，從而預測下一個點。例如，當你說「補完下列序列：紅、橘、黃……」時，模型會找到這些詞與它吸收的列表的開始相對應，即彩虹的顏色，並推斷出剩下的部分。推論的計算成本通常比訓練要低得多：想像一下透過查閱目錄而不是組織目錄。然而大型模型仍然需要在超級計算機和 GPU 上執行，但較小的模型可以在智慧手機或其他更簡單的裝置上執行。

生成 AI

人們都在討論生成 AI，這個廣泛的術語指的是一種可以生成原始輸出（如圖片或文字）的 AI 模型。一些 AI 能夠總結，一些能夠重新組織，一些能夠識別，等等。但是 AI 生成的內容是否正確，甚至是否反映現實，這並不重要！只要它在你提出要求之前不存在，像故事或畫作一樣。這是一種特別受歡迎的 AI 模型。但請記住，僅僅因為 AI 生成了一些東西，這並不意味著它是正確的，或者它反映了現實！這只意味著它在你提問之前並不存在。

如今最重要的術語

除了基本概念之外，以下是最重要的 AI 術語（截至 2023 年中）。

大型語言模型（LLM）

大型語言模型是當今最具影響力和多功能的 AI 形式。它們在訓練時使用了組成網路的幾乎所有文字，包括網路和英文文學的大部分內容。這些文字的結果是一個具有巨大規模的基礎模型。LLM 能夠用自然語言進行對話並回答問題，模仿各種風格和型別的文字檔案，就像 ChatGPT、Claude 和 LLaMa 所展示的那樣。盡管這些模型令人印象深刻，但必須牢記它們仍然是模式識別引擎，當它們回答問題時，僅僅是試圖完成一個它所識別到的模式，無論該模式是否反映現實。LLM 在回答問題時經常會出現幻覺，這一點我們將在不久後提到。如果你想更多地理解 LLM 和 ChatGPT，我們有一篇專門關於這方面的文章！

基礎模型

從頭開始訓練一個大型模型需要耗費大量的資源和複雜的流程，所以你不希望不斷進行這樣的訓練。基礎模型是那些需要超級計算機執行的大型模型，但可以透過減少引數的數量來縮小模型的規模，通常是減少它所執行的點的數量。這些點就是模型需要處理的總數，這些天的模型可以有數百萬、數十億甚至數以兆計。但除去這些點之外，還有其他細微的區別，這些區別取決於進行訓練的方法。

微調

像 GPT-4 這樣的基礎模型是聰明的，但它的設計是通用的，即它吸收了從狄更斯到維特根斯坦到《龍與地下城》規則的一切，但如果你希望它能幫助你寫一封求職信，那些就對你沒太大用了。幸運的是，可以透過給模型提供一些額外的專門資料集進行微調，例如一些散落在周圍的數千份求職申請。這使模型對在該領域中如何幫助你有更好的理解，而不會拋棄它從其餘訓練資料中獲得的普遍知識。人們與 LLM 互動以改進其溝通能力的反饋資料稱為從人類反饋中強化學習（RLHF）,這是一種特殊的微調方式，你們應該會經常聽到這個術語。

擴散

透過對一個先進的擴散技術的研究論文，你可以看到甚至從非常嘈雜的資料中可以重現出一個影象。影象生成可以透過多種方式完成，但迄今為止最成功的方法是擴散，擴散是穩定擴散和 Midjourney 等熱門生成 AI 方法的核心技術。擴散模型是透過逐步新增數位噪音進行逐步退化的影象來進行訓練，直到原影象完全消失。透過觀察這一過程，擴散模型也學會了將純噪聲逐步新增細節，以形成任意定義的影象。現在我們已經開始跨越這個領域的邊界，但這個技術是可靠且相對可理解的，所以不用擔心它會很快消失。

幻覺

最初，這個問題是指在訓練過程中，某些特定影象在輸出中出現了不相關的結構，比如由於訓練集中狗的數量過多，某些建築物似乎是由狗構成的。現在當因為訓練集中的資料不足或存在衝突時，AI 被稱為“幻影生成”。這既有利又有弊：要求 AI 創作原創或衍生的藝術作品時，它的輸出就是幻影生成的結果；即使 LLM 被告知用 Yogi Berra 的風格寫一首愛情詩，它也會願意這樣做，盡管這樣的詩在它的資料集中不存在。但它當被要求提供事實上的答案時，幾乎從不知道哪個部分是真實的，哪個是幻影生成的。當前除了自己檢查，沒有一種簡單的方法可以分辨哪個是真實的，哪個是幻影生成的，因為模型本身實際上並不知道什麼是“真”或“假”，它只是盡力匹配模式。

AGI 或強人工智慧

強人工智慧（AGI）或強 AI 並不是一個確保的概念，但最簡單的解釋是，它是一種足夠強大的智慧體，不僅可以像人類一樣做事，還可以像人類一樣學習和改進自己。有人擔心這種學習、整合思想的迴圈會產生一個不可約束或控制的超智慧系統。一些人甚至提議推遲或約束研究，以防止這種可能性的出現。這是一個可怕的想法，電影如《駭客帝國》和《魔鬼終結者》探討了如果 AI 失控並試圖消滅或奴役人類可能會發生的情況。但這些故事並不是建立在現實之上的。我們在 ChatGPT 等機器中所看到的智慧外觀是一個令人印象深刻的表演，但它與我們所認為的“真正”的智慧所具有的抽象推理和動態多領域活動沒有太大相似之處。儘管很難預測事物的發展，但將 AGI 視為星際飛行一樣的東西可能是有幫助的：我們都理解這個概念並似乎再逐步向著它前進，但同時我們距離實現這樣的東西非常遙遠。由於需要巨大的資源和基本科學突破，沒有人會突然偶然地完成這一目標！AGI 是一個有趣的思考題，但如果無法解決這些問題，那麼對於今天的 AI 已經帶來現實和有意義的威脅，備受評論員關注，儘管其約束實際上在很大程度上。

領導者們

以下是 AI 領域的一些重要參與者：

OpenAI

如果 AI 有一個家喻戶曉的名字，那就是 OpenAI。OpenAI 最初就像它的名字所說，旨在進行研究並使結果更多地公開。它後來重組為一家更傳統的營利性公司，透過 API 和應用程式為使用者提供對其先進語言模型（如 ChatGPT）的存取。它由納帕·帕爾卡（Sam Altman）領導，他是一位科技富豪，但他也警告認為 AI 可能帶來的風險。OpenAI 在 LLMs 方面是公認的領導者，但也在其他領域進行研究。

Microsoft

頗為預料，Microsoft 在 AI 研究方面做了很多工作，但像其他公司一樣，它無法將自己的實驗轉化為重要產品。它最明智的舉動是早期投資 OpenAI，這讓它與該公司建立了長期獨家合作夥伴關係，該公司現在為其 Bing 對話代理提供動力。儘管其自身的貢獻規模較小且不太適用，但該公司在研究領域具有相當大的影響力。

Google

Google 以其思維超前的特點而聞名，但儘管其研究人員實際上發明了導致今天 AI 爆發的技術（Transformer），實際上錯過了 AI 領域。現在它正在努力開發自己的 LLMs 和其他代理，但在過去的十年中，該公司在提升過時的“虛擬助手”AI 概念方面花費了大部分時間和金錢。總裁桑達爾·皮查伊（Sundar Pichai）多次表示該公司正在為 AI 在搜尋和生產力方面奠定堅實基礎。

Anthropic

OpenAI 轉向封閉後，Dario 和 Daniela Amodei 兩兄妹離開 OpenAI 成立了 Anthropic，目的是成為一個兼顧開放和道德考慮的 AI 研究組織。擁有如此多現金的他們是 OpenAI 的嚴肅競爭對手，即使他們的模型像 Claude 一樣還沒有那麼受歡迎或知名。顯然，AI 市場足夠大，以至於為幾個主要提供商（如果它們有足夠的資本）留下了空間。

穩定

作為一個具有爭議性但不可避免的存在，穩定代表著「隨心所欲」的 AI 開源學派，它將其訓練的生成 AI 模型對於執行該模型的硬體來說是完全免費的。這與「資訊想要自由」的哲學非常一致，但也加速了一些道德上可疑的專案，比如生成色情影象以及在未經許可的情況下使用智慧財產權（有時同時進行）。領導這個領域的公司是 GitHub 自由軟體基金（FSF），他們還參與了穩定的開發。

埃隆·馬斯克

馬斯克一直對 AI 失控表示擔憂，他在 OpenAI 早期時有所貢獻，但 OpenAI 的方向和他的期望不同，這搞得他有些不高興。儘管馬斯克在這個話題上不是專家，但通常他的行為和評論確實引起了廣泛的回應（他是上述“AI 暫停”信件的簽署人之一），並且他正試圖建立一個自己的研究機構。

AI 的最新動態

以下是 AI 領域中最新的一些新聞和發展動態：

中國在新的美國禁令中可能進一步失去晶片供應。理解詳情
ChatGPT 使用 Bing，Bing 使用 ChatGPT。ChatGPT Plus 的訂閱者現在可以在 ChatGPT 應用程式上使用一項名為 Browsing 的新功能，該功能可以讓 ChatGPT 搜尋 Bing 以尋找有關提示或問題的答案。當 Browsing 功能被禁用時，ChatGPT 的知識截止於 2021 年。理解詳情
AI 無法贏得格萊美獎。Grammy 獎的新資格標準表明，如果音樂家的 AI 輔助作品要有資格參加格萊美獎的競爭，他們需要確保他們的人類貢獻是“有意義且不僅僅是符合最低要求”，而且“沒有人類創作者的作品在任何類別中都不符合資格”。
Google 旗下的研究實驗室 DeepMind 聲稱其下一個聊天機器人將能與 ChatGPT 媲美。稱為 Gemini 的聊天機器人正在使用 AlphaGo 的技術，AlphaGo 是 DeepMind 的 AI 系統，它是第一個在圍棋比賽中擊敗專業人類選手的 AI 系統。DeepMind 的執行長 Demis Hassabis 對《Wired》的 Will Knight 表示如果一切順利，Gemini 將有能力計劃或解決問題，並分析文字。
Inflection 推出了自己的基礎 AI 模型，以與 Google 和 OpenAI 競爭。這家獲得了大量資金的 AI 新創公司公開展示了驅動其 Pi 對話代理的大型語言模型，名為 Inflection-1，其規模和能力大致與 GPT-3.5 相當。根據他們發表的結果，Inflection-1 在各種測試中表現出色，例如中小學程度的考試任務（例如生物學 101）和“常識”基準（例如“如果傑克把球丟到屋頂上，吉爾把球扔回來，球在哪裡？”）。但在編碼方面，它主要落後於 GPT-3.5，而與之相比，GPT-4 更勝一籌。OpenAI 的最大模型在這一領域的質量取得了巨大的提升，這也就不足為奇了。
Salesforce 承諾將向 AI 新創公司投資 5 億美元。Salesforce 宣布將把其生成 AI 基金從 2.5 億美元增加到 5 億美元。該基金自今年 3 月推出以來，已經在一些研究生成 AI 技術的公司上投資了資金。儘管這並不是唯一一個主要投資於生成 AI 的基金，但 Salesforce 的區別在於優先考慮其所描述的“道德”AI 技術。
GPU 製造商 Nvidia 成為萬億美元公司。GPU 製造商 Nvidia 對遊戲玩家和加密貨幣挖礦者的銷售一直不錯，但 AI 行業對其硬體的需求讓其市值突破了象徵性的萬億美元大關，股價達到每股 413 美元。他們看不出放慢下來的跡象，正如他們最近在 Computex 展上所展示的那樣。
在 Computex 展上，Nvidia 加倍對 AI 的承諾。在臺北的 Computex 展上，Nvidia CEO Jensen Huang 推崇該公司的 Grace Hopper 超級晶片以加速計算（這是他們的術語），並展示了一個據稱能夠將任何人變成開發者的生成 AI。
OpenAI 的 Sam Altman 代表 AI 遊說世界。Altman 最近為美國政府提供了有關 AI 政策的建議，雖然有人認為這是讓狐狸來設定雞窩規則，但歐盟的各種制定規章機構也在尋求不同的意見，他一直在進行大範圍的演講既警告了過度的監管，又提醒了 AI 的危險。如果這些觀點在你看來相互矛盾...不用擔心，你並不是唯一一個這麼想的。
Anthropic 為其新一代 AI 模型籌集 4.5 億美元。當我們在早期透露了他們的籌款和計劃之後，他們現在正式增加了 4.5 億美元的資金，並努力開發 Claude 及其其他模型的後繼機型。很明顯，AI 市場足夠大，可以容納幾家主要供應商，只要他們有足夠的資本即可。
TikTok 正在測試名為 Tako 的自家機內 AI。TikTok 是一個影片社交媒體平臺，正在測試一個新的對話式 AI，你可以向它詢問任何你想知道的問題，包括你正在觀看的影片相關的問題。這個想法是，你不僅僅是搜尋更多的“哈士奇嗥叫”影片，你還可以問 Tako“為什麼哈士奇嗥叫這麼多？”它會給出有用的答案，並指引你觀看更多相關內容。
微軟將 ChatGPT 整合到 Windows 11 中。微軟在早期投資 OpenAI 後勢在必得。它已經將 GPT-4 整合到其必應搜尋平臺中，但現在透過作業系統上的右側欄，必應聊天體驗將可用，甚至可能屆時會無處不在。
Google 在其所做的一切中加入了一點 AI。Google 正在 AI 世界中追趕，儘管它正在為此投入相當多的資源，但其策略仍然有些模糊。證據是：它在 I/O 2023 活動上展示的實驗功能，這些功能可能永遠不會走向廣大觀眾。但他們確實在全力以赴重新進入這場比賽。

ArtificialIntelligence-人工智慧,深度探索,AI,全方位,總覽