Web 3

人工智慧之深度探索:AI 的全方位總覽

AI:你需要知道的一切關於人工智慧人工智慧(AI)正出現在現代生活的幾乎每個角落,從音樂和媒體到商業和生產力,甚至是戀愛交友領域。AI 的應用非常廣泛,以至於很難跟上。因此請繼續閱讀以下內容,理解最新的重大發展和您需要理解的術語和公司,以保持在這個快速發展的領域中保持時髦。首先讓我們確保我們對 AI .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

人工智慧之深度探索:AI 的全方位總覽

AI:你需要知道的一切關於人工智慧

人工智慧AI)正出現在現代生活的幾乎每個角落,從音樂和媒體到商業和生產力,甚至是戀愛交友領域。AI 的應用非常廣泛,以至於很難跟上。因此請繼續閱讀以下內容,理解最新的重大發展和您需要理解的術語和公司,以保持在這個快速發展的領域中保持時髦。首先讓我們確保我們對 AI 有一致的理解:什麼是 AI人工智慧,也稱為機器學習,是一種基於神經網路的軟體系統,這種技術其實在數十年前就已經開創,但最近幾年由於強大的新型計算資源開始蓬勃發展。AI 已經實現了有效的語音和影象識別以及生成合成影象和語音的能力。研究人員正在努力讓 AI 可以在網路上瀏覽、訂購門票、調整食譜等等。但如果你擔心 AI 會像《駭客帝國》中機器的崛起一樣,別擔心,我們稍後會談到這一點!我們的 AI 指南分為三個主要部分,每個部分都會定期更新,可以按任意線序閱讀:首先您需要理解的最基本的概念以及最近比較重要的概念。接下來,總覽 AI 領域的主要參與者及其重要性。最後是一份精心挑選的最新頭條新聞和發展動態,這些是您應該注意的。閱讀完本文,您將是當今最為理解 AI 的人之一。隨著進一步進入 AI 時代,我們還將不斷更新和擴充這份指南。

AI 101

AI 最讓人感興趣的一點是,儘管其核心概念可以追溯到 50 年以上前,但在最近,這些概念甚至對技術精通的人來說也是陌生的。所以,如果你感到迷茫,別擔心,每個人都一樣。首先我們要明確一點:盡管它被稱為“人工智慧”,這個術語有點誤導。當然「智慧」在這裡並沒有一個確切的定義,但這些系統所做的事情確實更接近計算器而不是大腦。這個計算機的輸入和輸出只是更靈活一些。你可以把人工智慧想象成人造椰子:它是模仿智慧。

神經網路

我們的大腦主要由相互存取的神經元組成,這些神經元組合在一起完成任務並儲存訊息。從 60 年代開始,人們就一直試圖在軟體中重新建立這個神奇的系統,但要實現這一目標,需要大量的處理能力,而這種能力直到 15-20 年前才廣泛普及,當時 GPU 讓數位化的神經網路蓬勃發展起來。從根本上說,神經網路只是由許多點和線組成:點是資料,線是這些值之間的統計關係。就像我們的大腦一樣,這樣的系統可以快速地接受輸入,將其透過網路傳遞,並產生輸出。這個系統被稱為模型。

模型

模型是接受輸入並返回輸出的實際程式碼集合。與統計模型或模擬複雜自然過程的建模系統的術語相似,這種術語也不是偶然的。在 AI 中,模型可以指代像 ChatGPT 這樣的完整系統,或者幾乎任何 AI 或機器學習結構,無論它是做什麼還是產生什麼。模型有不同的大小,這取決於它們所佔用的儲存空間和執行所需的計算資源。這些取決於模型的訓練方法。

訓練

要建立一個 AI 模型,系統的基礎神經網路需要接觸到一堆資訊,這種資訊稱為資料集或語料庫。透過這樣做,這些巨大的網路會建立該資料集的統計表示。對於這一訓練過程,需耗費大量的計算資源,這意味著它需要花費數週或數月(可以根據需要時間更長)在大量的高效能計算機上進行。原因是這些網路不僅是復雜的,而且資料集可能非常大:需要分析和表示數十億個單詞或影象。然而一旦模型訓練完成,當它被使用時它的體積可以更小,並且所需的計算資源也較少,這個過程稱為推論。

推論

當模型實際執行任務時,我們稱之為推論,這與傳統意義上的推論相當:透過對可用證據進行推理來陳述結論。當然這並不是「推理」,而是在處理所吸收的資料中存取點的統計,從而預測下一個點。例如,當你說「補完下列序列:紅、橘、黃……」時,模型會找到這些詞與它吸收的列表的開始相對應,即彩虹的顏色,並推斷出剩下的部分。推論的計算成本通常比訓練要低得多:想像一下透過查閱目錄而不是組織目錄。然而大型模型仍然需要在超級計算機和 GPU 上執行,但較小的模型可以在智慧手機或其他更簡單的裝置上執行。

生成 AI

人們都在討論生成 AI,這個廣泛的術語指的是一種可以生成原始輸出(如圖片或文字)的 AI 模型。一些 AI 能夠總結,一些能夠重新組織,一些能夠識別,等等。但是 AI 生成的內容是否正確,甚至是否反映現實,這並不重要!只要它在你提出要求之前不存在,像故事或畫作一樣。這是一種特別受歡迎的 AI 模型。但請記住,僅僅因為 AI 生成了一些東西,這並不意味著它是正確的,或者它反映了現實!這只意味著它在你提問之前並不存在。

如今最重要的術語

除了基本概念之外,以下是最重要的 AI 術語(截至 2023 年中)。

大型語言模型(LLM)

大型語言模型是當今最具影響力和多功能的 AI 形式。它們在訓練時使用了組成網路的幾乎所有文字,包括網路和英文文學的大部分內容。這些文字的結果是一個具有巨大規模的基礎模型。LLM 能夠用自然語言進行對話並回答問題,模仿各種風格和型別的文字檔案,就像 ChatGPT、Claude 和 LLaMa 所展示的那樣。盡管這些模型令人印象深刻,但必須牢記它們仍然是模式識別引擎,當它們回答問題時,僅僅是試圖完成一個它所識別到的模式,無論該模式是否反映現實。LLM 在回答問題時經常會出現幻覺,這一點我們將在不久後提到。如果你想更多地理解 LLM 和 ChatGPT,我們有一篇專門關於這方面的文章!

基礎模型

從頭開始訓練一個大型模型需要耗費大量的資源和複雜的流程,所以你不希望不斷進行這樣的訓練。基礎模型是那些需要超級計算機執行的大型模型,但可以透過減少引數的數量來縮小模型的規模,通常是減少它所執行的點的數量。這些點就是模型需要處理的總數,這些天的模型可以有數百萬、數十億甚至數以兆計。但除去這些點之外,還有其他細微的區別,這些區別取決於進行訓練的方法。

微調

像 GPT-4 這樣的基礎模型是聰明的,但它的設計是通用的,即它吸收了從狄更斯到維特根斯坦到《龍與地下城》規則的一切,但如果你希望它能幫助你寫一封求職信,那些就對你沒太大用了。幸運的是,可以透過給模型提供一些額外的專門資料集進行微調,例如一些散落在周圍的數千份求職申請。這使模型對在該領域中如何幫助你有更好的理解,而不會拋棄它從其餘訓練資料中獲得的普遍知識。人們與 LLM 互動以改進其溝通能力的反饋資料稱為從人類反饋中強化學習(RLHF),這是一種特殊的微調方式,你們應該會經常聽到這個術語。

擴散

透過對一個先進的擴散技術的研究論文,你可以看到甚至從非常嘈雜的資料中可以重現出一個影象。影象生成可以透過多種方式完成,但迄今為止最成功的方法是擴散,擴散是穩定擴散和 Midjourney 等熱門生成 AI 方法的核心技術。擴散模型是透過逐步新增數位噪音進行逐步退化的影象來進行訓練,直到原影象完全消失。透過觀察這一過程,擴散模型也學會了將純噪聲逐步新增細節,以形成任意定義的影象。現在我們已經開始跨越這個領域的邊界,但這個技術是可靠且相對可理解的,所以不用擔心它會很快消失。

幻覺

最初,這個問題是指在訓練過程中,某些特定影象在輸出中出現了不相關的結構,比如由於訓練集中狗的數量過多,某些建築物似乎是由狗構成的。現在當因為訓練集中的資料不足或存在衝突時,AI 被稱為“幻影生成”。這既有利又有弊:要求 AI 創作原創或衍生的藝術作品時,它的輸出就是幻影生成的結果;即使 LLM 被告知用 Yogi Berra 的風格寫一首愛情詩,它也會願意這樣做,盡管這樣的詩在它的資料集中不存在。但它當被要求提供事實上的答案時,幾乎從不知道哪個部分是真實的,哪個是幻影生成的。當前除了自己檢查,沒有一種簡單的方法可以分辨哪個是真實的,哪個是幻影生成的,因為模型本身實際上並不知道什麼是“真”或“假”,它只是盡力匹配模式。

AGI 或強人工智慧

人工智慧(AGI)或強 AI 並不是一個確保的概念,但最簡單的解釋是,它是一種足夠強大的智慧體,不僅可以像人類一樣做事,還可以像人類一樣學習和改進自己。有人擔心這種學習、整合思想的迴圈會產生一個不可約束或控制的超智慧系統。一些人甚至提議推遲或約束研究,以防止這種可能性的出現。這是一個可怕的想法,電影如《駭客帝國》和《魔鬼終結者》探討了如果 AI 失控並試圖消滅或奴役人類可能會發生的情況。但這些故事並不是建立在現實之上的。我們在 ChatGPT 等機器中所看到的智慧外觀是一個令人印象深刻的表演,但它與我們所認為的“真正”的智慧所具有的抽象推理和動態多領域活動沒有太大相似之處。儘管很難預測事物的發展,但將 AGI 視為星際飛行一樣的東西可能是有幫助的:我們都理解這個概念並似乎再逐步向著它前進,但同時我們距離實現這樣的東西非常遙遠。由於需要巨大的資源和基本科學突破,沒有人會突然偶然地完成這一目標!AGI 是一個有趣的思考題,但如果無法解決這些問題,那麼對於今天的 AI 已經帶來現實和有意義的威脅,備受評論員關注,儘管其約束實際上在很大程度上。

領導者們

以下是 AI 領域的一些重要參與者:

OpenAI

如果 AI 有一個家喻戶曉的名字,那就是 OpenAI。OpenAI 最初就像它的名字所說,旨在進行研究並使結果更多地公開。它後來重組為一家更傳統的營利性公司,透過 API 和應用程式為使用者提供對其先進語言模型(如 ChatGPT)的存取。它由納帕·帕爾卡(Sam Altman)領導,他是一位科技富豪,但他也警告認為 AI 可能帶來的風險。OpenAI 在 LLMs 方面是公認的領導者,但也在其他領域進行研究。

Microsoft

頗為預料,Microsoft 在 AI 研究方面做了很多工作,但像其他公司一樣,它無法將自己的實驗轉化為重要產品。它最明智的舉動是早期投資 OpenAI,這讓它與該公司建立了長期獨家合作夥伴關係,該公司現在為其 Bing 對話代理提供動力。儘管其自身的貢獻規模較小且不太適用,但該公司在研究領域具有相當大的影響力。

Google

Google 以其思維超前的特點而聞名,但儘管其研究人員實際上發明了導致今天 AI 爆發的技術(Transformer),實際上錯過了 AI 領域。現在它正在努力開發自己的 LLMs 和其他代理,但在過去的十年中,該公司在提升過時的“虛擬助手”AI 概念方面花費了大部分時間和金錢。總裁桑達爾·皮查伊(Sundar Pichai)多次表示該公司正在為 AI 在搜尋和生產力方面奠定堅實基礎。

Anthropic

OpenAI 轉向封閉後,Dario 和 Daniela Amodei 兩兄妹離開 OpenAI 成立了 Anthropic,目的是成為一個兼顧開放和道德考慮的 AI 研究組織。擁有如此多現金的他們是 OpenAI 的嚴肅競爭對手,即使他們的模型像 Claude 一樣還沒有那麼受歡迎或知名。顯然,AI 市場足夠大,以至於為幾個主要提供商(如果它們有足夠的資本)留下了空間。

穩定

作為一個具有爭議性但不可避免的存在,穩定代表著「隨心所欲」的 AI 開源學派,它將其訓練的生成 AI 模型對於執行該模型的硬體來說是完全免費的。這與「資訊想要自由」的哲學非常一致,但也加速了一些道德上可疑的專案,比如生成色情影象以及在未經許可的情況下使用智慧財產權(有時同時進行)。領導這個領域的公司是 GitHub 自由軟體基金(FSF),他們還參與了穩定的開發。

埃隆·馬斯克

馬斯克一直對 AI 失控表示擔憂,他在 OpenAI 早期時有所貢獻,但 OpenAI 的方向和他的期望不同,這搞得他有些不高興。儘管馬斯克在這個話題上不是專家,但通常他的行為和評論確實引起了廣泛的回應(他是上述“AI 暫停”信件的簽署人之一),並且他正試圖建立一個自己的研究機構。

AI 的最新動態

以下是 AI 領域中最新的一些新聞和發展動態:

  • 中國在新的美國禁令中可能進一步失去晶片供應。理解詳情
  • ChatGPT 使用 Bing,Bing 使用 ChatGPT。ChatGPT Plus 的訂閱者現在可以在 ChatGPT 應用程式上使用一項名為 Browsing 的新功能,該功能可以讓 ChatGPT 搜尋 Bing 以尋找有關提示或問題的答案。當 Browsing 功能被禁用時,ChatGPT 的知識截止於 2021 年。理解詳情
  • AI 無法贏得格萊美獎。Grammy 獎的新資格標準表明,如果音樂家的 AI 輔助作品要有資格參加格萊美獎的競爭,他們需要確保他們的人類貢獻是“有意義且不僅僅是符合最低要求”,而且“沒有人類創作者的作品在任何類別中都不符合資格”。
  • Google 旗下的研究實驗室 DeepMind 聲稱其下一個聊天機器人將能與 ChatGPT 媲美。稱為 Gemini 的聊天機器人正在使用 AlphaGo 的技術,AlphaGo 是 DeepMind 的 AI 系統,它是第一個在圍棋比賽中擊敗專業人類選手的 AI 系統。DeepMind 的執行長 Demis Hassabis 對《Wired》的 Will Knight 表示如果一切順利,Gemini 將有能力計劃或解決問題,並分析文字。
  • Inflection 推出了自己的基礎 AI 模型,以與 Google 和 OpenAI 競爭。這家獲得了大量資金的 AI 新創公司公開展示了驅動其 Pi 對話代理的大型語言模型,名為 Inflection-1,其規模和能力大致與 GPT-3.5 相當。根據他們發表的結果,Inflection-1 在各種測試中表現出色,例如中小學程度的考試任務(例如生物學 101)和“常識”基準(例如“如果傑克把球丟到屋頂上,吉爾把球扔回來,球在哪裡?”)。但在編碼方面,它主要落後於 GPT-3.5,而與之相比,GPT-4 更勝一籌。OpenAI 的最大模型在這一領域的質量取得了巨大的提升,這也就不足為奇了。
  • Salesforce 承諾將向 AI 新創公司投資 5 億美元。Salesforce 宣布將把其生成 AI 基金從 2.5 億美元增加到 5 億美元。該基金自今年 3 月推出以來,已經在一些研究生成 AI 技術的公司上投資了資金。儘管這並不是唯一一個主要投資於生成 AI 的基金,但 Salesforce 的區別在於優先考慮其所描述的“道德”AI 技術。
  • GPU 製造商 Nvidia 成為萬億美元公司。GPU 製造商 Nvidia 對遊戲玩家和加密貨幣挖礦者的銷售一直不錯,但 AI 行業對其硬體的需求讓其市值突破了象徵性的萬億美元大關,股價達到每股 413 美元。他們看不出放慢下來的跡象,正如他們最近在 Computex 展上所展示的那樣。
  • 在 Computex 展上,Nvidia 加倍對 AI 的承諾。在臺北的 Computex 展上,Nvidia CEO Jensen Huang 推崇該公司的 Grace Hopper 超級晶片以加速計算(這是他們的術語),並展示了一個據稱能夠將任何人變成開發者的生成 AI
  • OpenAI 的 Sam Altman 代表 AI 遊說世界。Altman 最近為美國政府提供了有關 AI 政策的建議,雖然有人認為這是讓狐狸來設定雞窩規則,但歐盟的各種制定規章機構也在尋求不同的意見,他一直在進行大範圍的演講既警告了過度的監管,又提醒了 AI 的危險。如果這些觀點在你看來相互矛盾...不用擔心,你並不是唯一一個這麼想的。
  • Anthropic 為其新一代 AI 模型籌集 4.5 億美元。當我們在早期透露了他們的籌款和計劃之後,他們現在正式增加了 4.5 億美元的資金,並努力開發 Claude 及其其他模型的後繼機型。很明顯,AI 市場足夠大,可以容納幾家主要供應商,只要他們有足夠的資本即可。
  • TikTok 正在測試名為 Tako 的自家機內 AI。TikTok 是一個影片社交媒體平臺,正在測試一個新的對話式 AI,你可以向它詢問任何你想知道的問題,包括你正在觀看的影片相關的問題。這個想法是,你不僅僅是搜尋更多的“哈士奇嗥叫”影片,你還可以問 Tako“為什麼哈士奇嗥叫這麼多?”它會給出有用的答案,並指引你觀看更多相關內容。
  • 微軟將 ChatGPT 整合到 Windows 11 中。微軟在早期投資 OpenAI 後勢在必得。它已經將 GPT-4 整合到其必應搜尋平臺中,但現在透過作業系統上的右側欄,必應聊天體驗將可用,甚至可能屆時會無處不在。
  • Google 在其所做的一切中加入了一點 AI。Google 正在 AI 世界中追趕,儘管它正在為此投入相當多的資源,但其策略仍然有些模糊。證據是:它在 I/O 2023 活動上展示的實驗功能,這些功能可能永遠不會走向廣大觀眾。但他們確實在全力以赴重新進入這場比賽。
ArtificialIntelligence-人工智慧,深度探索,AI,全方位,總覽
江塵

江塵

Reporter

大家好!我是江塵,一名熱愛科技的發展和創新,我一直都保持著濃厚的興趣和追求。在這個瞬息萬變的數位時代,科技已經深入到我們生活的方方面面,影響著我們的工作、學習和娛樂方式。因此,我希望透過我的部落格,與大家分享最新的科技資訊、趨勢和創新應用。