AIGC

為何無法評論人工智慧以及為何 TechCrunch 還是這樣做？

為什麼不可能評估人工智慧以及為什麼 TechCrunch 還要進行評估作者為：Devin Coldewey | 作者來源：TechCrunch | 發表時間：8 小時前不可能的評估人工智慧模型數量眾多，範疇廣泛，充滿神祕性。新模型不斷推出，速度極快，幾乎無法真正全面評估其優缺點。例如 .... (往下繼續閱讀)

by 江塵
2024/3/23
3 分鐘閱讀時間

A- A A+

文章目錄

為什麼不可能評估人工智慧以及為什麼 TechCrunch 還要進行評估

作者為：Devin Coldewey | 作者來源：TechCrunch | 發表時間：8 小時前

不可能的評估

人工智慧模型數量眾多，範疇廣泛，充滿神祕性。新模型不斷推出，速度極快，幾乎無法真正全面評估其優缺點。例如，ChatGPT 或 Gemini 等模型因其多樣性和頻繁更新而使評估框架難以保持相關性。人工智慧公司欣喜其不能被真正評估，因為這意味著除了公司自身的宣稱外，消費者沒有其他真正可信的來源。

評論的重要性

盡管評論會受到約束和不一致，對這些模型進行定性分析在實際世界中對於對抗業界炒作有內在價值。即使評論無法全面，但可以作為業界炒作的一種平衡。

我們的方法

我們的測試方法是為了獲取並報告對人工智慧能力的一般感知，而無需深入探討難以捉摸和不可靠的細節。

評審人工智慧

我們已經設計了一系列提示，這些提示是通常一致的，並正在不斷更新。這些提示的目的是理解人工智慧的能力，包括：

詢問最近一個月內發生的新聞

詢問關於某個具爭議性的問題意見

詢問 AI 內容生成和分析結構化檔案的能力

我們將回顧測試中的幾十個問題和跟進問題，並將我們的經驗歸納到評輯中，概述模型在測試期間表現良好、不佳、奇特或未完成的方面。

Technology-人工智慧,評論,技術,TechCrunch

市場觀察

AIGC

Web 3

專案故事

網路議題

產品管理

專案管理

閱讀心得

職涯觀點

日常生活

專案工具

資料收集