市場觀察

OpenAI 因精準度低取消 AI 撰寫文字檢測器

開放人工智慧（OpenAI）因「精準度低」而停用 AI 撰寫文字檢測器背景近日開放人工智慧（OpenAI）宣布停用其 AI 撰寫文字檢測器，原因是該工具的「精準度低」，廣受批評。許多人使用這個工具來檢測低努力的作弊行為，然而其精準度卻受到廣泛質疑。雖然有理論認為 AI 生成的文字可能具有可以可靠地檢 .... (往下繼續閱讀)

by 江塵
2023/7/26
7 分鐘閱讀時間

A- A A+

文章目錄

開放人工智慧（OpenAI）因「精準度低」而停用 AI 撰寫文字檢測器

背景

近日開放人工智慧（OpenAI）宣布停用其 AI 撰寫文字檢測器，原因是該工具的「精準度低」，廣受批評。許多人使用這個工具來檢測低努力的作弊行為，然而其精準度卻受到廣泛質疑。雖然有理論認為 AI 生成的文字可能具有可以可靠地檢測出的某些特徵或模式，但實際上並未得到證實。儘管某些生成的文字可能有明顯的線索，但語言模型的差異以及其迅速發展使得這些線索幾乎不可能可靠地依賴。

檢測工具的可靠性

TechCrunch 對多個 AI 撰寫檢測工具進行了測試，結果顯示這些工具在最佳情況下只能偶爾命中，最糟的情況下完全無用。在給予多個檢測器七段生成的文字片段的測試中，GPTZero 正確識別了五個，而 OpenAI 的分類器只正確識別了一個。而且這還是在當時的語言模型還不是最尖端的情況下進行的測試。然而一些人對檢測的宣告卻盲目接受，或者更準確地說是過度接受，因為 OpenAI 在分類器工具中提供了一系列相當顯著的約束條件，人們不禁好奇他們為什麼要發布這個工具。

檢測需求的重要性

有些人擔心他們的學生、求職者或自由工作者會提交由 AI 生成的文字，於是他們將其放入分類器進行測試，雖然本來這些結果不應被信任，但有時卻沒有考慮到這點。隨著語言模型的不斷改進和普及，開放人工智慧公司的某位相關人員可能認為是時候停用這個靠不住的工具了。"我們正在努力吸納反饋，當前正在研究更有效的文字產生來源技術"，這是七月二十日在分類器公告中的附加註解中提到的（Decrypt 似乎是第一個注意到這個變化的）。多數聲稱能夠檢測由 AI 生成的文字的網站都驚人地失敗了。

分類器停用的時間點和原因

關於停用分類器的時間點和原因，我已經向 OpenAI 詢問，並在收到回覆後將進行更新。然而有趣的是，正當 OpenAI 與其他幾家公司一同參與白宮主導的「自願承諾」以進行道德透明 AI 的發展時，這一事件發生了。這些公司作出的承諾之一是發展強大的數位浮水印和/或檢測方法。無論如何，儘管每家公司在過去六個月左右都宣稱要實現這一目標，但我們至今未見到任何不可被輕易規避的浮水印或檢測方法。毫無疑問，第一家實現這一目標的公司將獲得豐厚的回報（如果這樣的工具真的可靠，那麼在無數情況下，它將非常寶貴），因此將此納入任何 AI 協議可能是多餘的。

意見與建議

這一事件提醒我們 AI 技術在現實中的局限性。儘管 AI 生成的文字在迅速發展，但仍然存在無法可靠檢測的情況。這悟出了一個重要的哲學問題：人類是否能夠徹底理解並捕捉 AI 生成的文字所特有的特徵、風格或模式？如果無法確保，那麼我們如何辨識由 AI 生成的文字以及如何確保相應的責任和道德要求？

這個問題需要深入的研究和討論。與此同時個人在使用 AI 撰寫檢測工具時應該保持謹慎。雖然這些工具可能有一定的參考價值，但結果不能 100％可信賴。對於學生、求職者或自由工作者提交的文字，人們應該考慮其他方式來取證內容的原創性和真實性。同時我們也需要在 AI 技術的發展中積極探索更有效的方法來檢測、識別和追蹤 AI 生成的文字，以確保訊息的可靠性和道德責任。

Accuracy,NaturalLanguageProcessing,Textdetection-開放人工智慧（OpenAI）、精準度、AI、撰寫、文字檢測器

市場觀察

AIGC

Web 3

專案故事

網路議題

產品管理

專案管理

閱讀心得

職涯觀點

日常生活

專案工具

資料收集