Google DeepMind AI 語言模型為 YouTube Shorts 制作描述
Google 的最新 AI 團隊 DeepMind 共享了有關其視覺語言模型正在如何為 YouTube Shorts 制作描述的細節。Flamingo 可以透過分析影片的初幀來生成描述,以解釋正在發生的事情。這些文字描述將作為後設資料儲存,以“更好地分類影片並將搜尋結果與查詢相匹配”。
解決實際問題
對於 Shorts,創作者有時沒有新增後設資料,因為與長型影片相比,建立短影片的過程更加流暢。Flamingo 模型可以理解這些影片並為搜尋系統提供描述文字,這對使用者搜尋來查詢影片非常有用。由於 Shorts 大多在流中觀看,人們只是翻找下一個影片,而不是積極地瀏覽,因此不存在新增後設資料的動機。由於這是後設資料,因此生成的描述不會顯示給使用者,而是存在於背後,這可以幫助更好地分類影片。
警惕 AI 的偏見
Flamingo 為生成描述應用智慧及 AI 技術,就會有偏見的風險。AI 的失誤、偏頗、選擇依據等,令人很擔心。許多監督學習需要大量的資料才能正確執行,特定情況下,正確的資料和應有的資訊也無法確認。AI 技術要發揮其作用,需要進一步加固其開發和控制。
八年前,Google Photos 將兩個黑人標記為大猩猩,這一問題仍然存在。對於 Flamingo,即便出現嚴重的失誤,Google 也將處於批評風險之下,因此 Google 應嚴格監控 Flamingo 的表現,以防止偏見和錯誤出現。
為更多影片應用 Flamingo
到當前為止,Flamingo 已經能夠將自動生成的描述應用於新的 Shorts 上傳,並且已經完成了對“包括最受歡迎的影片在內的大量現有影片”的分析。相信隨著 AI 技術的不斷升級,Flamingo 也將被推廣到更多的 YouTube 影片上。
只有在 AI 技術開發和控制的完善下,其才能真正發揮作用。未來,Google 應嚴格監控 Flamingo 的表現,以確保不會出現錯誤和偏見,使 Flamingo 能夠正確地為更多 YouTube 影片生成描述。聯絡 [email protected]。
延伸閱讀
- Google 支援的 Glance 在美國試點推出 Android 鎖定屏平臺
- Google 解僱 28 名員工,因為他們爭議性的 Project Nimbus 合同與以色列引發的靜坐抗議
- 印度加快步伐抑制 PhonePe 和 Google 在手機支付領域的壟斷
- Google 雲端大會:Google 全力開發生成式人工智慧
- Google 首次宣布 Axion,其自家定制 Arm 架構資料中心處理器
- Google 計劃透過兩款新的 10 美元 Workspace 附加元件來實現 AI 的盈利化
- Google 將生成式人工智慧技術注入其雲安全工具
- Google 的 Gemini Pro 1.5 進入 Vertex AI 的公開預覽
- Google 的新科技 Gemini 進入資料庫領域
- Google 釋出開源工具,支援 AI 模型開發