Google DeepMind AI 語言模型為 YouTube Shorts 制作描述
Google 的最新 AI 團隊 DeepMind 共享了有關其視覺語言模型正在如何為 YouTube Shorts 制作描述的細節。Flamingo 可以透過分析影片的初幀來生成描述,以解釋正在發生的事情。這些文字描述將作為後設資料儲存,以“更好地分類影片並將搜尋結果與查詢相匹配”。
解決實際問題
對於 Shorts,創作者有時沒有新增後設資料,因為與長型影片相比,建立短影片的過程更加流暢。Flamingo 模型可以理解這些影片並為搜尋系統提供描述文字,這對使用者搜尋來查詢影片非常有用。由於 Shorts 大多在流中觀看,人們只是翻找下一個影片,而不是積極地瀏覽,因此不存在新增後設資料的動機。由於這是後設資料,因此生成的描述不會顯示給使用者,而是存在於背後,這可以幫助更好地分類影片。
警惕 AI 的偏見
Flamingo 為生成描述應用智慧及 AI 技術,就會有偏見的風險。AI 的失誤、偏頗、選擇依據等,令人很擔心。許多監督學習需要大量的資料才能正確執行,特定情況下,正確的資料和應有的資訊也無法確認。AI 技術要發揮其作用,需要進一步加固其開發和控制。
八年前,Google Photos 將兩個黑人標記為大猩猩,這一問題仍然存在。對於 Flamingo,即便出現嚴重的失誤,Google 也將處於批評風險之下,因此 Google 應嚴格監控 Flamingo 的表現,以防止偏見和錯誤出現。
為更多影片應用 Flamingo
到當前為止,Flamingo 已經能夠將自動生成的描述應用於新的 Shorts 上傳,並且已經完成了對“包括最受歡迎的影片在內的大量現有影片”的分析。相信隨著 AI 技術的不斷升級,Flamingo 也將被推廣到更多的 YouTube 影片上。
只有在 AI 技術開發和控制的完善下,其才能真正發揮作用。未來,Google 應嚴格監控 Flamingo 的表現,以確保不會出現錯誤和偏見,使 Flamingo 能夠正確地為更多 YouTube 影片生成描述。聯絡 [email protected]。
延伸閱讀
- 蘋果、Google 和 Meta 面臨歐盟 DMA 的首次正式調查
- Google 在法國被罰 2.7 億美元,當局發現新聞出版商的資料被用於 Gemini
- 蘋果考慮與 Google 合作,在 iPhone 上推出由天秤座動力的功能
- 印度啟動反壟斷調查:Google 應用商店計費方式受關注
- Google I/O 5 月 14 日、15 日如約而至
- Google 證實全球約束「雙子」選舉查詢
- AWS 宣布與 Google 一樣,解除向其他雲端供應商的資料傳輸約束
- AI 影片生成競爭升溫:Deepmind 前員工推出 Haiper
- Google 公布隱私政策變更、選擇畫面和資料 API 的 DMA 合規措施
- Google 就 10 家印度公司逃避 Play 商店費用發出警告,並威脅將移除其應用程式