新 AI 影象生成器 Ideogram 可能解決了可靠文字生成的問題
市場上的眾多選擇
本週初,一家新的生成 AI 影象新創公司 Ideogram 宣布上線,該公司由前 Google Brain 研究員創立,獲得 a16z 和 Index Ventures 等領頭投資機構共同領投的 1650 萬美元種子融資。我們現在已經有足夠多的影象生成器可供選擇,例如 Midjourney、OpenAI 的 Dall-E 2 和 Stability AI 的 Stable Diffusion。那麼,為什麼還需要另一個影象生成器呢?
然而 Ideogram 有一個重大的賣點,它可能終於解決了迄今大多數其他熱門 AI 影象生成器都面臨的問題:在影象中可靠地生成文字,例如標牌上的字型和公司標識。Ideogram 在其網路應用程式(ideogram.ai)上提供許多預設的影象生成風格,包括一個標有“字型”的風格,它以不同的顏色、字型、大小和樣式呈現字型。其他預設風格包括 3D 渲染、電影、繪畫、時尚、產品、插畫、概念藝術、浮世繪等等。您可以同時選擇多個風格並應用所有風格。
雖然還在測試階段,Ideogram 已經可供測試註冊,它的 Discord 伺服器和網路應用程式上已經充斥著人們使用其工具生成的字型和影象的示例,這些示例與當前的頂尖技術相比令人印象深刻(雖然並不總是完全準確)。
字型生成的可靠性和不足
然而 Ideogram 在其他一些可用的競爭對手影象生成器上缺少一些功能,例如縮小/重畫(zoom out/outpainting)。在我們的測試中,結果也不太一致。它甚至在呈現自己的名稱“Ideogram”方面遇到困難,對於更常見的單詞則表現更好。該公司在發布和測試版發布的時候,悄悄地透過 X(之前是 Twitter)上的一篇帖子突出了這一特點,這篇帖子包含了該公司的使命宣告:“幫助人們透過生成 AI 變得更有創造力。”
Ideogram 的其他投資者還包括 AIX Ventures、Golden Ventures、Two Small Fish Ventures 以及行業專家 Ryan Dahl、Anjney Midha、Raquel Urtasun、Jeff Dean、Sarah Guo、Pieter Abbeel、Mahyar Salek、Soleio、Tom Preston-Werner 和 Andrej Karpathy。這家位於多倫多的新創公司已經得到了同樣是 AI 界名人的 David Ha(Sakana AI 創始人)和 Margaret Mitchell 的關注,他們都曾在 Google 工作。
吸引設計師和持續創新
雖然當前來說對於 Ideogram 來說還處於早期階段,但透過提供可靠的字型生成器來區別自身是一個明智的舉動,這可能有助於吸引圖形設計師或其他本來需要聘請圖形設計師才能建立帶有引人注目文字的影象的人們。同時其他 AI 影象生成器也在不斷增加新功能。就在本週,Midjourney 推出了其新的“變動區域”功能,可以新增、刪除和減少生成影象的部分。
作為一個整體,生成 AI 影象的領域仍然是多條發展道路並存的領域。Ideogram 的問世無疑為這一領域帶來了更多可能性。無論如何,這一技術的應用必須充滿創造力,而不是陷入僅僅減少創造力的風險之中。我們對 Ideogram 當前的進展感到好奇,期待看到他們未來的發展。
延伸閱讀
- Google 就 10 家印度公司逃避 Play 商店費用發出警告,並威脅將移除其應用程式
- 解決 AI 影象生成器中的種族主義問題
- Tinder 推出新警告功能,提醒使用者可能不當行為
- Sundar Pichai 警告 Google 員工,更多裁員即將到來
- 美國參議員警告政府透過推送通知對蘋果和 Google 使用者進行間諜活動
- 視覺電力推出以設計師工作流程為重點的 AI 影象生成器
- Waze 新安全功能到來!警告您避開歷史車禍地點
- 反對派領袖聲稱,蘋果已警告他們:國家支援的攻擊可能瞄準 iPhone
- 比特幣交易員發出警告,稱「難以置信」但一個因素可能讓比特幣崩盤至 15,000 美元
- Discord 改為發出警告而非永久封鎖使用者