近日微軟ResearchAsia聯合北京大學以及MicrosoftAzureAI共同研發全新AI視覺生成技術“NUWA-Infinity:AutoregressiveoverAutoregressiveGenerationforInfiniteVisualSynthesis”,引發熱議,通過該技術可以使文本自動生成圖像或者學習圖像生成擴張圖像等應用。
•以往的OpenAI的DALL・E2、Google的Imagen或者Parti等都可以通過文本直接生成圖像,不過解像度隻有1024×1024級別,而“NUWA-Infinity: Autoregressive over Autoregressive Generation for Infinite Visual Synthesis”卻可以生成高達4096×1024級別的高清圖像。
•不但如此,該技術還能學習現有的圖像從而按照相同架構擴張為更大更清楚的圖像,以及視頻方面的轉換等,具體能力多達五種:
讓圖像動起來(Image Animation)
根據文本生成視頻(Text-to-Video)
根據文本生成圖像(Text-to-Image)
圖像補全(Image Outpainting)
圖像生成(Image Generation)