Sora (人工智能模型)

OpenAI开发的文本到视频生成模型

Sora是一個能以文字描述生成影片的人工智能模型,由美國人工智能研究機構OpenAI開發。[1]

Sora
Sora生成的女子在東京街道上行走的影片
開發者OpenAI
首次發佈2024年2月15日,​9個月前​(2024-02-15
平台OpenAI
網站openai.com/index/sora/ 編輯維基數據

Sora這一名稱源於日文「空」(そら sora),即天空之意,以示其無限的創造潛力。[1]其背後的技術是在OpenAI的文字到圖像生成模型DALL-E基礎上開發而成的。[2]模型的訓練數據既包含公開可用的影片,也包括了專為訓練目的而獲授權的著作權影片,但OpenAI沒有公開訓練數據的具體數量與確切來源。[1]

OpenAI於2024年2月15日向公眾展示了由Sora生成的多個高清影片,稱該模型能夠生成長達一分鐘的影片。[2]同時,OpenAI也承認了該技術的一些缺點,包括在模擬複雜物理現象方面的困難。[3]麻省理工科技評論》的報道稱演示影片令人印象深刻,但指出它們可能是經精心挑選的,並不一定能代表Sora生成影片的普遍水準。[2]

由於擔心Sora可能被濫用,OpenAI表示目前沒有計劃向公眾發佈該模型,而是給予小部分研究人員有限的訪問權限,以理解模型的潛在危害。[1][2]Sora生成的影片帶有C2PA元數據標籤,以表示它們是由人工智能模型生成的。[1]OpenAI還與一小群創意專業人士分享了Sora,以取得對其實用性的反饋。[1]

參見


參考文獻

  1. ^ 1.0 1.1 1.2 1.3 1.4 1.5 Cade Metz. OpenAI Unveils A.I. That Instantly Generates Eye-Popping Videos. The New York Times. 2024-02-15 [2024-02-16]. (原始內容存檔於2024-02-15). 
  2. ^ 2.0 2.1 2.2 2.3 Will Douglas Heaven. OpenAI teases an amazing new generative video model called Sora. MIT Technology Review. 2024-02-15 [2024-02-16]. (原始內容存檔於2024-02-15). 
  3. ^ Antonio Pequeño IV. OpenAI Reveals ‘Sora’: AI Video Model Capable Of Realistic Text-To-Video Prompts. Forbes. 2024-02-15 [2024-02-16]. (原始內容存檔於2024-02-15). 

外部連結