精准猎取科技资讯,天堂视频在线观看,高效阅读科技新闻_黄色av网站在线免费观看_科技猎

OpenAI 正式發布 Sora,一文看懂它的文生視頻功能到底強在哪?

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

?

文|黎詩韻

編輯|靖宇

?

正如外界猜測的那樣,在為期 12 天直播的第三天,OpenAI 正式發布了文生視頻產品 Sora。

北京時間 12 月 10 日凌晨兩點,Sam Altman 和幾位 OpenAI 內部員工通過直播,展示了 Sora 的功能和實際用例。繼今年 2 月釋出視頻樣片后,Sora 引發了全球人工智能界熱潮,此后國內外人工智能公司紛紛推出文生視頻產品。而作為這一賽道的開創者,今天 Sora 終于揭開了神秘面紗。

整體來說,Sora 展示的一系列產品功能,表明其在視頻生成的質量、功能的獨創性、技術的復雜度等方面,遠遠超出了目前的文生視頻產品。

在文、圖生視頻的基礎功能之上,它加入了故事板(相當于通過分鏡創作自己的故事)、用文本調整原視頻、不同場景視頻的融合等功能(相當于給視頻直接加特效),整個產品功能設計似乎都在讓視頻更接近創作者的自我表達、幫助他們完成一個理想的鏡頭故事。

當地時間 12 月 9 日晚些時候,美國、以及大多數其他國家的用戶,可以訪問官網體驗 Sora。它被包含在 ChatGPT Plus、ChatGPT Pro 的會員訂閱中,無需額外付費。其中,Plus 能生成最多 50 個最高視頻、視頻分辨率最高達 720p、時長為 5 秒,而 Pro 則能生成最多 500 個最高視頻、分辨率高達 1080p、時長為 20 秒、還能去水印。

Sam Altman 介紹做 Sora 有三大原因:

一是從工具性角度,OpenAI 喜歡為創意人員制作工具,這對公司的文化很重要;

二是從用戶交互角度,人工智能系統不能只通過文本交互,也應該理解并生成視頻,幫助人類使用人工智能。這類似于國內大模型公司談到的,「模型每擴展一次模態,用戶滲透率就會上升。」

三則是從技術角度,這對 OpenAI 的 AGI 路線圖至關重要,人工智能應該學到更多關于世界的規律,這正是所謂理解物理規律的「世界模型」。

既要用技術改變世界,也要用產品促進人類創造,這就是 Sora 在做的事情。

?

生成視頻之外,還能分鏡、加特效、無限創作

?

Sora 最基礎的,首先是文生視頻、圖生視頻功能。

打開主界面,用戶可以查看和管理所有的視頻生成內容,并且切換網格視圖、列表視圖,以及創建文件夾和收藏夾,查看書簽等。研究人員稱這個主界面設計,是為了更好地幫助用戶創作故事。

在主頁面的中間底部,是 Sora 的文生視頻、圖生視頻功能。

比如,Sam Altman 先給到文字輸入,「長毛猛犸象在沙漠中行走,廣角鏡頭拍攝」。接著,需要選擇視頻的畫面比、分辨率、時長(5-20 秒)、以及最終生成的視頻數量(最多可生成四段以供挑選)等,才能獲得生成的視頻。

最終,可以看到生成的視頻效果非常真實、有質感,且基本遵照了輸入的指令。對于 Sora 視頻生成效果的出色表現,或許人們是不意外的。

?

OpenAI 正式發布 Sora,一文看懂它的文生視頻功能到底強在哪?

輸入「長毛猛犸象在沙漠中行走,廣角鏡頭拍攝」的文字后,Sora 生成了四段視頻 | 圖片來源:OpenAI

?

但此次,Sora 還發布了一系列獨有的、進階的的產品功能。在極客公園看來,這些功能基本圍繞視頻的更準確表達,也就是通過分鏡、加特效等等方式,讓人們能通過視頻創作出一個自己想要的故事。

首先是故事板(storyboard),它被研究人員稱為是一種「全新的創意工具」。

從產品設計上看,它相當于按時間軸的方式,把一段故事(視頻)切成了多個不同的故事卡(視頻幀)。用戶只需要設計和調整每張故事卡(視頻幀),Sora 會自動把它們補成一段流暢的故事(視頻)—— 這很像電影里的分鏡、動畫的手稿,當導演畫好分鏡、一個片子就拍出來了,一個漫畫師寫好手稿、一個動畫就設計出來了。

比如研究人員設想的第一個分鏡是,「美麗的白鶴站在小溪中,擁有一條黃色的尾巴。」第二個分鏡是,「鶴將頭探入水中,并捉出一條魚」。那他做的工作就是,分別創建這兩張故事卡(視頻幀),并在兩者之間設大概五秒鐘的間隔。這個間隔對 Sora 很重要,給了它把兩組動作連起來的發揮空間。

最終,他得到了一個完整的視頻鏡頭,「美麗的白鶴站在小溪中,它擁有一條黃色的尾巴。接著鶴將頭探入水中,并捉出一條魚。」

?

OpenAI 正式發布 Sora,一文看懂它的文生視頻功能到底強在哪?

OpenAI 正式發布 Sora,一文看懂它的文生視頻功能到底強在哪?

通過兩張故事卡(視頻幀),Sora 生成了一個完整的故事(視頻) | 圖片來源:OpenAI

?

更為奇妙的是,在這個故事板上,創作要素不只是故事卡,也可以是直接的圖片、視頻。也就是說,可以將任意的圖片、視頻拉到故事板上,結合故事卡,對它進行創作。

以視頻為例,研究人員將上述白鶴的視頻切下來導入故事板,進行了剪切,這就給視頻的前方和后方留出了繼續創作的間隙,也就是說可以有新的開頭和結尾。

這帶來的想象是,故事板可以無限的創作下去。也就是說 Sora 生成的 20 秒視頻,可以被不斷地創造、剪切、創造……直至完全達到心目中理想的鏡頭。 這個過程就像一個剪輯師、導演,通過對分鏡設計和鏡頭素材的不斷生成剪輯,慢慢剪出自己心中的片子。

和真實世界中不同,Sora 提供的素材是無限的。而和其他的文生視頻產品不同,Sora 的視頻是可以修改加工的。這使得它生成的視頻一定會更符合用戶心中的想象、創意。

這似乎正是 Sora 此次產品的核心思路:盡最大可能地,讓生成的視頻符合用戶心中想要的創意。

這樣可以更好理解 Sora 的其他功能,比如可以通過文字直接修改視頻、可以無縫融合兩段不同的視頻、可以給視頻改變畫風等,這相當于是直接給視頻加「特效」了。而一般的文生視頻產品,可能需要不斷地調整 prompt(提示詞)、不斷重新生成視頻。

?

?

通過調整文字,用戶可以直接調整視頻 | 圖片來源:OpenAI

?

Sora 能將兩個兩段視頻合并為一段無縫剪輯 | 圖片來源:OpenAI

?

總的來說,Sora 除了在生成視頻上不出意料的出色表現之外,它還帶來了更獨有的視頻創作產品功能,相當于給視頻加分鏡、剪輯、特效。這意味著,每個人都有機會創作出自己真正想要的表達,離當一個導演也更近了。

「如果你帶著期望進入 Sora,認為你只需要點擊一個按鈕就可以生成一部電影,那么我認為你的期望是錯誤的。」OpenAI 研究人員說道。

他表示,Sora 是一種工具,允許人們同時在多個地方、嘗試多個想法,嘗試以前完全不可能的事情,「實際上我們認為這是創作者的超級特殊延伸。」

?

服務大眾還不單獨收費,還是靠底層模型的能力

作為文生視頻賽道的開創者,Sora 的推出時間算是最晚的。對此,OpenAI 研究團隊表示,為了對 Sora 進行廣泛的部署,需要找到讓模型更快、更便宜的辦法。為此,研究團隊做了大量的工作。

在直播中,OpenAI 宣布推出 Sora turbo,這是原始 Sora 模型的新高端加速版本。它具有今年早些時候 OpenAI 在「世界模擬技術」報告中談到的所有功能,此外還增加了從文本生成視頻、動畫圖像和混合視頻等功能。這是此次 Sora 產品功能背后的技術基礎。

看起來相比文字,視頻的推理成本更高,但此次 OpenAI 并沒有單獨針對 Sora 收費。20 美元/月的 ChatGPT Plus 會員、以及 200 美元/月的 ChatGPT Pro 會員,都可以使用 Sora。

前者的權益包括最多 50 個最高視頻、分辨率達 720p,時長為 5 秒,后者的權益包括最多 500 個最高視頻、無限普通視頻,分辨率高達 1080p、持續時間為 20 秒、并且下載無水印。

Sora 對 OpenAI 的意義不止于此。團隊發現,視頻模型在大規模訓練時會展現出許多有趣的新能力,使得 Sora 能夠模擬現實世界中人、動物和環境的某些方面。「我們的結果表明,擴展視頻生成模型是構建物理世界通用模擬器的一條有希望的道路。」

或許正是因此,讓 Sora 盡快被大眾用起來、用數據更好地訓練世界模型,對于 OpenAI 最終的 AGI 夢想如此重要。

在迭代技術的路上,也順帶推動了人類的創造。

「這個版本的 Sora 會犯錯誤,它并不完美,但它已經到了我們認為它將對增強人類創造力非常有用的地步。我們迫不及待地想看看世界將用它來做什么。」締造它的 OpenAI 如此說道。

?

本文被轉載1次

首發媒體 極客公園 | 轉發媒體

隨意打賞

提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 深圳市简易检测技术有限公司| 动力配电箱-不锈钢配电箱-高压开关柜-重庆宇轩机电设备有限公司 聚天冬氨酸,亚氨基二琥珀酸四钠,PASP,IDS - 远联化工 | 谷歌关键词优化-外贸网站优化-Google SEO小语种推广-思亿欧外贸快车 | 深圳善跑体育产业集团有限公司_塑胶跑道_人造草坪_运动木地板 | 华溶溶出仪-Memmert稳定箱-上海协烁仪器科技有限公司 | 西点培训学校_法式西点培训班_西点师培训_西点蛋糕培训-广州烘趣西点烘焙培训学院 | 都江堰招聘网-都江堰人才网 都江堰人事人才网 都江堰人才招聘网 邢台人才网_邢台招聘网_邢台123招聘【智达人才网】 | 中医治疗皮肤病_潍坊银康医院「山东」重症皮肤病救治平台 | 螺旋压榨机-刮泥机-潜水搅拌机-电动泥斗-潜水推流器-南京格林兰环保设备有限公司 | 陕西高职单招-陕西高职分类考试网 | 北京翻译公司_同传翻译_字幕翻译_合同翻译_英语陪同翻译_影视翻译_翻译盖章-译铭信息 | 水厂污泥地磅|污泥处理地磅厂家|地磅无人值守称重系统升级改造|地磅自动称重系统维修-河南成辉电子科技有限公司 | 球磨机,节能球磨机价格,水泥球磨机厂家,粉煤灰球磨机-吉宏机械制造有限公司 | 花纹铝板,合金铝卷板,阴极铝板-济南恒诚铝业有限公司 | 无压烧结银_有压烧结银_导电银胶_导电油墨_导电胶-善仁(浙江)新材料 | 天津货架厂_穿梭车货架_重型仓储货架_阁楼货架定制-天津钢力仓储货架生产厂家_天津钢力智能仓储装备 | 对照品_中药对照品_标准品_对照药材_「格利普」高纯中药标准品厂家-成都格利普生物科技有限公司 澳门精准正版免费大全,2025新澳门全年免费,新澳天天开奖免费资料大全最新,新澳2025今晚开奖资料,新澳马今天最快最新图库 | 山东太阳能路灯厂家-庭院灯生产厂家-济南晟启灯饰有限公司 | 衡阳耐适防护科技有限公司——威仕盾焊接防护用品官网/焊工手套/焊接防护服/皮革防护手套 | 安全光栅|射频导纳物位开关|音叉料位计|雷达液位计|两级跑偏开关|双向拉绳开关-山东卓信机械有限公司 | 广东泵阀展|阀门展-广东国际泵管阀展览会 | 常州企业采购平台_常州MRO采购公司_常州米孚机电设备有限公司 | 天助网 - 中小企业全网推广平台_生态整合营销知名服务商_天助网采购优选 | 根系分析仪,大米外观品质检测仪,考种仪,藻类鉴定计数仪,叶面积仪,菌落计数仪,抑菌圈测量仪,抗生素效价测定仪,植物表型仪,冠层分析仪-杭州万深检测仪器网 | 贵州科比特-防雷公司厂家提供贵州防雷工程,防雷检测,防雷接地,防雷设备价格,防雷产品报价服务-贵州防雷检测公司 | 密集柜_档案密集柜_智能密集架_密集柜厂家_密集架价格-智英伟业 密集架-密集柜厂家-智能档案密集架-自动选层柜订做-河北风顺金属制品有限公司 | 膜结构车棚|上海膜结构车棚|上海车棚厂家|上海膜结构公司 | 临海涌泉蜜桔官网|涌泉蜜桔微商批发代理|涌泉蜜桔供应链|涌泉蜜桔一件代发 | 密度电子天平-内校-外校电子天平-沈阳龙腾电子有限公司 | 专业深孔加工_东莞深孔钻加工_东莞深孔钻_东莞深孔加工_模具深孔钻加工厂-东莞市超耀实业有限公司 | 拉力机-拉力试验机-万能试验机-电子拉力机-拉伸试验机-剥离强度试验机-苏州皖仪实验仪器有限公司 | 圈酒招商网【jiushuitv.com】_酒水招商_代理_加盟平台 | 噪声治理公司-噪音治理专业隔音降噪公司| 广东机电安装工程_中央空调工程_东莞装饰装修-广东粤标建设有限公司 | 胃口福饺子加盟官网_新鲜现包饺子云吞加盟 - 【胃口福唯一官网】 | 立式矫直机_卧式矫直机-无锡金矫机械制造有限公司 | 手持气象站_便携式气象站_农业气象站_负氧离子监测站-山东万象环境 | 花纹铝板,合金铝卷板,阴极铝板-济南恒诚铝业有限公司 | 成都亚克力制品,PVC板,双色板雕刻加工,亚克力门牌,亚克力标牌,水晶字雕刻制作-零贰捌广告 | 走心机厂家,数控走心机-台州博城智能科技有限公司 | 老房子翻新装修,旧房墙面翻新,房屋防水补漏,厨房卫生间改造,室内装潢装修公司 - 一修房屋快修官网 |