<bdo id="vljxk"><rt id="vljxk"><noframes id="vljxk"><noframes id="vljxk"><noframes id="vljxk"><rt id="vljxk"></rt><rt id="vljxk"></rt><noframes id="vljxk"><rt id="vljxk"><delect id="vljxk"></delect></rt><noframes id="vljxk"><rt id="vljxk"></rt><noframes id="vljxk"><noframes id="vljxk"><rt id="vljxk"></rt>

  1. 創業頭條
  2. 前沿領域
  3. AI智能
  4. 正文

OpenAI Sora畫的餅,AI行業集體給它圓了......嗎?

 2024-08-26 10:58  來源:A5專欄  我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

AI文生視頻領域,幾乎只剩Sora還是個期貨了。

最近兩個月,國內外的AI-generated Video應用持續爆發,中國的快手、字節、智譜AI、生數科技、愛詩科技,海外的谷歌、Luma、Runway,格局如八仙過海。

雖然不同平臺水平差異依舊存在,但整體可用性已經大大提高,而且風格化特征也比較全面。唯一的缺憾是,在融入工作流方面,AI視頻工具們的水平還是差了一點。Sora畫的餅,要交給這些后來者去圓了。

放棄期貨,文生視頻應用爆發

業界民間都把視頻視為AI應用落地的重點領域。英偉達CEO黃仁勛在7月30日的全球頂級計算機圖形學會議SIGGRAPH 2024上邀請了Meta的CEO扎克伯格進行對話,雙方都認可視頻能力會是AI大模型的進化方向。

出身于英偉達研究小組的Luma AI首席科學家宋佳銘,在與a16z合伙人Anjney Midha對談時說,視頻關聯著3D世界,從學習角度看,視頻數據使模型更好地理解和推理3D世界。所以,實時高質量的視頻生成,最終會推動具身AI的發展。

視頻就是這樣一座“橋”,而現在大量的AI公司正在試圖搶先通過它,尤其是OpenAI讓Sora變成了外界用不到的期貨,給了其他平臺進一步發展的空間。

(整理自公開信息)

(圖源:天眼查)

超長戰線背后是這些公司的試探。一部分是關于商業模式,另一部分是關于技術應用前景。

可靈、即夢、Vidu等都推出了會員訂閱模式,在C端進行應用普及化嘗試。愛詩科技創始人王長虎此前在接受財新采訪時表示:“愛詩目前的策略以2C(面向消費者)為主,廣泛收集國內外用戶反饋,以更好地基于用戶體驗迭代底層模型。”至于更遠的應用,現在來談則為時尚早,主要是因為C端的收費模式無法承擔成本。

Luma AI采取了To C的產品形態,不過它原本專注于3D領域,進入視頻生成領域是為了探索3D生成與重建的更多可能性,以視頻驅動3D發展。這在產業領域有更多的應用前景,例如批量制造電影需要的三維素材等。

最重要的是,Luma AI的期望不是售賣技術或者素材,而是建立類似TikTok這樣的平臺,也就是一個基于3D的生態系統。王長虎也在和極客公園創始人張鵬對話時表示,愛詩科技也瞄準的是“AIGC時代的平臺性機會”,但平臺的形態暫時無法預測,因為AI產業不會以復制現在已有的平臺的方式成長。

不僅如此,目前讓AI-generated Video進入完整工作流的應用已經在成形。開源視頻編輯工具Clapper最近熱度上升,它的特色就是集合各類AI技術,用prompt的方式調動AI Agent生成和迭代故事,直接跳過了手工編輯文件的過程。

(圖源:機器之心)

由此可見,AI-generated Video的進化速度遠比我們想象得要快。目前,行業的重點無疑在于生成速度和生成效率兩個方面。但是,大模型并不提供完全確定的商業模式方向,這更多取決于團隊的選擇。而在這個過程中,除了商業化之外,AI公司還要思考怎么避免陷入合規困境、成本困境。所以,把文生視頻變得成熟并不容易,現在僅僅相當于ChatGPT剛剛問世的階段。

AI-generated Video的“硬傷”和突破口

a16z之前就發表過觀點,巨頭在從科研成果到商業產品的轉化中需要更關注法律安全、版權等問題,所以往往效率會慢。我們不去考慮Sora是不是因為這個原因始終不露面,單看行業都要面對的相關問題,邏輯其實是一樣的。

1.商業化的“落差”,目前的AI-generated Video很難滿足甲方們的需求

彭博社曾報道,OpenAI一直試圖向好萊塢推薦Sora,但并不成功。用Sora制作的第一則商業化廣告是6月公開的玩具反斗城廣告。然而,這則視頻不但用了一些舊素材,公開新聞稿也沒有說完全由AI生成。

導演Nik Kleverov還在一條已經刪除的動態里表示,制作這些鏡頭的創意機構Native Foreign提供了大約十幾個工作人員參與工作,Sora支持了80%到85%的流程。這對需要高效低成本的AI-generated Video來說算不上什么好消息。

2.訓練成本、高質量數據集難以滿足

視頻的本質可以視為一系列圖像,圖像有很多公開的數據集,但是視頻沒有。OpenAI遇到過違規使用YouTube視頻進行訓練的指控,英偉達最近被媒體曝光從Netflix和YouTube收集了大量數據,用來訓練自己的Cosmos項目,用于支持其AI產品往現實世界發展。它每天可以下載相當于80年的視頻內容。

這體現了兩個關鍵點:一是黃仁勛和Luma的觀點類似,AI視頻的發展確實對AI進入3D世界意義重大,英偉達也是這樣做的:文本——圖像——視頻——三維模型——現實世界。二是視頻數據集是個大問題,除了版權問題,這些視頻數據還缺乏標簽,斯坦福大學教授Stefano Ermon說,現階段缺乏篩選和過濾好視頻的方法,而且篩選后還要考慮它們的標簽和描述。

3.AI資產泡沫的問題,AI必須為用戶解決重要復雜的問題才能有價值,但現在它的發展成效,遠遠不能和互聯網等技術當年初生時的情況相比

Benchmark合伙人Michael Eisenberg在最近的一期訪談中,引用了其好友Atreides Management創始人Gavin Baker關于大模型發展的觀點:“基礎模型是歷史上貶值最快的資產。”

他所舉的例子來自Seeking Alpha的創始人,類似金融領域這種每分鐘都會進行業務和數據更新的高頻領域,訓練出來的模型只能完成寫報告之類的常規工作,但無法應對數據的高速刷新,滿足金融預測未來的需求。

而且,其他技術的發展是確定性的,互聯網發展早期雖然泡沫巨大,但已經體現了應用路徑;而AI渾身都是不確定性。互聯網發展的邊際成本幾乎約等于0(或者說其中不少都分擔給了運營商和用戶),然而AI成長的邊際成本涉及大量固定資產,現在都由創業者自己承擔,而且越投入邊際改善效應越弱。大量的早期投入,很可能是一個陷阱。

技術革命之后必須伴隨產業革命,產業革命則需要現象級產品的引領。AI更需要的是一個成功的場景。目前看來,AI-generated Video還沒有拿到這類成果的起色。

Perplexity的創始人Arin對此提供了另外一個觀點,那就是基礎模型的價值本質映射著背后團隊的價值,即Sora之于OpenAI,文心大模型之于百度。不是Sora能革了視頻的命,只是外界相信由OpenAI領導的Sora具備這樣的可能性而已。當Sora沒能提供符合我們預期的突破時,誰能在這個領域擔起大任呢?

由此出發,關鍵或許在于誰能先把AI-generated Video真正融入到某一個商業系統的工作流中去,就像Clapper對視頻制作的探索一樣。而這就是一個更大的問題了,因為它涉及到和其他領域的融合——氣象、城市、影視、汽車、制造業。也許Sora會在今年的某天拿出一個更具體的成果,也許是其他的創業公司顛覆了我們對AI視頻的認知。

來源:松果財經

申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!

相關標簽
ai智能

相關文章

  • 科技泡沫論中,中國AI初創企業如何煉成“吸金大法”?

    作為這一輪全球AI科技周期的風向標企業,自2023年初截至今年6月31日,英偉達股價翻了近7.5倍。然而,自6月創下了歷史高點后,截至當地時間8月12日收盤,其股價回撤幅度約20%。同時,這一時期,英偉達多位高管也在持續拋售公司股份。據統計,在6月13日至8月9日期間,CEO黃仁勛已累計套現超5.5

    標簽:
    ai智能
  • AI時代的“另類博弈”,調薪只是大廠變革的開始

    大廠員工們的喜大普奔時刻,騰訊宣布“漲薪”了。具體內容:一是將服務獎,即「十三薪」,均攤到每月月薪中,折算后每月漲薪8%;二是將“易居”計劃的年度房補,納入月薪中。兩項調整給新老員工的月薪帶來了不小的變化。今年,裁員潮的陰影一直籠罩全球,但包括騰訊在內的國內互聯網大廠卻開始了一波“反向操作”,這背后

    標簽:
    ai智能
  • 超預期的業績增長未能“沸騰”股價,谷歌的AI戰事升級?

    近日,谷歌母公司Alphabet在美股盤后公布了第二季度財報,其中,總營收847億美元,同比增長14%,高于分析師普遍預期的842億美元

    標簽:
    ai智能
  • 現階段的AI落地,只是一場大模型廠商的“賣家秀”?

    商業化愿景下,AI應用元年已經到來。2024年以來,諸多已布局AI大模型技術的科技公司都開始加速推出AI應用產品。比如,今年7月16日,騰訊旗下大模型應用“騰訊元寶”推出“3D角色夢工廠”玩法,成為首個擁有打印級3D生成能力的通用大模型App。無獨有偶,百度也推出了一款名為“文小言”的AI數字人社交

    標簽:
    ai智能
  • 掉隊的百度,突然用AI應用重新殺回?

    文|智能相對論作者|葉遠風松弛感,是這屆奧運會開幕式給很多人留下的直觀感受。而讓用戶觀看奧運的過程也獲得松弛感,同樣是各路APP在奧運季努力的方向。從各種大型賽事報道來看,一般來說,APP們往往致力于整合信息、形成專題頁面,方便用戶一站式瀏覽,從容選擇、查看。但“智能相對論”觀察到,一些嘗試推動用戶

    標簽:
    ai智能
  • 庫克已納投名狀:蘋果AI沒得選,只能選百度

    蘋果16弄了兩個版本,一個是專門給中國人用的,準備用百度的AI,還要交錢。第二個是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節初步接洽,考慮將二者的AI模型

  • AI加速時代的“進度條”,我們撥動了百分之幾?

    “技術日新月異,人類生活方式正在快速轉變,這一切給人類歷史帶來了一系列不可思議的奇點。我們曾經熟悉的一切,都開始變得陌生?!庇嬎銠C之父約翰·馮·諾依曼曾這樣說到。

    標簽:
    ai智能
  • AI視頻賽道,要變天了

    “毀滅你,與你何干?”,這是在劉慈欣的科幻小說《三體》里用來形容人類與三體人之間的戰爭的一句話。

    標簽:
    ai智能
  • “創造市場”與“算法進化”,中美AI競速的岔路口

    “人工智能的商業模式,是要創造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當前的全球AI市場,占據主導地位的中美雙方,卻也走出了兩條截然不同的技術路徑,前者執著于前沿技術的探索,后者則發力應用優化和商業化落地。南轅北轍的兩個方向,或許已經無法直接進行排位先后、優

    標簽:
    ai智能
  • 智能體進化發展了一年,現在的RPA Agent迭代到什么程度了?

    智能體進化發展了一年,現在的RPAAgent迭代到什么程度了?從實在智能最新發布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款AIAgent真的實現了流程全自動化AIAgent構建到執行全自動化,持續進化RPAAgent再次降低智能體應用門檻實在智能重磅發布實

  • 崔大寶:大模型降溫背后的難點、卡點、節點

    崔大寶|節點財經創始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關聯的概念炒不動了,英偉達股價動輒暴跌重挫,引發“泡沫戳破”的擔憂;消費市場,BATH們的推新活動少了,產品更新迭代的速度慢了,民眾的關注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節跳動宣布“以厘計費”,打響國內大模型

    標簽:
    大模型
  • 這一屆“出道”的數字人,已經拿捧上了“鐵飯碗”

    文|智能相對論作者|陳泊丞好消息!你心心念念的事業單位發錄取公告了!壞消息!他們沒錄你,錄了個數字人。圖片來源網絡隨著數字人技術的突破,越來越多的傳統企業和機構開始用上了“數字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數字人給捧上了。數字人捧上了“鐵飯碗”簡單翻看一下全國各地事業單位的“錄

    標簽:
    數字人
  • 來到IPO關口,地平線離“三分天下”還有多遠?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業引發關注。據悉,近日地平線已通過中國證監會IPO備案,擬發行不超過11.5億股境外上市普通股并在香港聯合交易所上市,預計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供

  • 機器人大會引領產業動向,卓翼飛思繪制無人系統教科研新藍圖

    8月21日,萬眾矚目的2024世界機器人大會暨博覽會在北京亦創國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機器人盛會,反映了當下機器人領域的繁榮生態。據官方統計數據,今年現場逛展觀眾高達25萬人次,比去年增加25%。機器人行業有多火?看看2024世界機器人大會火爆程度便可知