Sora让视频生成更富想象力 能帮助苹果Vision Pro普及吗?
上周,美国科技股上演了一场“资本盛宴”。受Sora大模型发布的提振,英伟达引领AI公司股价飙升,该公司市值历史上首次触及2万亿美元大关,并带动Meta、微软等公司股价大涨。市场人士认为,AI有望进一步推动英伟达涨势,在加入“2万亿美元”俱乐部后,英伟达赶超苹果市值将不再遥不可及。
在这一轮由AI大模型触发的科技浪潮中,苹果公司却未能分得一杯羹。自上个月市值被微软超越后,苹果股价一路走低。该公司推出的重磅混合现实可穿戴产品Vision Pro的发布也未能提振苹果股价表现。自Vision Pro正式开卖近一个月以来,苹果股价累计跌幅超过6%,目前市值2.8万亿美元,比微软落后近2000亿美元。
Vision Pro发布之初,市场给予该设备较大的预期。苹果CEO库克将这款设备的发布宣告为“空间计算时代的到来”。他称:“Vision Pro是有史以来最先进的消费电子设备,其革命性且神奇的用户界面将重新定义我们联系、创造和探索的方式。”
在Sora大模型发布后,很快有用户将Sora生成的视频转化成苹果Vision Pro可看的3D空间视频。有科技博主表示:“Sora Vision Pro意味着你可以描述一个世界,并且在这个世界中存在。”
从这一角度来看,Sora的问世给Vision Pro带来了更多的内容。但专家向第一财经记者强调,Sora创建的视频仍是普通视频,而不是基于空间计算的空间视频,因此还不能直接为Vision Pro来创建视频。
“理论上所有的视频都可以转化成空间视频,Sora并不懂空间计算,它生成的视频也是普通的视频,所以与Vision Pro没有直接的关联。”某3D生成式AI初创公司技术负责人对第一财经记者表示。
他表示,自己也使用苹果的Vision Pro做了一些3D视频,但这些视频仅供展示,对于Vision Pro未来的应用场景如何开发,还没有很成熟的想法。
他告诉第一财经记者,3D视频需要包括空间信息,比如每个像素点在空间中的位置信息,也被称为“深度”(depth),普通视频通过生成depth,可以转化为Vision Pro可看的具有3D效果的空间视频。
上述技术负责人认为,短期内Sora的视频生成还不会涉及3D生成,因为3D和文本、图片和视频生成有本质的区别,其难点并不在于获取高度一致性的连续多角度图像,而在于工业标准。“否则照片建模早就统治模型生产工作了。”他表示。
在工业领域,苹果公司已经在寻求与3D软件企业合作。达索系统全球品牌执行副总裁Philippe Laufer向第一财经记者证实,目前正在与苹果公司合作,为Vision Pro开发全新的设计体验。“达索系统的商业客户也是苹果公司非常需要的。”Laufer表示。
利亚德集团副总裁、虚拟动点CEO刘耀东对第一财经记者表示,针对Sora大模型的一个争议焦点就是它是否理解了物理世界,这就包括对空间感的理解,从目前发布的信息来看,Sora还不具备这个能力。“讲白了,Sora目前有点像能够生成会动的拼图世界,但还是二维的。”他表示。
北京智源人工智能研究院前理事长张宏江也对第一财经记者表示,Sora大模型与空间计算是两回事,并没有涉及空间计算的概念。
浙江大学人工智能研究所所长吴飞从技术的角度介绍称,Sora先将文本单词和视觉子块映射到同构低维隐性空间,在这一低维隐性空间中引入扩散模型,对视觉信息反复迭代,千锤百炼地挖掘文本单词、空间子块和时空子块之间的关联关系。
“这种方式好比先通过‘车同轨、书同文’,将文本、视觉等异构信息投影到同构空间,然后再通过‘先破坏(添加噪音)’、‘再重建(去除噪音)’的迭代手段,来洞悉视频中各种不同单元在时间和空间中的关联关系,从而甄别和学习纹理、运动、光照、遮挡、交互等复杂视觉物理规律。”吴飞在一篇科普撰文中写道。
但也有业内人士认为,Sora大模型与空间计算两者的结合,未来可能开启对物理世界更深入的模拟和理解的方法,加速实现所谓的“元宇宙”。
研究机构Canalys分析师刘健森对第一财经记者表示:“可以说生成式AI在类似于元宇宙的虚拟世界建设方面会有所帮助,因此Sora会在一定程度上助推Vision Pro的生态应用,但Vision Pro最先的使用者肯定以行业开发者为主,向个人消费者普及还需要一个过程。”
Canalys此前预测,Vision Pro上市后一年内可能都会面临缺货,而五年后的产量可能会增加至1260万台,约占iPhone当前装机量的1%;届时Vision Pro用户数量有望将达到2000万,占MacBook装机量的15%。
尽管近期有网上传言称Vision Pro首批用户已有退货的,但刘健森对第一财经,该机构对Vision Pro的需求维持原来的预期。
阳过5个月了,还要打疫苗吗?“貌似没阳过”的呢?专家解答
专家认为,非高风险人群如果经历过一次自然感染,可以在6个月后再去接种下一剂次疫苗近日,国务院联防联控机制印发《应对近期新冠病毒感染疫情疫苗接种工作方案》(下称《方案》),对现阶段疫苗接种的目标人群、时间间隔、疫苗选择等作出进一步明确。0000养老行业全线“用人荒”,谁来服务3亿老年人?
1963年是新中国历史上出生人口数最多的年份,为2975万人。中国人民大学老年学研究所所长杜鹏此前表示,受1963年出生高峰影响,2023年将是我国老年人口净增长最多的一年。当生于1963年的近3000万人迈入60岁,我国老年人口预计在今年底接近3亿。面对如此庞大老年群体的需求,养老行业却面临从机构到居家,从管理者到护理人员全线的“用人荒”。0000华晨宝马、宝马中国召回部分国产及进口宝马电动汽车
华晨宝马汽车有限公司、宝马(中国)汽车贸易有限公司向国家市场监督管理总局备案了召回计划,自2023年6月2日起召回以下车辆。据国家市场监督管理总局网站2日消息,日前,华晨宝马汽车有限公司、宝马(中国)汽车贸易有限公司根据《缺陷汽车产品召回管理条例》和《缺陷汽车产品召回管理条例实施办法》的要求,向国家市场监督管理总局备案了召回计划,自2023年6月2日起召回以下车辆。锤子财富2023-06-02 15:16:040001今年要下大力气改善居民收入预期!发改委最新发声
要下大力气改善居民收入预期、提高消费能力、增强消费意愿。随着各项稳增长政策持续显效,国内经济持续修复,2023年四季度国内生产总值(GDP)同比增长5.2%,全年增长5.2%。2023年5.2%的经济增速含金量如何,2024年中国经济运行将会如何表现?新的一年将出台哪些举措更好促进民营经济发展壮大?如何确保各领域政策同向发力、形成合力?锤子财富2024-01-18 19:31:030000哈佛大学教授杰森·福尔曼:为什么美国通胀在下降?
如果通胀率真的无痛下降到2%,我们应该庆祝,并对标准经济模型进行更严肃的反省。但如果做不到,美联储将需要准备好加大力度才能将通胀降至可接受区间。在短短一年内,美国的通货膨胀率从9%左右的峰值下降到3%。标准经济模型表明,只有在失业率大幅增加的情况下,才有可能发生如此快速的通货紧缩。但失业率在整个时期内一直保持稳定,处于50年来的最低点。经济学家需要抛弃我们的模型,另起炉灶吗?0001